論文の概要: Semantic Relation Preserving Knowledge Distillation for Image-to-Image
Translation
- arxiv url: http://arxiv.org/abs/2104.15082v1
- Date: Fri, 30 Apr 2021 16:04:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 13:36:18.641360
- Title: Semantic Relation Preserving Knowledge Distillation for Image-to-Image
Translation
- Title(参考訳): 画像間翻訳のための知識蒸留を保存する意味関係
- Authors: Zeqi Li, Ruowei Jiang and Parham Aarabi
- Abstract要約: generative adversarial networks (gans) は画像データの高次元分布のモデル化において有意な可能性を示している。
これらのタスクの複雑さのため、最先端のモデルはしばしば膨大な量のパラメータを含む。
本稿では,知識蒸留と意味的関係保存行列の蒸留を併用してこの問題に対処する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 8.443742714362521
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative adversarial networks (GANs) have shown significant potential in
modeling high dimensional distributions of image data, especially on
image-to-image translation tasks. However, due to the complexity of these
tasks, state-of-the-art models often contain a tremendous amount of parameters,
which results in large model size and long inference time. In this work, we
propose a novel method to address this problem by applying knowledge
distillation together with distillation of a semantic relation preserving
matrix. This matrix, derived from the teacher's feature encoding, helps the
student model learn better semantic relations. In contrast to existing
compression methods designed for classification tasks, our proposed method
adapts well to the image-to-image translation task on GANs. Experiments
conducted on 5 different datasets and 3 different pairs of teacher and student
models provide strong evidence that our methods achieve impressive results both
qualitatively and quantitatively.
- Abstract(参考訳): GAN(Generative Adversarial Network)は画像データの高次元分布、特に画像から画像への変換タスクをモデル化する上で大きな可能性を示している。
しかし、これらのタスクの複雑さのため、最先端のモデルには膨大なパラメータが含まれており、大きなモデルサイズと長い推論時間をもたらす。
本研究では,知識蒸留と意味的関係保存マトリックスの蒸留を併用して,この問題に対処する新しい手法を提案する。
このマトリックスは教師の特徴エンコーディングから派生したもので、学生モデルがよりセマンティックな関係を学習するのに役立つ。
分類タスク用に設計された既存の圧縮手法とは対照的に,提案手法は画像から画像への変換タスクによく適応する。
5つの異なるデータセットと3つの異なる教師と生徒モデルで行った実験は、我々の手法が質的および定量的に印象的な結果をもたらすという強い証拠を与える。
関連論文リスト
- The Journey, Not the Destination: How Data Guides Diffusion Models [75.19694584942623]
大規模なデータセットでトレーニングされた拡散モデルは、顕著な品質と多様性のフォトリアリスティックなイメージを合成することができる。
i)拡散モデルの文脈でデータ属性の形式的概念を提供し、(ii)そのような属性を反実的に検証することを可能にする枠組みを提案する。
論文 参考訳(メタデータ) (2023-12-11T08:39:43Z) - SCONE-GAN: Semantic Contrastive learning-based Generative Adversarial
Network for an end-to-end image translation [18.93434486338439]
SCONE-GANはリアルで多様な風景画像を生成する学習に有効であることが示されている。
より現実的で多様な画像生成のために、スタイル参照画像を導入します。
画像から画像への変換と屋外画像のスタイリングのための提案アルゴリズムを検証した。
論文 参考訳(メタデータ) (2023-11-07T10:29:16Z) - Improving Diffusion-based Image Translation using Asymmetric Gradient
Guidance [51.188396199083336]
非対称勾配法の適用により拡散サンプリングの逆過程を導出する手法を提案する。
我々のモデルの適応性は、画像融合モデルと潜時拡散モデルの両方で実装できる。
実験により,本手法は画像翻訳タスクにおいて,様々な最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-06-07T12:56:56Z) - Few-shot Semantic Image Synthesis with Class Affinity Transfer [23.471210664024067]
そこで本研究では,大規模なデータセット上でトレーニングされたモデルを利用して,小規模なターゲットデータセット上での学習能力を向上させるトランスファー手法を提案する。
クラス親和性行列は、ターゲットラベルマップと互換性を持たせるために、ソースモデルの第一層として導入される。
セマンティック・セマンティック・シンセサイザー(セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・アーキテクチャー)にアプローチを適用する。
論文 参考訳(メタデータ) (2023-04-05T09:24:45Z) - EmbedDistill: A Geometric Knowledge Distillation for Information
Retrieval [83.79667141681418]
大規模なニューラルモデル(トランスフォーマーなど)は、情報検索(IR)のための最先端のパフォーマンスを達成する
本研究では,大規模教師モデルで学習したクエリとドキュメント間の相対的幾何を利用した新しい蒸留手法を提案する。
提案手法は, 両エンコーダ (DE) とクロスエンコーダ (CE) の2種類の教師モデルから, 95~97%の教師性能を維持できる1/10の非対称な学生への蒸留に成功した。
論文 参考訳(メタデータ) (2023-01-27T22:04:37Z) - Dense Depth Distillation with Out-of-Distribution Simulated Images [30.79756881887895]
単分子深度推定(MDE)のためのデータフリー知識蒸留(KD)について検討する。
KDは、訓練された教師モデルからそれを圧縮し、対象領域でのトレーニングデータを欠くことにより、現実世界の深度知覚タスクの軽量モデルを学ぶ。
提案手法は, トレーニング画像の1/6に留まらず, ベースラインKDのマージンが良好であり, 性能も若干向上していることを示す。
論文 参考訳(メタデータ) (2022-08-26T07:10:01Z) - IMAGINE: Image Synthesis by Image-Guided Model Inversion [79.4691654458141]
IMGE-Guided Model INvErsion (IMAGINE) と呼ばれるインバージョンベースの手法を導入し、高品質で多様な画像を生成します。
我々は,事前学習した分類器から画像意味論の知識を活用し,妥当な世代を実現する。
IMAGINEは,1)合成中の意味的特異性制約を同時に実施し,2)ジェネレータトレーニングなしでリアルな画像を生成し,3)生成過程を直感的に制御する。
論文 参考訳(メタデータ) (2021-04-13T02:00:24Z) - Generating Annotated High-Fidelity Images Containing Multiple Coherent
Objects [10.783993190686132]
コンテキスト情報を明示的に必要とせずに、複数のオブジェクトで画像を合成できるマルチオブジェクト生成フレームワークを提案する。
我々は,Multi-MNISTおよびCLEVRデータセットを用いた実験により,コヒーレンシーと忠実さの保存方法を示す。
論文 参考訳(メタデータ) (2020-06-22T11:33:55Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。