論文の概要: Semantic Relation Preserving Knowledge Distillation for Image-to-Image
Translation
- arxiv url: http://arxiv.org/abs/2104.15082v1
- Date: Fri, 30 Apr 2021 16:04:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 13:36:18.641360
- Title: Semantic Relation Preserving Knowledge Distillation for Image-to-Image
Translation
- Title(参考訳): 画像間翻訳のための知識蒸留を保存する意味関係
- Authors: Zeqi Li, Ruowei Jiang and Parham Aarabi
- Abstract要約: generative adversarial networks (gans) は画像データの高次元分布のモデル化において有意な可能性を示している。
これらのタスクの複雑さのため、最先端のモデルはしばしば膨大な量のパラメータを含む。
本稿では,知識蒸留と意味的関係保存行列の蒸留を併用してこの問題に対処する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 8.443742714362521
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative adversarial networks (GANs) have shown significant potential in
modeling high dimensional distributions of image data, especially on
image-to-image translation tasks. However, due to the complexity of these
tasks, state-of-the-art models often contain a tremendous amount of parameters,
which results in large model size and long inference time. In this work, we
propose a novel method to address this problem by applying knowledge
distillation together with distillation of a semantic relation preserving
matrix. This matrix, derived from the teacher's feature encoding, helps the
student model learn better semantic relations. In contrast to existing
compression methods designed for classification tasks, our proposed method
adapts well to the image-to-image translation task on GANs. Experiments
conducted on 5 different datasets and 3 different pairs of teacher and student
models provide strong evidence that our methods achieve impressive results both
qualitatively and quantitatively.
- Abstract(参考訳): GAN(Generative Adversarial Network)は画像データの高次元分布、特に画像から画像への変換タスクをモデル化する上で大きな可能性を示している。
しかし、これらのタスクの複雑さのため、最先端のモデルには膨大なパラメータが含まれており、大きなモデルサイズと長い推論時間をもたらす。
本研究では,知識蒸留と意味的関係保存マトリックスの蒸留を併用して,この問題に対処する新しい手法を提案する。
このマトリックスは教師の特徴エンコーディングから派生したもので、学生モデルがよりセマンティックな関係を学習するのに役立つ。
分類タスク用に設計された既存の圧縮手法とは対照的に,提案手法は画像から画像への変換タスクによく適応する。
5つの異なるデータセットと3つの異なる教師と生徒モデルで行った実験は、我々の手法が質的および定量的に印象的な結果をもたらすという強い証拠を与える。
関連論文リスト
- Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-03-28T22:25:05Z) - Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。
本研究では,既存のデータ拡張技術の欠点について検討する。
Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文 参考訳(メタデータ) (2024-03-28T17:23:45Z) - The Journey, Not the Destination: How Data Guides Diffusion Models [75.19694584942623]
大規模なデータセットでトレーニングされた拡散モデルは、顕著な品質と多様性のフォトリアリスティックなイメージを合成することができる。
i)拡散モデルの文脈でデータ属性の形式的概念を提供し、(ii)そのような属性を反実的に検証することを可能にする枠組みを提案する。
論文 参考訳(メタデータ) (2023-12-11T08:39:43Z) - SCONE-GAN: Semantic Contrastive learning-based Generative Adversarial
Network for an end-to-end image translation [18.93434486338439]
SCONE-GANはリアルで多様な風景画像を生成する学習に有効であることが示されている。
より現実的で多様な画像生成のために、スタイル参照画像を導入します。
画像から画像への変換と屋外画像のスタイリングのための提案アルゴリズムを検証した。
論文 参考訳(メタデータ) (2023-11-07T10:29:16Z) - EmbedDistill: A Geometric Knowledge Distillation for Information
Retrieval [83.79667141681418]
大規模なニューラルモデル(トランスフォーマーなど)は、情報検索(IR)のための最先端のパフォーマンスを達成する
本研究では,大規模教師モデルで学習したクエリとドキュメント間の相対的幾何を利用した新しい蒸留手法を提案する。
提案手法は, 両エンコーダ (DE) とクロスエンコーダ (CE) の2種類の教師モデルから, 95~97%の教師性能を維持できる1/10の非対称な学生への蒸留に成功した。
論文 参考訳(メタデータ) (2023-01-27T22:04:37Z) - Dense Depth Distillation with Out-of-Distribution Simulated Images [30.79756881887895]
単分子深度推定(MDE)のためのデータフリー知識蒸留(KD)について検討する。
KDは、訓練された教師モデルからそれを圧縮し、対象領域でのトレーニングデータを欠くことにより、現実世界の深度知覚タスクの軽量モデルを学ぶ。
提案手法は, トレーニング画像の1/6に留まらず, ベースラインKDのマージンが良好であり, 性能も若干向上していることを示す。
論文 参考訳(メタデータ) (2022-08-26T07:10:01Z) - Generating Annotated High-Fidelity Images Containing Multiple Coherent
Objects [10.783993190686132]
コンテキスト情報を明示的に必要とせずに、複数のオブジェクトで画像を合成できるマルチオブジェクト生成フレームワークを提案する。
我々は,Multi-MNISTおよびCLEVRデータセットを用いた実験により,コヒーレンシーと忠実さの保存方法を示す。
論文 参考訳(メタデータ) (2020-06-22T11:33:55Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。