論文の概要: Transferring Knowledge with Attention Distillation for Multi-Domain
Image-to-Image Translation
- arxiv url: http://arxiv.org/abs/2108.07466v1
- Date: Tue, 17 Aug 2021 06:47:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-18 13:09:53.201902
- Title: Transferring Knowledge with Attention Distillation for Multi-Domain
Image-to-Image Translation
- Title(参考訳): 多領域画像から画像への変換のための注意蒸留による知識伝達
- Authors: Runze Li, Tomaso Fontanini, Luca Donati, Andrea Prati, Bir Bhanu
- Abstract要約: 画像から画像への翻訳作業のための教師-学生パラダイムにおいて、勾配に基づく注意が伝達する知識としてどのように使われるかを示す。
また、教員と学生のネットワークが異なるドメインでトレーニングされている場合、トレーニング中に「疑似意識」が適用可能であることも示している。
- 参考スコア(独自算出の注目度): 28.272982411879845
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Gradient-based attention modeling has been used widely as a way to visualize
and understand convolutional neural networks. However, exploiting these visual
explanations during the training of generative adversarial networks (GANs) is
an unexplored area in computer vision research. Indeed, we argue that this kind
of information can be used to influence GANs training in a positive way. For
this reason, in this paper, it is shown how gradient based attentions can be
used as knowledge to be conveyed in a teacher-student paradigm for multi-domain
image-to-image translation tasks in order to improve the results of the student
architecture. Further, it is demonstrated how "pseudo"-attentions can also be
employed during training when teacher and student networks are trained on
different domains which share some similarities. The approach is validated on
multi-domain facial attributes transfer and human expression synthesis showing
both qualitative and quantitative results.
- Abstract(参考訳): グラディエントに基づくアテンションモデリングは、畳み込みニューラルネットワークの可視化と理解の手段として広く利用されている。
しかし、gans(generative adversarial network)の訓練中にこれらの視覚的な説明を活用することは、コンピュータビジョン研究において未開拓領域である。
実際、このような情報は、GANのトレーニングに肯定的な影響を与えることができると論じている。
そこで,本稿では,学生アーキテクチャの結果を改善するために,多領域画像・画像翻訳タスクの教師-学生パラダイムにおいて,勾配に基づく注意を伝達するための知識として活用する方法を示す。
さらに,教師と学生のネットワークが類似点のある異なるドメインで訓練されている場合,「疑似意識」が訓練中にどのように採用されるかを示す。
本手法は, 質的および定量的な結果を示す多領域顔属性移動と人体表現合成に有効である。
関連論文リスト
- Efficient Visualization of Neural Networks with Generative Models and Adversarial Perturbations [0.0]
本稿では,既存の手法を改良した生成ネットワークによるディープビジュアライゼーション手法を提案する。
我々のモデルは、使用するネットワーク数を減らし、ジェネレータと識別器のみを必要とすることにより、アーキテクチャを単純化する。
我々のモデルは、事前の訓練知識を少なくし、差別者がガイドとして機能する非敵的訓練プロセスを使用する。
論文 参考訳(メタデータ) (2024-09-20T14:59:25Z) - Pre-processing and Compression: Understanding Hidden Representation Refinement Across Imaging Domains via Intrinsic Dimension [1.7495213911983414]
医用画像モデルは,ネットワークの早期に表現IDがピークとなることを示す。
また、このピーク表現IDと入力空間内のデータのIDとの強い相関関係も見出す。
論文 参考訳(メタデータ) (2024-08-15T18:54:31Z) - Unsupervised Domain Transfer with Conditional Invertible Neural Networks [83.90291882730925]
条件付き可逆ニューラルネットワーク(cINN)に基づくドメイン転送手法を提案する。
提案手法は本質的に,その可逆的アーキテクチャによるサイクル一貫性を保証し,ネットワークトレーニングを最大限効率的に行うことができる。
提案手法は,2つの下流分類タスクにおいて,現実的なスペクトルデータの生成を可能にし,その性能を向上する。
論文 参考訳(メタデータ) (2023-03-17T18:00:27Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Impact of a DCT-driven Loss in Attention-based Knowledge-Distillation
for Scene Recognition [64.29650787243443]
本稿では, アクティベーションマップの2次元周波数変換を転送前に提案し, 解析する。
この戦略は、シーン認識などのタスクにおける知識伝達可能性を高める。
我々は、この論文で使われているトレーニングおよび評価フレームワークを、http://www.vpu.eps.uam.es/publications/DCTBasedKDForSceneRecognitionで公開しています。
論文 参考訳(メタデータ) (2022-05-04T11:05:18Z) - Explainability-aided Domain Generalization for Image Classification [0.0]
説明可能性文献から手法やアーキテクチャを適用することで、ドメインの一般化という困難な課題に対して最先端のパフォーマンスを達成できることを示す。
そこで我々は,勾配に基づくクラスアクティベーションマップを用いて学習中にネットワークが指導を受ける手法であるDivCAMを含む新しいアルゴリズムを開発し,多様な識別機能に焦点をあてる。
これらの手法は、説明可能性に加えて競合性能を提供するため、深層ニューラルネットワークアーキテクチャのロバスト性を改善するツールとして使用できると論じる。
論文 参考訳(メタデータ) (2021-04-05T02:27:01Z) - Knowledge Distillation By Sparse Representation Matching [107.87219371697063]
本稿では,一方の畳み込みネットワーク(cnn)から他方へ,スパース表現を用いて中間知識を伝達するスパース表現マッチング(srm)を提案する。
勾配降下を利用して効率的に最適化し、任意のCNNにプラグアンドプレイで統合できるニューラルプロセッシングブロックとして定式化します。
実験の結果,教師と生徒のネットワーク間のアーキテクチャの違いに頑健であり,複数のデータセットにまたがる他のkd技術よりも優れていた。
論文 参考訳(メタデータ) (2021-03-31T11:47:47Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - An analysis of the transfer learning of convolutional neural networks
for artistic images [1.9336815376402716]
巨大な自然画像データセットからのトランスファー学習は、アート分析アプリケーションの中核となっている。
本稿ではまず,ネットワークの内部表現を可視化する手法を用いて,ネットワークが芸術的イメージで何を学んだかを理解するための手がかりを提供する。
特徴空間とパラメータ空間の両方のメトリクスと、最大アクティベーション画像のセットで計算されたメトリクスのおかげで、学習プロセスが導入した変化を定量的に分析する。
論文 参考訳(メタデータ) (2020-11-05T09:45:32Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。