論文の概要: Variational Interaction Information Maximization for Cross-domain
Disentanglement
- arxiv url: http://arxiv.org/abs/2012.04251v1
- Date: Tue, 8 Dec 2020 07:11:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 21:43:43.766350
- Title: Variational Interaction Information Maximization for Cross-domain
Disentanglement
- Title(参考訳): クロスドメインディスタングルのための変分相互作用情報最大化
- Authors: HyeongJoo Hwang, Geon-Hyeong Kim, Seunghoon Hong, Kee-Eung Kim
- Abstract要約: ドメイン間の絡み合いは、ドメイン不変表現とドメイン固有表現に分割された表現の学習の問題である。
複数の情報制約の共用目的として,ドメイン不変表現とドメイン固有表現の同時学習を行った。
ゼロショットスケッチに基づく画像検索タスクにおいて,本モデルが最新性能を達成することを示した。
- 参考スコア(独自算出の注目度): 34.08140408283391
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Cross-domain disentanglement is the problem of learning representations
partitioned into domain-invariant and domain-specific representations, which is
a key to successful domain transfer or measuring semantic distance between two
domains. Grounded in information theory, we cast the simultaneous learning of
domain-invariant and domain-specific representations as a joint objective of
multiple information constraints, which does not require adversarial training
or gradient reversal layers. We derive a tractable bound of the objective and
propose a generative model named Interaction Information Auto-Encoder (IIAE).
Our approach reveals insights on the desirable representation for cross-domain
disentanglement and its connection to Variational Auto-Encoder (VAE). We
demonstrate the validity of our model in the image-to-image translation and the
cross-domain retrieval tasks. We further show that our model achieves the
state-of-the-art performance in the zero-shot sketch based image retrieval
task, even without external knowledge. Our implementation is publicly available
at: https://github.com/gr8joo/IIAE
- Abstract(参考訳): ドメイン間の絡み合いはドメイン不変表現とドメイン固有表現に分けられる表現の学習の問題であり、ドメイン転送の成功や2つのドメイン間の意味的距離の測定の鍵となる。
情報理論を基礎として,複数の情報制約の連立目的として,ドメイン不変表現とドメイン固有表現の同時学習を行った。
目的の抽出可能な境界を導出し,IIAE(Interaction Information Auto-Encoder)と呼ばれる生成モデルを提案する。
提案手法は,クロスドメイン・アンタングルメントの望ましい表現と,変分オートエンコーダ(VAE)との接続に関する知見を明らかにする。
画像から画像への変換とドメイン間の検索タスクにおけるモデルの有効性を示す。
さらに, ゼロショットスケッチに基づく画像検索作業において, 外部知識を必要とせずに, 最先端の性能を実現することを示す。
私たちの実装は、https://github.com/gr8joo/IIAEで公開されています。
関連論文リスト
- xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing [21.37585797507323]
ドメイン間政策伝達手法は主に、ポリシー学習を容易にするために、ドメインの対応や修正を学習することを目的としている。
本稿では,クロスドメイントラジェクトリ適応のために特別に設計された拡散モデルを用いたクロスドメイントラジェクトリ・EDitingフレームワークを提案する。
提案するモデルアーキテクチャは,対象データ内の動的パターンだけでなく,状態,行動,報酬間の複雑な依存関係を効果的にキャプチャする。
論文 参考訳(メタデータ) (2024-09-13T10:07:28Z) - PiPa: Pixel- and Patch-wise Self-supervised Learning for Domain
Adaptative Semantic Segmentation [100.6343963798169]
教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、学習モデルの他のドメインへの一般化を強化することを目的としている。
そこで我々は,ドメイン適応型セマンティックセマンティックセグメンテーションのための,PiPaという,画素・パッチ対応の自己教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-14T18:31:24Z) - Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval [55.122020263319634]
ビデオモーメント検索(VMR)は、与えられた言語クエリに従って、未編集のビデオからターゲットモーメントをローカライズすることを目的としている。
本稿では、新しいタスクであるクロスドメインVMRに焦点を当て、完全なアノテーション付きデータセットをひとつのドメインで利用できるが、関心のあるドメインは、注釈なしのデータセットのみを含む。
本稿では、アノテーションの知識をソースドメインからターゲットドメインに転送するマルチモーダル・クロスドメインアライメント・ネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-23T12:58:20Z) - Variational Transfer Learning using Cross-Domain Latent Modulation [1.9662978733004601]
本稿では,効率的な転送学習を実現するために,新しいドメイン間遅延変調機構を変分オートエンコーダフレームワークに導入する。
ソース領域とターゲット領域の深部表現は、まず統一推論モデルにより抽出され、勾配逆数を用いて整列される。
学習した深層表現は、一貫性の制約が適用される代替ドメインの潜在エンコーディングにクロスモデレートされる。
論文 参考訳(メタデータ) (2022-05-31T03:47:08Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Cross-Domain Latent Modulation for Variational Transfer Learning [1.9212368803706577]
分散オートエンコーダ(VAE)フレームワーク内のクロスドメイン潜時変調機構を提案し,トランスファー学習の改善を実現する。
提案モデルは,教師なし領域適応や画像から画像への変換など,多くのトランスファー学習タスクに適用する。
論文 参考訳(メタデータ) (2020-12-21T22:45:00Z) - Unsupervised Cross-domain Image Classification by Distance Metric Guided
Feature Alignment [11.74643883335152]
教師なしドメイン適応は、ソースドメインからターゲットドメインに知識を転送する有望な道である。
本稿では,距離メトリックガイド機能アライメント(MetFA)を提案する。
我々のモデルは、クラス分布アライメントを統合して、ソースドメインからターゲットドメインにセマンティック知識を転送します。
論文 参考訳(メタデータ) (2020-08-19T13:36:57Z) - Adversarial Bipartite Graph Learning for Video Domain Adaptation [50.68420708387015]
ドメイン適応技術は,異なる領域間のモデルを適応させることに重点を置いているが,ビデオ認識領域ではめったに研究されていない。
近年,映像のソースと対象映像の表現を統一するために,対角学習を活用する視覚領域適応はビデオにはあまり効果がない。
本稿では,ソースとターゲットの相互作用を直接モデル化するAdversarial Bipartite Graph (ABG)学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-31T03:48:41Z) - Context-Aware Domain Adaptation in Semantic Segmentation [59.79348089240319]
セマンティックセグメンテーションにおける教師なしドメイン適応の問題を考える。
既存の手法は主に、敵対的学習を通じて、ドメイン不変の特徴(転送方法)を適応することに焦点を当てている。
本稿では,2つのドメイン間のコンテキスト依存性を捕捉し,転送可能なコンテキストに適応するための自己注意に基づく相互注意機構を提案する。
論文 参考訳(メタデータ) (2020-03-09T09:57:24Z) - Latent Normalizing Flows for Many-to-Many Cross-Domain Mappings [76.85673049332428]
画像とテキストの合同表現の学習は、画像キャプションのようないくつかの重要なドメイン横断タスクのバックボーンを形成する。
ドメイン間の共有情報とドメイン固有の情報を個別にモデル化する,新しい半教師付きフレームワークを提案する。
画像キャプションやテキスト・ツー・イメージ合成など,様々なタスクにおけるモデルの有効性を示す。
論文 参考訳(メタデータ) (2020-02-16T19:49:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。