論文の概要: Progressive Modality Cooperation for Multi-Modality Domain Adaptation
- arxiv url: http://arxiv.org/abs/2506.19316v1
- Date: Tue, 24 Jun 2025 05:13:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-25 19:48:23.497454
- Title: Progressive Modality Cooperation for Multi-Modality Domain Adaptation
- Title(参考訳): 多モード領域適応のためのプログレッシブモダリティ協調
- Authors: Weichen Zhang, Dong Xu, Jing Zhang, Wanli Ouyang,
- Abstract要約: 我々は,PMC(Progressive Modality Cooperation)と呼ばれる汎用多モードドメイン適応フレームワークを提案する。
MMDA設定の下では、両方のドメインのサンプルはすべてのモダリティを持つ。
MMDA-PI設定では、ターゲットドメインにいくつかのモダリティが欠落している。
- 参考スコア(独自算出の注目度): 70.26879294371052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we propose a new generic multi-modality domain adaptation framework called Progressive Modality Cooperation (PMC) to transfer the knowledge learned from the source domain to the target domain by exploiting multiple modality clues (\eg, RGB and depth) under the multi-modality domain adaptation (MMDA) and the more general multi-modality domain adaptation using privileged information (MMDA-PI) settings. Under the MMDA setting, the samples in both domains have all the modalities. In two newly proposed modules of our PMC, the multiple modalities are cooperated for selecting the reliable pseudo-labeled target samples, which captures the modality-specific information and modality-integrated information, respectively. Under the MMDA-PI setting, some modalities are missing in the target domain. Hence, to better exploit the multi-modality data in the source domain, we further propose the PMC with privileged information (PMC-PI) method by proposing a new multi-modality data generation (MMG) network. MMG generates the missing modalities in the target domain based on the source domain data by considering both domain distribution mismatch and semantics preservation, which are respectively achieved by using adversarial learning and conditioning on weighted pseudo semantics. Extensive experiments on three image datasets and eight video datasets for various multi-modality cross-domain visual recognition tasks under both MMDA and MMDA-PI settings clearly demonstrate the effectiveness of our proposed PMC framework.
- Abstract(参考訳): 本研究では,マルチモーダルドメイン適応(MMDA)と,特権情報(MMDA-PI)設定を用いたより汎用的なマルチモーダルドメイン適応(MMDA-PI)を用いて,ソースドメインから学習した知識を対象ドメインに転送する,プログレッシブ・モダリティ・コラボレーション(PMC)と呼ばれる新しい汎用的マルチモーダルドメイン適応フレームワークを提案する。
MMDA設定の下では、両方のドメインのサンプルはすべてのモダリティを持つ。
新たに提案した2つのMCCモジュールにおいて,複数のモダリティが協調して,信頼度の高い擬似ラベル対象サンプルを選択し,モダリティ固有情報とモダリティ統合情報をそれぞれ取得する。
MMDA-PI設定では、ターゲットドメインにいくつかのモダリティが欠落している。
したがって、ソース領域におけるマルチモーダリティデータをよりよく活用するために、新しいマルチモーダリティデータ生成(MMG)ネットワークを提案することにより、特権情報(PMC-PI)を用いたPMCを提案する。
MMGは、ドメイン分布ミスマッチとセマンティックス保存の両方を考慮して、ソースドメインデータに基づいて、ターゲットドメインに欠けているモダリティを生成し、それぞれ、逆学習と重み付き擬似セマンティクスの条件付けを用いて達成する。
MMDA と MMDA-PI の両設定下において,3つの画像データセットと8つのビデオデータセットによる多目的クロスドメイン視覚タスクの広範化実験により,提案した PMC フレームワークの有効性が明らかとなった。
関連論文リスト
- Collaborative Multi-source Domain Adaptation Through Optimal Transport [0.0]
マルチソースドメイン適応(MDA)は、複数のラベル付きソースドメインのデータに基づいてトレーニングされたモデルを適用し、ラベルなしのターゲットドメインデータに対して効果的に実行する。
2つの重要なフェーズからなる新しいフレームワークであるCMDA-OT(Collaborative MDA Through Optimal Transport)を紹介する。
論文 参考訳(メタデータ) (2024-04-09T20:06:25Z) - Multi-Prompt Alignment for Multi-Source Unsupervised Domain Adaptation [86.02485817444216]
マルチプロンプトアライメント(MPA: Multi-Prompt Alignment)は,マルチソースUDAのためのシンプルかつ効率的なフレームワークである。
MPAは、学習したプロンプトを自動エンコードプロセスで認知し、再構築されたプロンプトの合意を最大化することでそれらを調整する。
実験によると、MPAは3つの一般的なデータセットで最先端の結果を達成し、DomainNetの平均精度は54.1%である。
論文 参考訳(メタデータ) (2022-09-30T03:40:10Z) - Graphical Modeling for Multi-Source Domain Adaptation [56.05348879528149]
マルチソースドメイン適応(MSDA)は、複数のソースドメインからターゲットドメインへの知識の転送に焦点を当てている。
我々は2種類のグラフィカルモデルを提案する。
MSDAの条件付きランダムフィールド(CRF-MSDA)とMSDAのマルコフランダムフィールド(MRF-MSDA)
これらの2つのモデルを、ドメインシフトとデータの複雑さが異なるMSDAの4つの標準ベンチマークデータセットで評価します。
論文 参考訳(メタデータ) (2021-04-27T09:04:22Z) - Cluster, Split, Fuse, and Update: Meta-Learning for Open Compound Domain
Adaptive Semantic Segmentation [102.42638795864178]
セマンティックセグメンテーションのための原則的メタラーニングに基づくOCDAアプローチを提案する。
対象ドメインを複数のサブターゲットドメインに,教師なしの方法で抽出した画像スタイルでクラスタリングする。
その後、メタラーニングがデプロイされ、スタイルコードに条件付きでサブターゲットドメイン固有の予測を融合するように学習される。
モデルに依存しないメタラーニング(MAML)アルゴリズムにより,モデルをオンライン更新することを学び,一般化をさらに改善する。
論文 参考訳(メタデータ) (2020-12-15T13:21:54Z) - Mutual Learning Network for Multi-Source Domain Adaptation [73.25974539191553]
ML-MSDA(Multial Learning Network for Multiple Source Domain Adaptation)を提案する。
相互学習の枠組みのもと,提案手法は対象ドメインと各ソースドメインをペアリングし,条件付き対向ドメイン適応ネットワークを分岐ネットワークとして訓練する。
提案手法は, 比較手法より優れ, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-03-29T04:31:43Z) - Unified Multi-Domain Learning and Data Imputation using Adversarial
Autoencoder [5.933303832684138]
マルチドメイン学習(MDL)、データ計算(DI)、マルチタスク学習(MTL)を組み合わせた新しいフレームワークを提案する。
本手法のコアとなるのは,(1)ドメイン間の差を小さくするためにドメイン不変な埋め込みを生成すること,(2)各ドメインのデータ分布を学習し,欠落データに対するデータ計算を正しく行うこと,である。
論文 参考訳(メタデータ) (2020-03-15T19:55:07Z) - MADAN: Multi-source Adversarial Domain Aggregation Network for Domain
Adaptation [58.38749495295393]
ドメイン適応は、あるラベル付きソースドメインと、わずかにラベル付けまたはラベル付けされていないターゲットドメインの間のドメインシフトをブリッジするために、転送可能なモデルを学ぶことを目的としています。
近年のマルチソース領域適応法(MDA)では,ソースとターゲット間の画素レベルのアライメントは考慮されていない。
これらの課題に対処するための新しいMDAフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T21:22:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。