論文の概要: Cross-Domain Policy Transfer by Representation Alignment via Multi-Domain Behavioral Cloning
- arxiv url: http://arxiv.org/abs/2407.16912v1
- Date: Wed, 24 Jul 2024 00:13:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-25 15:12:43.214804
- Title: Cross-Domain Policy Transfer by Representation Alignment via Multi-Domain Behavioral Cloning
- Title(参考訳): マルチドメイン行動クローンによる表現アライメントによるドメイン間政策伝達
- Authors: Hayato Watahiki, Ryo Iwase, Ryosuke Unno, Yoshimasa Tsuruoka,
- Abstract要約: 本稿では、ドメイン間の共有潜在表現と、その上に共通の抽象ポリシーを学習する、ドメイン間ポリシー転送のためのシンプルなアプローチを提案する。
提案手法は,プロキシタスクの不整合軌道上でのマルチドメイン動作のクローン化と,ドメイン間のアライメントを促進するために,最大平均不整合(MMD)を正規化用語として利用する。
- 参考スコア(独自算出の注目度): 13.674493608667627
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Transferring learned skills across diverse situations remains a fundamental challenge for autonomous agents, particularly when agents are not allowed to interact with an exact target setup. While prior approaches have predominantly focused on learning domain translation, they often struggle with handling significant domain gaps or out-of-distribution tasks. In this paper, we present a simple approach for cross-domain policy transfer that learns a shared latent representation across domains and a common abstract policy on top of it. Our approach leverages multi-domain behavioral cloning on unaligned trajectories of proxy tasks and employs maximum mean discrepancy (MMD) as a regularization term to encourage cross-domain alignment. The MMD regularization better preserves structures of latent state distributions than commonly used domain-discriminative distribution matching, leading to higher transfer performance. Moreover, our approach involves training only one multi-domain policy, which makes extension easier than existing methods. Empirical evaluations demonstrate the efficacy of our method across various domain shifts, especially in scenarios where exact domain translation is challenging, such as cross-morphology or cross-viewpoint settings. Our ablation studies further reveal that multi-domain behavioral cloning implicitly contributes to representation alignment alongside domain-adversarial regularization.
- Abstract(参考訳): さまざまな状況における学習スキルの移転は、特にエージェントが正確な目標設定と対話できない場合、自律エージェントにとって基本的な課題である。
それまでのアプローチはドメイン翻訳の学習に重点を置いてきたが、多くの場合、重要なドメインギャップやアウト・オブ・ディストリビューションタスクに対処するのに苦労する。
本稿では、ドメイン間の共有潜在表現と、その上に共通の抽象ポリシーを学習する、ドメイン間ポリシー転送のための簡単なアプローチを提案する。
提案手法は,プロキシタスクの不整合軌道上でのマルチドメイン動作のクローン化と,ドメイン間のアライメントを促進するために,最大平均不整合(MMD)を正規化用語として利用する。
MMD正則化は、一般的に使用されるドメイン識別分布マッチングよりも遅延状態分布の構造を保存し、より高い転送性能をもたらす。
さらに,提案手法では,既存手法よりも拡張が容易な1つのマルチドメインポリシのみをトレーニングする。
特にクロスモーフィックやクロスビューポイントの設定など,正確なドメイン翻訳が困難なシナリオにおいて,本手法の有効性を実証的に評価した。
我々のアブレーション研究は、多領域の行動クローニングが、ドメイン-逆正則化と共に表現整合に暗黙的に寄与することを明らかにする。
関連論文リスト
- Learning with Alignments: Tackling the Inter- and Intra-domain Shifts for Cross-multidomain Facial Expression Recognition [16.864390181629044]
本稿では、ドメイン間のシフトとドメイン内シフトの両方を扱うための、LA-CMFERという新しいラーニング・ウィズ・アライメント・CMFERフレームワークを提案する。
これに基づいて、LA-CMFERは、知識伝達におけるハード・トゥ・アライメント・サンプルの優先順位付けをモデルに強制する二重レベル領域間アライメント法を提案する。
ドメイン内シフトに対処するため、LA-CMFERは複数ビューの整合性制約を持つ複数ビューのドメイン内アライメント手法を導入した。
論文 参考訳(メタデータ) (2024-07-08T07:43:06Z) - Multi-modal Domain Adaptation for REG via Relation Transfer [46.03480352815051]
本稿では,Referring Expression Grounding (REG) 問題に対する特別な関係調整手法により,マルチモーダルな知識を効果的に伝達する手法を提案する。
ドメイン間の関係を同時に強化し,ドメイン間の関係を移譲することで,マルチモーダルなドメイン適応問題に取り組む。
論文 参考訳(メタデータ) (2023-09-23T04:02:06Z) - Domain Generalization via Selective Consistency Regularization for Time
Series Classification [16.338176636365752]
ドメイン一般化手法は、限られた数のソースドメインからのデータで、ドメインシフトに頑健なモデルを学習することを目的としている。
本稿では,ソースドメイン間の予測一貫性を選択的に適用する表現学習手法を提案する。
論文 参考訳(メタデータ) (2022-06-16T01:57:35Z) - Structured Latent Embeddings for Recognizing Unseen Classes in Unseen
Domains [108.11746235308046]
本稿では,異なる領域からの画像を投影することで,ドメインに依存しない遅延埋め込みを学習する手法を提案する。
挑戦的なDomainNetとDomainNet-LSベンチマークの実験は、既存のメソッドよりもアプローチの方が優れていることを示している。
論文 参考訳(メタデータ) (2021-07-12T17:57:46Z) - Domain Consistency Regularization for Unsupervised Multi-source Domain
Adaptive Classification [57.92800886719651]
近年,深層学習に基づくマルチソース非教師付きドメイン適応(MUDA)が活発に研究されている。
MUDAのドメインシフトは、ソースドメインとターゲットドメインの間だけでなく、複数のソースドメインの間にも存在します。
本稿では、教師なしマルチソースドメイン適応分類において、ドメインの一貫性規則化を利用するエンドツーエンドのトレーニング可能なネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-16T07:29:27Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Cross-domain Imitation from Observations [50.669343548588294]
模擬学習は、専門家の行動を利用して訓練エージェントに適切な報酬関数を設計することの難しさを回避しようとする。
本稿では,専門家とエージェントMDPの相違点が存在する場合に,タスクを模倣する方法の問題について検討する。
このようなドメイン間の対応を学習するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-20T21:08:25Z) - Domain Conditioned Adaptation Network [90.63261870610211]
本稿では,ドメイン条件付きチャネルアテンション機構を用いて,異なる畳み込みチャネルを励起するドメイン条件適応ネットワーク(DCAN)を提案する。
これは、ディープDAネットワークのドメインワイドな畳み込みチャネルアクティベーションを探求する最初の試みである。
論文 参考訳(メタデータ) (2020-05-14T04:23:24Z) - Unsupervised Domain Adaptation with Progressive Domain Augmentation [34.887690018011675]
本稿では,プログレッシブドメイン拡張に基づく新規な教師なしドメイン適応手法を提案する。
提案手法は、仮想中間ドメインをドメインを介して生成し、ソースドメインを徐々に拡張し、ソースターゲット領域の分岐をブリッジする。
本研究では,複数の領域適応タスクについて実験を行い,提案手法が最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2020-04-03T18:45:39Z) - Improve Unsupervised Domain Adaptation with Mixup Training [18.329571222689562]
本稿では,ラベルの豊富な関連するソースドメインを用いて,注釈のないターゲットドメインの予測モデルを構築するという課題について検討する。
近年の研究では、ドメイン不変の特徴を学習する一般的な敵対的アプローチは、望ましいドメイン性能を達成するには不十分である。
対象データに対する一般化性能に直接対処するために、ミックスアップ定式化を用いて、ドメイン間のトレーニング制約を強制することを提案する。
論文 参考訳(メタデータ) (2020-01-03T01:21:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。