論文の概要: A Comprehensive Survey of Cross-Domain Policy Transfer for Embodied
Agents
- arxiv url: http://arxiv.org/abs/2402.04580v1
- Date: Wed, 7 Feb 2024 04:43:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-08 16:37:59.891234
- Title: A Comprehensive Survey of Cross-Domain Policy Transfer for Embodied
Agents
- Title(参考訳): エンボディエージェントのクロスドメイン政策移転に関する包括的調査
- Authors: Haoyi Niu, Jianming Hu, Guyue Zhou, Xianyuan Zhan
- Abstract要約: ロボット学習と具現化されたAIの急成長は、大量のデータに対する需要の高まりを引き起こしている。
しかし、コストのかかるデータ収集プロセスと厳格な安全要件のために、ターゲットドメインから十分なバイアスのないデータを集めることは、依然として課題である。
我々は、既存のクロスドメインポリシー転送手法の体系的なレビューを行う。
- 参考スコア(独自算出の注目度): 22.766158807531767
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The burgeoning fields of robot learning and embodied AI have triggered an
increasing demand for large quantities of data. However, collecting sufficient
unbiased data from the target domain remains a challenge due to costly data
collection processes and stringent safety requirements. Consequently,
researchers often resort to data from easily accessible source domains, such as
simulation and laboratory environments, for cost-effective data acquisition and
rapid model iteration. Nevertheless, the environments and embodiments of these
source domains can be quite different from their target domain counterparts,
underscoring the need for effective cross-domain policy transfer approaches. In
this paper, we conduct a systematic review of existing cross-domain policy
transfer methods. Through a nuanced categorization of domain gaps, we
encapsulate the overarching insights and design considerations of each problem
setting. We also provide a high-level discussion about the key methodologies
used in cross-domain policy transfer problems. Lastly, we summarize the open
challenges that lie beyond the capabilities of current paradigms and discuss
potential future directions in this field.
- Abstract(参考訳): ロボット学習と具体化aiの急成長によって、大量のデータに対する需要が高まっている。
しかし、コストのかかるデータ収集プロセスと厳格な安全要件のために、ターゲットドメインから十分なバイアスのないデータを集めることは依然として課題である。
その結果、研究者はコスト効率の良いデータ取得と迅速なモデル反復のために、シミュレーションや実験室環境などの容易にアクセス可能なソースドメインからのデータを利用することが多い。
それでも、これらのソースドメインの環境と実施形態は、ターゲットドメインのそれとは大きく異なり、効果的なクロスドメインポリシー転送アプローチの必要性を強調する。
本稿では,既存のドメイン間政策伝達手法の体系的レビューを行う。
ドメインギャップの微妙な分類を通じて、各問題設定の全体的洞察と設計上の考察をカプセル化する。
また、ドメイン間政策伝達問題における鍵となる方法論について高レベルな議論を行う。
最後に、現在のパラダイムの能力を超えたオープンな課題を要約し、この分野の将来的な方向性について論じる。
関連論文リスト
- xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing [21.37585797507323]
ドメイン間政策伝達手法は主に、ポリシー学習を容易にするために、ドメインの対応や修正を学習することを目的としている。
本稿では,クロスドメイントラジェクトリ適応のために特別に設計された拡散モデルを用いたクロスドメイントラジェクトリ・EDitingフレームワークを提案する。
提案するモデルアーキテクチャは,対象データ内の動的パターンだけでなく,状態,行動,報酬間の複雑な依存関係を効果的にキャプチャする。
論文 参考訳(メタデータ) (2024-09-13T10:07:28Z) - Knowledge Transfer for Cross-Domain Reinforcement Learning: A Systematic Review [2.94944680995069]
強化学習(RL)は、複雑な意思決定問題を解決するために、試行錯誤を通じてエージェントを訓練できるフレームワークを提供する。
異なるタスクから知識を再利用することにより、知識伝達手法はRLのトレーニング時間を短縮する代替手段を提供する。
本稿では,異なる領域間で知識を伝達することに焦点を当てた手法の統一分析を行う。
論文 参考訳(メタデータ) (2024-04-26T20:36:58Z) - Revisiting the Domain Shift and Sample Uncertainty in Multi-source
Active Domain Transfer [69.82229895838577]
Active Domain Adaptation (ADA)は、アノテートするターゲットデータの限られた数を選択することで、新しいターゲットドメインにおけるモデル適応を最大限に向上することを目的としている。
この設定は、複数のソースからトレーニングデータを収集するより実践的なシナリオを無視します。
これは、ADAを単一のソースドメインから複数のソースドメインに拡張する、新しい、挑戦的な知識転送の設定を目標にしています。
論文 参考訳(メタデータ) (2023-11-21T13:12:21Z) - Cross-Domain Policy Adaptation via Value-Guided Data Filtering [57.62692881606099]
動的ミスマッチで異なるドメインにまたがるポリシーを一般化することは、強化学習において重要な課題となる。
本稿では、ペア化された値ターゲットの近接に基づいて、ソースドメインからの遷移を選択的に共有するバリューガイドデータフィルタリング(VGDF)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-28T04:08:40Z) - A Comprehensive Survey on Source-free Domain Adaptation [69.17622123344327]
ソースフリードメイン適応(SFDA)の研究は近年注目を集めている。
SFDAの最近の進歩を包括的に調査し、それらを統一的な分類体系に整理する。
一般的な3つの分類基準で30以上のSFDA法を比較検討した。
論文 参考訳(メタデータ) (2023-02-23T06:32:09Z) - Key Design Choices for Double-Transfer in Source-Free Unsupervised
Domain Adaptation [18.21955526087808]
本稿では、SF-UDA(Source-Free Unsupervised Domain Adaptation)における主要な設計選択の詳細な分析を行う。
正規化アプローチ、事前学習戦略、バックボーンアーキテクチャを最も重要な要素として挙げる。
SF-UDAは、標準ベンチマークやバックボーンアーキテクチャよりも競争力があり、データと計算コストのごく一部でUDAと同等の性能を発揮することを示す。
論文 参考訳(メタデータ) (2023-02-10T17:00:37Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - Domain Adaptation with Incomplete Target Domains [61.68950959231601]
本稿では、この新たなドメイン適応問題に対処するために、不完全データインプットに基づく Adversarial Network (IDIAN) モデルを提案する。
提案モデルでは,対象領域における部分的な観測に基づいて,欠落した特徴値を満たすデータ計算モジュールを設計する。
我々は、クロスドメインベンチマークタスクと、不完全なターゲットドメインを用いた実世界適応タスクの両方で実験を行う。
論文 参考訳(メタデータ) (2020-12-03T00:07:40Z) - A Review of Single-Source Deep Unsupervised Visual Domain Adaptation [81.07994783143533]
大規模ラベル付きトレーニングデータセットにより、ディープニューラルネットワークは、幅広いベンチマークビジョンタスクを拡張できるようになった。
多くのアプリケーションにおいて、大量のラベル付きデータを取得するのは非常に高価で時間を要する。
限られたラベル付きトレーニングデータに対処するため、大規模ラベル付きソースドメインでトレーニングされたモデルを、疎ラベルまたは未ラベルのターゲットドメインに直接適用しようと試みている人も多い。
論文 参考訳(メタデータ) (2020-09-01T00:06:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。