論文の概要: In-Context Policy Adaptation via Cross-Domain Skill Diffusion
- arxiv url: http://arxiv.org/abs/2509.04535v1
- Date: Thu, 04 Sep 2025 06:55:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.363234
- Title: In-Context Policy Adaptation via Cross-Domain Skill Diffusion
- Title(参考訳): クロスドメインスキル拡散によるインコンテキストポリシー適応
- Authors: Minjong Yoo, Woo Kyung Kim, Honguk Woo,
- Abstract要約: 本研究では,長期マルチタスク環境を対象としたコンテキスト内ポリシー適応フレームワークを提案する。
このフレームワークは、スキルベースの強化学習ポリシーを、多様なターゲットドメインに迅速に適用することを可能にする。
本フレームワークは,限られた対象領域データ条件下での政策適応性能に優れることを示す。
- 参考スコア(独自算出の注目度): 37.727612185480986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we present an in-context policy adaptation (ICPAD) framework designed for long-horizon multi-task environments, exploring diffusion-based skill learning techniques in cross-domain settings. The framework enables rapid adaptation of skill-based reinforcement learning policies to diverse target domains, especially under stringent constraints on no model updates and only limited target domain data. Specifically, the framework employs a cross-domain skill diffusion scheme, where domain-agnostic prototype skills and a domain-grounded skill adapter are learned jointly and effectively from an offline dataset through cross-domain consistent diffusion processes. The prototype skills act as primitives for common behavior representations of long-horizon policies, serving as a lingua franca to bridge different domains. Furthermore, to enhance the in-context adaptation performance, we develop a dynamic domain prompting scheme that guides the diffusion-based skill adapter toward better alignment with the target domain. Through experiments with robotic manipulation in Metaworld and autonomous driving in CARLA, we show that our $\oursol$ framework achieves superior policy adaptation performance under limited target domain data conditions for various cross-domain configurations including differences in environment dynamics, agent embodiment, and task horizon.
- Abstract(参考訳): 本研究では,長期マルチタスク環境を対象としたコンテキスト内ポリシー適応(ICPAD)フレームワークを提案する。
このフレームワークは、スキルベースの強化学習ポリシーを、さまざまなターゲットドメインに、特にモデル更新や限定対象ドメインデータに対する厳格な制約の下で、迅速に適応することができる。
具体的には、ドメインに依存しないプロトタイプスキルとドメイングラウンドのスキルアダプタを、クロスドメイン一貫した拡散プロセスを通じて、オフラインデータセットから共同で効果的に学習するクロスドメインスキル拡散スキームを採用している。
プロトタイプスキルは、ロングホライズン政策の共通の行動表現のプリミティブとして機能し、異なるドメインをブリッジするラングアフランカとして機能する。
さらに,テキスト内適応性能を向上させるため,拡散型スキルアダプタをターゲットドメインとの整合性向上に導く動的ドメインプロンプト方式を開発した。
メタワールドでのロボット操作とCARLAでの自律運転による実験を通じて、環境力学、エージェントの実施、タスク水平化など、さまざまなドメイン間構成において、限定されたドメインデータ条件下での優れたポリシー適応性能を実現することを示します。
関連論文リスト
- Self-Paced Collaborative and Adversarial Network for Unsupervised Domain Adaptation [74.27130400558013]
本稿では,CAN(Collaborative and Adversarial Network)と呼ばれる非教師付きドメイン適応手法を提案する。
CANは、ニューラルネットワークのトレーニングに、ドメイン協調学習戦略とドメイン共用学習戦略を使用する。
対象領域における識別性をさらに高めるために,SPCAN(Self-Paced CAN)を提案する。
論文 参考訳(メタデータ) (2025-06-24T02:58:37Z) - xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing [21.37585797507323]
ドメイン間政策伝達手法は主に、ポリシー学習を容易にするために、ドメインの対応や修正を学習することを目的としている。
本稿では,クロスドメイントラジェクトリ適応のために特別に設計された拡散モデルを用いたクロスドメイントラジェクトリ・EDitingフレームワークを提案する。
提案するモデルアーキテクチャは,対象データ内の動的パターンだけでなく,状態,行動,報酬間の複雑な依存関係を効果的にキャプチャする。
論文 参考訳(メタデータ) (2024-09-13T10:07:28Z) - Cross-Domain Policy Transfer by Representation Alignment via Multi-Domain Behavioral Cloning [13.674493608667627]
本稿では、ドメイン間の共有潜在表現と、その上に共通の抽象ポリシーを学習する、ドメイン間ポリシー転送のためのシンプルなアプローチを提案する。
提案手法は,プロキシタスクの不整合軌道上でのマルチドメイン動作のクローン化と,ドメイン間のアライメントを促進するために,最大平均不整合(MMD)を正規化用語として利用する。
論文 参考訳(メタデータ) (2024-07-24T00:13:00Z) - Cross-Domain Policy Adaptation via Value-Guided Data Filtering [57.62692881606099]
動的ミスマッチで異なるドメインにまたがるポリシーを一般化することは、強化学習において重要な課題となる。
本稿では、ペア化された値ターゲットの近接に基づいて、ソースドメインからの遷移を選択的に共有するバリューガイドデータフィルタリング(VGDF)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-28T04:08:40Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Unsupervised Cross-domain Image Classification by Distance Metric Guided
Feature Alignment [11.74643883335152]
教師なしドメイン適応は、ソースドメインからターゲットドメインに知識を転送する有望な道である。
本稿では,距離メトリックガイド機能アライメント(MetFA)を提案する。
我々のモデルは、クラス分布アライメントを統合して、ソースドメインからターゲットドメインにセマンティック知識を転送します。
論文 参考訳(メタデータ) (2020-08-19T13:36:57Z) - Domain Conditioned Adaptation Network [90.63261870610211]
本稿では,ドメイン条件付きチャネルアテンション機構を用いて,異なる畳み込みチャネルを励起するドメイン条件適応ネットワーク(DCAN)を提案する。
これは、ディープDAネットワークのドメインワイドな畳み込みチャネルアクティベーションを探求する最初の試みである。
論文 参考訳(メタデータ) (2020-05-14T04:23:24Z) - Improve Unsupervised Domain Adaptation with Mixup Training [18.329571222689562]
本稿では,ラベルの豊富な関連するソースドメインを用いて,注釈のないターゲットドメインの予測モデルを構築するという課題について検討する。
近年の研究では、ドメイン不変の特徴を学習する一般的な敵対的アプローチは、望ましいドメイン性能を達成するには不十分である。
対象データに対する一般化性能に直接対処するために、ミックスアップ定式化を用いて、ドメイン間のトレーニング制約を強制することを提案する。
論文 参考訳(メタデータ) (2020-01-03T01:21:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。