論文の概要: Generalized Adaptive Transfer Network: Enhancing Transfer Learning in Reinforcement Learning Across Domains
- arxiv url: http://arxiv.org/abs/2507.03026v1
- Date: Wed, 02 Jul 2025 21:33:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.539203
- Title: Generalized Adaptive Transfer Network: Enhancing Transfer Learning in Reinforcement Learning Across Domains
- Title(参考訳): 一般化適応伝達ネットワーク:ドメイン間の強化学習における伝達学習の強化
- Authors: Abhishek Verma, Nallarasan V, Balaraman Ravindran,
- Abstract要約: 強化学習(RL)における伝達学習により、エージェントはソースタスクからの知識を活用して、ターゲットタスクでの学習を加速することができる。
本稿では、ドメイン間のタスクの一般化に取り組むために設計された深いRLアーキテクチャであるGeneralized Adaptive Transfer Network (GATN)を紹介する。
GATNはドメインに依存しない表現モジュール、堅牢性を認識したポリシーアダプタ、そしてこれらの目標を達成するための効率的な転送スケジューラを使用している。
- 参考スコア(独自算出の注目度): 11.705324423141606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Transfer learning in Reinforcement Learning (RL) enables agents to leverage knowledge from source tasks to accelerate learning in target tasks. While prior work, such as the Attend, Adapt, and Transfer (A2T) framework, addresses negative transfer and selective transfer, other critical challenges remain underexplored. This paper introduces the Generalized Adaptive Transfer Network (GATN), a deep RL architecture designed to tackle task generalization across domains, robustness to environmental changes, and computational efficiency in transfer. GATN employs a domain-agnostic representation module, a robustness-aware policy adapter, and an efficient transfer scheduler to achieve these goals. We evaluate GATN on diverse benchmarks, including Atari 2600, MuJoCo, and a custom chatbot dialogue environment, demonstrating superior performance in cross-domain generalization, resilience to dynamic environments, and reduced computational overhead compared to baselines. Our findings suggest GATN is a versatile framework for real-world RL applications, such as adaptive chatbots and robotic control.
- Abstract(参考訳): 強化学習(RL)における伝達学習により、エージェントはソースタスクからの知識を活用して、ターゲットタスクでの学習を加速することができる。
Attend、Adapt、Transfer(A2T)フレームワークのような以前の作業は、負の転送と選択的転送に対処するが、他の重要な課題は未解決のままである。
本稿では,領域間のタスクの一般化,環境変化に対する堅牢性,転送における計算効率の両立を目的とした,深いRLアーキテクチャであるGeneralized Adaptive Transfer Network(GATN)を紹介する。
GATNはドメインに依存しない表現モジュール、堅牢性を認識したポリシーアダプタ、そしてこれらの目標を達成するための効率的な転送スケジューラを使用している。
我々は,Atari 2600, MuJoCo, カスタムチャットボット対話環境などの多様なベンチマークでGATNを評価し, クロスドメインの一般化, 動的環境へのレジリエンス, ベースラインに比べて計算オーバーヘッドを低減した。
この結果から,GATNは適応型チャットボットやロボット制御など,現実のRLアプリケーションのための汎用的なフレームワークであることが示唆された。
関連論文リスト
- On the Mechanisms of Adversarial Data Augmentation for Robust and Adaptive Transfer Learning [0.0]
移動学習環境における強靭性と適応性を両立させる上で, ADA(Adversarial Data Augmentation)の役割について検討した。
本稿では、ADAと整合性正規化とドメイン不変表現学習を統合した統合フレームワークを提案する。
本研究は,破壊攻撃からの摂動を,ドメイン間移動性のための正規化力に変換する,対向学習という構成的視点を強調した。
論文 参考訳(メタデータ) (2025-05-19T03:56:51Z) - An advantage based policy transfer algorithm for reinforcement learning with measures of transferability [5.926203312586109]
強化学習(Reinforcement Learning, RL)は, 複雑・高次元環境における逐次的意思決定を可能にする。
本稿では、固定されたドメイン環境に対する非政治アドバンテージベースのポリシー転送アルゴリズムであるAPT-RLを提案する。
論文 参考訳(メタデータ) (2023-11-12T04:25:53Z) - Transfer RL via the Undo Maps Formalism [29.798971172941627]
ドメイン間で知識を伝達することは、機械学習における最も基本的な問題の1つである。
本稿では,対話型ドメイン間で知識を伝達するフレームワークTvDを提案する。
この目的が,模倣学習を想起させるポリシー更新スキームに結びつき,それを実装するための効率的なアルゴリズムを導出することを示す。
論文 参考訳(メタデータ) (2022-11-26T03:44:28Z) - Safe Self-Refinement for Transformer-based Domain Adaptation [73.8480218879]
Unsupervised Domain Adaptation (UDA)は、ラベル豊富なソースドメインを活用して、関連するラベルのないターゲットドメイン上のタスクを解決することを目的としている。
特にソースとターゲットドメインの間に大きなドメインギャップがある場合、これは難しい問題です。
SSRT (Safe Self-Refinement for Transformer-based domain adaptation) という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-04-16T00:15:46Z) - Multi-Agent Transfer Learning in Reinforcement Learning-Based
Ride-Sharing Systems [3.7311680121118345]
強化学習(Reinforcement Learning, RL)は、実世界の様々なシミュレーションタスクで使われている。
本稿では,固定ソースとターゲットロールを用いたTL転送パラメータの影響について検討する。
論文 参考訳(メタデータ) (2021-12-01T11:23:40Z) - TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation [54.61786380919243]
Unsupervised domain adapt (UDA) は、ラベル付きソースドメインから学習した知識をラベル付きターゲットドメインに転送することを目的としている。
これまでの研究は主に、ドメイン不変表現を学ぶために畳み込みニューラルネットワーク(CNN)上に構築されていた。
近年、視覚タスクに視覚変換器(ViT)を適用する指数関数的増加に伴い、ドメイン間の知識を適応するViTの能力は文献上未解明のままである。
論文 参考訳(メタデータ) (2021-08-12T22:37:43Z) - Transformer-Based Source-Free Domain Adaptation [134.67078085569017]
本研究では,ソースフリードメイン適応(SFDA)の課題について検討する。
我々は、FDAの一般化モデルを学ぶためのTransformer(TransDA)という、汎用的で効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-28T23:06:26Z) - OTCE: A Transferability Metric for Cross-Domain Cross-Task
Representations [6.730043708859326]
OTCE (Optimal Transport based Conditional Entropy) と呼ばれる移動性指標を提案する。
otceはトランスファビリティをドメインの違いとタスクの違いの組み合わせとして特徴づけ、それらを統一されたフレームワークのデータから明示的に評価する。
最大のクロスドメインデータセットであるDomainNetとOffice31の実験では、OTCEが地上の真実転送精度と相関して平均21%の利得を示した。
論文 参考訳(メタデータ) (2021-03-25T13:51:33Z) - Towards Accurate Knowledge Transfer via Target-awareness Representation
Disentanglement [56.40587594647692]
本稿では,TRED(Target-Awareness Representation Disentanglement)の概念を取り入れた新しいトランスファー学習アルゴリズムを提案する。
TREDは、対象のタスクに関する関連する知識を元のソースモデルから切り離し、ターゲットモデルを微調整する際、レギュレータとして使用する。
各種実世界のデータセットを用いた実験により,本手法は標準微調整を平均2%以上安定的に改善することが示された。
論文 参考訳(メタデータ) (2020-10-16T17:45:08Z) - Off-Dynamics Reinforcement Learning: Training for Transfer with Domain
Classifiers [138.68213707587822]
強化学習におけるドメイン適応のためのシンプルで実践的で直感的なアプローチを提案する。
報酬関数を変更することで、力学の違いを補うことで、この目標を達成することができることを示す。
我々のアプローチは、連続状態とアクションを持つドメインに適用でき、ダイナミックスの明示的なモデルを学ぶ必要がない。
論文 参考訳(メタデータ) (2020-06-24T17:47:37Z) - Supervised Domain Adaptation using Graph Embedding [86.3361797111839]
領域適応法は、2つの領域間の分布がシフトし、それを認識しようとすると仮定する。
グラフ埋め込みに基づく汎用フレームワークを提案する。
提案手法が強力なドメイン適応フレームワークにつながることを示す。
論文 参考訳(メタデータ) (2020-03-09T12:25:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。