論文の概要: Learning to Adapt: Representation-Based Reinforcement Learning for Multi-Task Skill Transfer
- arxiv url: http://arxiv.org/abs/2606.12890v1
- Date: Thu, 11 Jun 2026 04:33:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.580853
- Title: Learning to Adapt: Representation-Based Reinforcement Learning for Multi-Task Skill Transfer
- Title(参考訳): 適応学習:マルチタスクスキル伝達のための表現に基づく強化学習
- Authors: Aryan Naveen, Haitong Ma, Haldun Balim, Na Li,
- Abstract要約: RepMT-SACはマルチタスクRLのためのフレームワークであり、効率的な知識共有と新しいタスクへの堅牢な転送を可能にする。
本研究では,RepMT-SACを分布内および分布外領域にまたがるトラジェクトリ追従タスクにおいて評価し,ベースラインを最大30%向上させることを示した。
- 参考スコア(独自算出の注目度): 5.787601808065202
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reinforcement learning has achieved remarkable success in learning complex control policies, yet its applicability remains limited due to sample inefficiency and poor generalization across tasks. In this work, we propose RepMT-SAC, a framework for multi-task RL that enables efficient knowledge sharing and robust transfer to new tasks. RepMT-SAC uses spectral MDP decomposition to capture transferable dynamics, structuring the value function into a task-agnostic core with a minimal task-specific adjustment. This design allows for strong zero-shot performance on in-distribution tasks and rapid few-shot adaptation to out-of-distribution tasks. We evaluate RepMT-SAC on quadcopter trajectory-following tasks across in-distribution and out-of-distribution contexts, demonstrating that it outperforms baselines by up to 30%.
- Abstract(参考訳): 強化学習は複雑な制御ポリシーの学習において顕著な成功を収めてきたが、その適用性は、タスク間の非効率性や一般化の欠如により制限されている。
本研究では,マルチタスクRLのためのフレームワークであるRepMT-SACを提案する。
RepMT-SAC はスペクトル MDP 分解を用いて転送可能なダイナミクスを捕捉し、最小限のタスク固有調整で値関数をタスク非依存のコアに構造化する。
この設計により、分散タスクのゼロショット性能が向上し、分散タスクへの高速な数ショット適応が可能となる。
クワッドコプターの軌道追従作業におけるRepMT-SACの評価を行い,ベースラインを最大30%向上させることを示した。
関連論文リスト
- Bigger, Regularized, Categorical: High-Capacity Value Functions are Efficient Multi-Task Learners [60.75160178669076]
オンライン強化学習におけるタスク干渉の問題に対して,クロスエントロピーを用いて訓練し,学習可能なタスク埋め込みを条件とした高容量値モデルの使用が課題であることを示す。
280以上のユニークなタスクを持つ7つのマルチタスクベンチマークで、高い自由度ヒューマノイド制御と離散視覚ベースのRLにまたがるアプローチを検証した。
論文 参考訳(メタデータ) (2025-05-29T06:41:45Z) - ThanoRA: Task Heterogeneity-Aware Multi-Task Low-Rank Adaptation [96.86211867758652]
Low-Rank Adaptation (LoRA) は、基礎モデルの下流の微調整に広く採用されている。
タスク不均一性を考慮したマルチタスク低ランク適応フレームワークであるTanoRAを提案する。
論文 参考訳(メタデータ) (2025-05-24T11:01:45Z) - Efficient Knowledge Transfer in Multi-Task Learning through Task-Adaptive Low-Rank Representation [11.955971931186006]
事前訓練された言語モデルは、現実世界のアプリケーションでトレーニング中に見つからない新しいタスクに苦しむ。
本稿では,タスク適応型低ランク表現(TA-LoRA)を提案する。
16のタスクの実験では、TA-LoRAがフルデータおよび少数ショット設定で最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-04-20T06:33:19Z) - Multi-Task Reinforcement Learning for Quadrotors [18.71563817810032]
本稿では,四重項制御に適した新しいマルチタスク強化学習(MTRL)フレームワークを提案する。
マルチクリティカルなアーキテクチャと共有タスクエンコーダを用いることで,タスク間の知識伝達を容易にし,単一のポリシで多様な操作を実行することができる。
論文 参考訳(メタデータ) (2024-12-17T01:10:18Z) - Centralized Reward Agent for Knowledge Sharing and Transfer in Multi-Task Reinforcement Learning [13.25661582723752]
本稿では,中央報酬エージェント(CRA)と分散政策エージェントを統合したマルチタスク強化学習フレームワークを提案する。
CRAは知識プールとして機能し、様々なタスクから知識を抽出し、学習効率を向上させるために個別の政策エージェントに配布することを目的としている。
提案手法をMeta-Worldベンチマークを含む離散領域と連続領域の両方で検証する。
論文 参考訳(メタデータ) (2024-08-20T13:49:26Z) - Re-TASK: Revisiting LLM Tasks from Capability, Skill, and Knowledge Perspectives [54.14429346914995]
CoT(Chain-of-Thought)は、大規模言語モデル(LLM)による複雑な問題を解決する重要な方法となっている。
本稿では,LLMタスクを能力,スキル,知識の観点から再考する理論モデルであるRe-TASKフレームワークを紹介する。
多様な領域にわたる実験は、Re-TASKの有効性を示す。
論文 参考訳(メタデータ) (2024-08-13T13:58:23Z) - Efficient Multi-Task Reinforcement Learning via Task-Specific Action Correction [10.388605128396678]
Task-Specific Action Correctionは複数のタスクの同時学習用に設計されている。
ACPは目標指向のスパース報酬を取り入れており、エージェントが長期的な視点を採用することができる。
付加的な報酬は、元の問題を多目的MTRL問題に変換する。
論文 参考訳(メタデータ) (2024-04-09T02:11:35Z) - Meta-Reinforcement Learning Based on Self-Supervised Task Representation
Learning [23.45043290237396]
MoSSは、自己監督型タスク表現学習に基づくコンテキストベースメタ強化学習アルゴリズムである。
MuJoCoとMeta-Worldのベンチマークでは、MoSSはパフォーマンス、サンプル効率(3-50倍高速)、適応効率、一般化の点で先行して性能が向上している。
論文 参考訳(メタデータ) (2023-04-29T15:46:19Z) - Learning Action Translator for Meta Reinforcement Learning on
Sparse-Reward Tasks [56.63855534940827]
本研究は,訓練作業中の行動伝達子を学習するための,新たな客観的機能を導入する。
理論的には、転送されたポリシーとアクショントランスレータの値が、ソースポリシーの値に近似可能であることを検証する。
本稿では,アクショントランスレータとコンテキストベースメタRLアルゴリズムを組み合わせることで,データ収集の効率化と,メタトレーニング時の効率的な探索を提案する。
論文 参考訳(メタデータ) (2022-07-19T04:58:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。