Fugu-MT 論文翻訳(概要): LEAGUE: Guided Skill Learning and Abstraction for Long-Horizon Manipulation

論文の概要: LEAGUE: Guided Skill Learning and Abstraction for Long-Horizon Manipulation

arxiv url: http://arxiv.org/abs/2210.12631v2
Date: Tue, 22 Aug 2023 03:20:18 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-23 15:07:48.807884
Title: LEAGUE: Guided Skill Learning and Abstraction for Long-Horizon Manipulation
Title（参考訳）: LEAGUE:長距離マニピュレーションのための指導的スキル学習と抽象化
Authors: Shuo Cheng and Danfei Xu
Abstract要約: タスク・アンド・モーション・プランニングのアプローチは、長期にわたるタスクの解決と一般化に長けている。彼らは事前に定義されたスキルセットを仮定し、現実世界のアプリケーションを制限する。本稿ではLEAGUEというタスク計画とスキル学習フレームワークを提案する。学習スキルは、新しいタスク領域での学習を加速し、物理的なロボットプラットフォームに移行するために再利用できることを示す。
参考スコア（独自算出の注目度）: 16.05029027561921
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: To assist with everyday human activities, robots must solve complex long-horizon tasks and generalize to new settings. Recent deep reinforcement learning (RL) methods show promise in fully autonomous learning, but they struggle to reach long-term goals in large environments. On the other hand, Task and Motion Planning (TAMP) approaches excel at solving and generalizing across long-horizon tasks, thanks to their powerful state and action abstractions. But they assume predefined skill sets, which limits their real-world applications. In this work, we combine the benefits of these two paradigms and propose an integrated task planning and skill learning framework named LEAGUE (Learning and Abstraction with Guidance). LEAGUE leverages the symbolic interface of a task planner to guide RL-based skill learning and creates abstract state space to enable skill reuse. More importantly, LEAGUE learns manipulation skills in-situ of the task planning system, continuously growing its capability and the set of tasks that it can solve. We evaluate LEAGUE on four challenging simulated task domains and show that LEAGUE outperforms baselines by large margins. We also show that the learned skills can be reused to accelerate learning in new tasks domains and transfer to a physical robot platform.
Abstract（参考訳）: 日常的な人間の活動を支援するためには、ロボットは複雑な長距離タスクを解決し、新しい設定に一般化する必要がある。近年の深層強化学習(RL)手法は完全自律学習において有望であるが,大規模環境における長期的な目標達成に苦慮している。一方、タスク・アンド・モーション・プランニング(TAMP)のアプローチは、その強力な状態とアクションの抽象化のおかげで、長期にわたるタスクの解決と一般化に優れています。しかし、彼らは事前に定義されたスキルセットを仮定し、現実のアプリケーションを制限する。本研究では,これら2つのパラダイムのメリットを組み合わせて,LEAGUE(Learning and Abstraction with Guidance)というタスク計画とスキル学習フレームワークを提案する。 LEAGUEは、タスクプランナの象徴的なインターフェースを活用して、RLベースのスキル学習をガイドし、スキル再利用を可能にする抽象状態空間を作成する。さらに重要なこととして、LEAGUEはタスク計画システムの操作スキルを学び、その能力と解決可能なタスクセットを継続的に拡大する。 LEAGUEを4つの課題領域上で評価し、LEAGUEがベースラインを大きなマージンで上回ることを示す。また、学習スキルを再利用して、新しいタスク領域での学習を加速し、物理的なロボットプラットフォームに移行できることも示します。

関連論文リスト

Continually Evolving Skill Knowledge in Vision Language Action Model [23.63528439700931]
オープン環境における汎用ロボットインテリジェンスの開発には,継続的なスキル学習が必要である。本稿では,タスク中心の知識空間をモデル化するT-Stellarと,階層的なタスクスキル構造を捉えるTS-Stellarという,知識駆動型連続学習フレームワークであるStellar VLAを提案する。 LIBEROベンチマークと実世界のタスクの実験は、ベースラインに対する最終成功率の平均50%以上の改善を示している。
論文参考訳（メタデータ） (2025-11-22T15:00:08Z)
SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.14969377419633]
タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文参考訳（メタデータ） (2024-10-23T17:42:07Z)
CurricuLLM: Automatic Task Curricula Design for Learning Complex Robot Skills using Large Language Models [19.73329768987112]
CurricuLLMは複雑なロボット制御タスクのためのカリキュラム学習ツールである。自然言語形式のタスク学習を支援するサブタスクを生成する。また、サブタスクの自然言語記述を実行可能なコードに変換する。 CurricuLLMは複雑なロボット制御タスクの学習を支援する。
論文参考訳（メタデータ） (2024-09-27T01:48:16Z)
Plan-Seq-Learn: Language Model Guided RL for Solving Long Horizon Robotics Tasks [50.27313829438866]
Plan-Seq-Learn (PSL) は、抽象言語と学習した低レベル制御の間のギャップを埋めるためにモーションプランニングを使用するモジュラーアプローチである。 PSLは85%以上の成功率、言語ベース、古典的、エンドツーエンドのアプローチを達成している。
論文参考訳（メタデータ） (2024-05-02T17:59:31Z)
Efficient Learning of High Level Plans from Play [57.29562823883257]
本稿では,移動計画と深いRLを橋渡しするロボット学習のフレームワークであるELF-Pについて紹介する。 ELF-Pは、複数の現実的な操作タスクよりも、関連するベースラインよりもはるかに優れたサンプル効率を有することを示す。
論文参考訳（メタデータ） (2023-03-16T20:09:47Z)
Learning Temporally Extended Skills in Continuous Domains as Symbolic Actions for Planning [2.642698101441705]
長期計画と継続的な制御能力の両方を必要とする問題は、既存の強化学習エージェントに重大な課題をもたらす。本稿では,環境の計画状態の象徴的抽象化において,継続的制御のための時間的拡張スキルとフォワードモデルとをリンクする新しい階層型強化学習エージェントを提案する。
論文参考訳（メタデータ） (2022-07-11T17:13:10Z)
Skill-based Meta-Reinforcement Learning [65.31995608339962]
本研究では,長期的スパース・リワードタスクにおけるメタラーニングを実現する手法を提案する。私たちの中核となる考え方は、メタ学習中にオフラインデータセットから抽出された事前経験を活用することです。
論文参考訳（メタデータ） (2022-04-25T17:58:19Z)
Example-Driven Model-Based Reinforcement Learning for Solving Long-Horizon Visuomotor Tasks [85.56153200251713]
長軸ビズモータタスクの完了に適したプリミティブスキルを学習するためのモデルベースRL手法EMBRを紹介する。フランカ・エミカのロボットアームでは、EMBRによってロボットは85%の成功率で3つの長い水平視運動タスクを完了できることがわかった。
論文参考訳（メタデータ） (2021-09-21T16:48:07Z)
MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale [103.7609761511652]
大規模集団ロボット学習システムが,行動のレパートリーを同時に獲得できることを示す。新しいタスクは、以前学んだタスクから継続的にインスタンス化できる。我々は,7台のロボットから収集したデータを用いて,実世界のタスク12組でシステムを訓練し,評価する。
論文参考訳（メタデータ） (2021-04-16T16:38:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。