論文の概要: Cascaded Compositional Residual Learning for Complex Interactive
Behaviors
- arxiv url: http://arxiv.org/abs/2212.08954v1
- Date: Sat, 17 Dec 2022 21:18:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 18:42:35.843661
- Title: Cascaded Compositional Residual Learning for Complex Interactive
Behaviors
- Title(参考訳): 複合的対話行動のためのカスケード構成残差学習
- Authors: K. Niranjan Kumar and Irfan Essa and Sehoon Ha
- Abstract要約: 本稿では,CCRL(Cascaded Compositional Residual Learning)という新しいフレームワークを提案する。
本フレームワークは, 前提条件を凍結しながら, 乗法的ポリシー構成, タスク固有の残留行動, および合成目標情報を同時に学習する。
本稿では,基本的な移動から複雑な対話的ナビゲーションに至るまで,多様な運動能力のセットに対して,協調レベルの制御ポリシを学習することを示す。
- 参考スコア(独自算出の注目度): 15.295232080533072
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-world autonomous missions often require rich interaction with nearby
objects, such as doors or switches, along with effective navigation. However,
such complex behaviors are difficult to learn because they involve both
high-level planning and low-level motor control. We present a novel framework,
Cascaded Compositional Residual Learning (CCRL), which learns composite skills
by recursively leveraging a library of previously learned control policies. Our
framework learns multiplicative policy composition, task-specific residual
actions, and synthetic goal information simultaneously while freezing the
prerequisite policies. We further explicitly control the style of the motion by
regularizing residual actions. We show that our framework learns joint-level
control policies for a diverse set of motor skills ranging from basic
locomotion to complex interactive navigation, including navigating around
obstacles, pushing objects, crawling under a table, pushing a door open with
its leg, and holding it open while walking through it. The proposed CCRL
framework leads to policies with consistent styles and lower joint torques,
which we successfully transfer to a real Unitree A1 robot without any
additional fine-tuning.
- Abstract(参考訳): 現実の自律ミッションは、ドアやスイッチなどの近くの物体とのリッチな相互作用と効果的なナビゲーションを必要とすることが多い。
しかし、そのような複雑な行動は高レベル計画と低レベルモータ制御の両方を含むため、学習が困難である。
本稿では,以前に学習した制御ポリシのライブラリを再活用することにより,合成スキルを学習する新しいフレームワークCCRLを提案する。
本フレームワークは,前提条件を凍結しながら,乗法的ポリシー構成,タスク固有の残留行動,および合成目標情報を同時に学習する。
残留動作を規則化することにより、運動のスタイルをさらに明示的に制御する。
本フレームワークは,障害物回避,物体の押下,テーブルの下をクロールする,ドアを脚で開ける,開閉するなど,基本的な移動から複雑な対話的ナビゲーションに至るまで,さまざまな運動スキルのジョイントレベル制御ポリシを学習する。
提案したCCRLフレームワークは、一貫したスタイルと低い関節トルクを持つポリシーを導いており、追加の微調整をせずに本物のUnitree A1ロボットに転送することに成功している。
関連論文リスト
- Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Composite Motion Learning with Task Control [0.6882042556551609]
物理シミュレーション文字に対する合成およびタスク駆動動作制御のための深層学習法を提案する。
我々は,複数の識別器をGANライクな設定で使用することにより,複数の参照動作から,特定の身体部分に対する分離された動作を同時に,直接的に学習する。
本稿では,複合動作模倣と多目的制御の両方を含む多目的課題に対するアプローチの適用性を示す。
論文 参考訳(メタデータ) (2023-05-05T05:02:41Z) - Policy Architectures for Compositional Generalization in Control [71.61675703776628]
本稿では,タスクにおけるエンティティベースの構成構造をモデル化するためのフレームワークを提案する。
私たちのポリシーは柔軟で、アクションプリミティブを必要とせずにエンドツーエンドでトレーニングできます。
論文 参考訳(メタデータ) (2022-03-10T06:44:24Z) - Distilling Motion Planner Augmented Policies into Visual Control
Policies for Robot Manipulation [26.47544415550067]
我々は,国家ベースのモーションプランナ拡張ポリシーを視覚制御ポリシーに蒸留することを提案する。
閉塞環境における3つの操作課題について評価を行った。
我々のフレームワークはサンプリング効率が高く、最先端のアルゴリズムよりも優れています。
論文 参考訳(メタデータ) (2021-11-11T18:52:00Z) - Multi-lane Cruising Using Hierarchical Planning and Reinforcement
Learning [3.7438459768783794]
マルチレーンの巡航には、車線変更と車線内操作を用い、良好な速度を達成し、安全を維持する必要がある。
本稿では,階層型強化学習フレームワークと新しい状態-作用空間抽象化を組み合わせることで,自律型マルチレーンクルーズの設計を提案する。
論文 参考訳(メタデータ) (2021-10-01T21:03:39Z) - Composable Learning with Sparse Kernel Representations [110.19179439773578]
再生カーネルヒルベルト空間におけるスパース非パラメトリック制御系を学習するための強化学習アルゴリズムを提案する。
正規化アドバンテージ関数を通じてステートアクション関数の構造を付与することにより、このアプローチのサンプル複雑さを改善します。
2次元環境下を走行しながらレーザースキャナーを搭載したロボットの複数シミュレーションにおける障害物回避政策の学習に関するアルゴリズムの性能を実証する。
論文 参考訳(メタデータ) (2021-03-26T13:58:23Z) - Towards Coordinated Robot Motions: End-to-End Learning of Motion
Policies on Transform Trees [63.31965375413414]
人間による実証から構造化政策を学習し、マルチタスクの課題解決を提案します。
我々の構造化ポリシーは、異なる空間におけるサブタスクポリシーを組み合わせるためのフレームワークであるRMPflowにインスパイアされている。
マルチタスク問題に適したエンドツーエンドの学習目標関数を導き出します。
論文 参考訳(メタデータ) (2020-12-24T22:46:22Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Robot Navigation in Constrained Pedestrian Environments using
Reinforcement Learning [32.454250811667904]
歩行者のまわりをスムーズに移動することは、人間環境に展開する移動ロボットに必要な能力である。
移動歩行者の存在に動的に適応できる政策を学習するための強化学習に基づくアプローチを提案する。
2つの実環境の3D再構成に学習方針の移転を示す。
論文 参考訳(メタデータ) (2020-10-16T19:40:08Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。