論文の概要: Learning to Compose Hierarchical Object-Centric Controllers for Robotic
Manipulation
- arxiv url: http://arxiv.org/abs/2011.04627v2
- Date: Fri, 13 Nov 2020 20:27:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 00:33:21.354531
- Title: Learning to Compose Hierarchical Object-Centric Controllers for Robotic
Manipulation
- Title(参考訳): ロボット操作のための階層型オブジェクトセントリックコントローラの構成法
- Authors: Mohit Sharma, Jacky Liang, Jialiang Zhao, Alex LaGrassa, Oliver
Kroemer
- Abstract要約: 本稿では、強化学習を用いて、操作タスクのための階層型オブジェクト中心コントローラを構築することを提案する。
シミュレーションと実世界の双方での実験では、提案手法がサンプル効率の向上、ゼロショットの一般化、微調整なしでのシミュレーションと現実の移動にどのように寄与するかが示されている。
- 参考スコア(独自算出の注目度): 26.24940293693809
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Manipulation tasks can often be decomposed into multiple subtasks performed
in parallel, e.g., sliding an object to a goal pose while maintaining contact
with a table. Individual subtasks can be achieved by task-axis controllers
defined relative to the objects being manipulated, and a set of object-centric
controllers can be combined in an hierarchy. In prior works, such combinations
are defined manually or learned from demonstrations. By contrast, we propose
using reinforcement learning to dynamically compose hierarchical object-centric
controllers for manipulation tasks. Experiments in both simulation and real
world show how the proposed approach leads to improved sample efficiency,
zero-shot generalization to novel test environments, and simulation-to-reality
transfer without fine-tuning.
- Abstract(参考訳): 操作タスクは、例えば、テーブルとの接触を維持しながらオブジェクトをゴールポーズにスライドさせるなど、並列に実行される複数のサブタスクに分解されることが多い。
個々のサブタスクは、操作対象に対して定義されたタスク軸コントローラによって達成でき、オブジェクト中心のコントローラのセットを階層構造で組み合わせることができる。
以前の作品では、このような組み合わせは手動で定義され、デモから学習される。
対照的に,強化学習を用いて階層型オブジェクト中心制御器を動的に構成する手法を提案する。
シミュレーションと実世界の両方の実験は、提案手法がサンプル効率の向上、新しいテスト環境へのゼロショットの一般化、微調整なしでのシミュレーションと現実の移動をもたらすことを示す。
関連論文リスト
- Learning Reusable Manipulation Strategies [86.07442931141634]
人間は「トリック」を習得し、一般化する素晴らしい能力を実証する
本稿では,機械が1つの実演と自己演奏によってこのような操作スキルを習得することを可能にするフレームワークを提案する。
これらの学習メカニズムとサンプルは、標準的なタスクやモーションプランナにシームレスに統合できる。
論文 参考訳(メタデータ) (2023-11-06T17:35:42Z) - Kinematic-aware Prompting for Generalizable Articulated Object
Manipulation with LLMs [53.66070434419739]
汎用的なオブジェクト操作は、ホームアシストロボットにとって不可欠である。
本稿では,物体のキネマティックな知識を持つ大規模言語モデルに対して,低レベル動作経路を生成するキネマティック・アウェア・プロンプト・フレームワークを提案する。
我々のフレームワークは8つのカテゴリで従来の手法よりも優れており、8つの未確認対象カテゴリに対して強力なゼロショット能力を示している。
論文 参考訳(メタデータ) (2023-11-06T03:26:41Z) - Learning Extrinsic Dexterity with Parameterized Manipulation Primitives [8.7221770019454]
我々は、オブジェクトのポーズを変えるために環境を利用する一連のアクションを学習する。
我々のアプローチは、オブジェクトとグリップと環境の間の相互作用を利用してオブジェクトの状態を制御することができる。
拘束されたテーブルトップワークスペースから様々な重量,形状,摩擦特性の箱状物体を選別する手法の評価を行った。
論文 参考訳(メタデータ) (2023-10-26T21:28:23Z) - Composite Motion Learning with Task Control [0.6882042556551609]
物理シミュレーション文字に対する合成およびタスク駆動動作制御のための深層学習法を提案する。
我々は,複数の識別器をGANライクな設定で使用することにより,複数の参照動作から,特定の身体部分に対する分離された動作を同時に,直接的に学習する。
本稿では,複合動作模倣と多目的制御の両方を含む多目的課題に対するアプローチの適用性を示す。
論文 参考訳(メタデータ) (2023-05-05T05:02:41Z) - Neural Constraint Satisfaction: Hierarchical Abstraction for
Combinatorial Generalization in Object Rearrangement [75.9289887536165]
基礎となるエンティティを明らかにするための階層的抽象化手法を提案する。
本研究では,エージェントのモデルにおける実体の状態の介入と,環境中の物体に作用する状態の対応関係を学習する方法を示す。
この対応を利用して、オブジェクトの異なる数や構成に一般化する制御法を開発する。
論文 参考訳(メタデータ) (2023-03-20T18:19:36Z) - Dexterous Manipulation from Images: Autonomous Real-World RL via Substep
Guidance [71.36749876465618]
本稿では,ユーザが新しいタスクを定義するための"プログラミング不要"なアプローチを提供する,視覚に基づくデクスタラスな操作システムについて述べる。
本システムには,最終タスクと中間タスクを画像例で定義するためのフレームワークが組み込まれている。
実世界における多段階物体操作の4指ロボットハンドラーによる実験結果
論文 参考訳(メタデータ) (2022-12-19T22:50:40Z) - CLAS: Coordinating Multi-Robot Manipulation with Central Latent Action
Spaces [9.578169216444813]
本稿では,異なるエージェント間で共有される学習された潜在行動空間を通じて,マルチロボット操作を協調する手法を提案する。
シミュレーションされたマルチロボット操作タスクにおいて本手法を検証し,サンプル効率と学習性能の観点から,従来のベースラインよりも改善したことを示す。
論文 参考訳(メタデータ) (2022-11-28T23:20:47Z) - Inferring Versatile Behavior from Demonstrations by Matching Geometric
Descriptors [72.62423312645953]
人間は直感的にタスクを多目的に解決し、軌道に基づく計画や個々のステップの行動を変化させる。
現在のImitation Learningアルゴリズムは、通常、単調な専門家によるデモンストレーションのみを考慮し、状態アクションベースの設定で行動する。
代わりに、移動プリミティブの混合と分布マッチングの目的を組み合わせることで、専門家の行動と汎用性にマッチする多目的行動を学ぶ。
論文 参考訳(メタデータ) (2022-10-17T16:42:59Z) - Learning Sensorimotor Primitives of Sequential Manipulation Tasks from
Visual Demonstrations [13.864448233719598]
本稿では,低レベルポリシーと高レベルポリシーを同時に学習するニューラルネットワークベースの新しいフレームワークについて述べる。
提案手法の重要な特徴は、これらのポリシーがタスクデモの生のビデオから直接学習されることである。
ロボットアームを用いた物体操作タスクの実証実験の結果,提案するネットワークは実際の視覚的な実演から効率よく学習し,タスクを実行することができることがわかった。
論文 参考訳(メタデータ) (2022-03-08T01:36:48Z) - Generalizing Object-Centric Task-Axes Controllers using Keypoints [15.427056235112152]
オブジェクト指向タスクアクスコントローラを構成するモジュール型タスクポリシーを学習する。
これらのタスクアックスコントローラは、シーンの下位オブジェクトに関連付けられたプロパティによってパラメータ化される。
私たちの全体的なアプローチは、操作タスクを学ぶためのシンプルでモジュール化された強力なフレームワークを提供します。
論文 参考訳(メタデータ) (2021-03-18T21:08:00Z) - Goal-Conditioned End-to-End Visuomotor Control for Versatile Skill
Primitives [89.34229413345541]
本稿では,制御器とその条件をエンドツーエンドに学習することで,落とし穴を回避する条件付け手法を提案する。
本モデルでは,ロボットの動きのダイナミックな画像表現に基づいて,複雑な動作シーケンスを予測する。
代表的MPCおよびILベースラインに対するタスク成功の大幅な改善を報告した。
論文 参考訳(メタデータ) (2020-03-19T15:04:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。