論文の概要: Learning to Grasp the Ungraspable with Emergent Extrinsic Dexterity
- arxiv url: http://arxiv.org/abs/2211.01500v1
- Date: Wed, 2 Nov 2022 22:09:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-04 12:52:15.169219
- Title: Learning to Grasp the Ungraspable with Emergent Extrinsic Dexterity
- Title(参考訳): 創発的デキスタリティを生かした無重力重力の学習
- Authors: Wenxuan Zhou, David Held
- Abstract要約: 単純なグリッパーは、外部環境を活用できれば、より複雑な操作タスクを解決できる。
これらの制約に対処するための強化学習に基づくシステムを開発する。
これは、様々な大きさ、密度、表面摩擦、形状を78%の成功率で一般化するシンプルなグリップで、動的で接触に富んだ動きを示す。
- 参考スコア(独自算出の注目度): 22.01389127145982
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A simple gripper can solve more complex manipulation tasks if it can utilize
the external environment such as pushing the object against the table or a
vertical wall, known as "Extrinsic Dexterity." Previous work in extrinsic
dexterity usually has careful assumptions about contacts which impose
restrictions on robot design, robot motions, and the variations of the physical
parameters. In this work, we develop a system based on reinforcement learning
(RL) to address these limitations. We study the task of "Occluded Grasping"
which aims to grasp the object in configurations that are initially occluded;
the robot needs to move the object into a configuration from which these grasps
can be achieved. We present a system with model-free RL that successfully
achieves this task using a simple gripper with extrinsic dexterity. The policy
learns emergent behaviors of pushing the object against the wall to rotate and
then grasp it without additional reward terms on extrinsic dexterity. We
discuss important components of the system including the design of the RL
problem, multi-grasp training and selection, and policy generalization with
automatic curriculum. Most importantly, the policy trained in simulation is
zero-shot transferred to a physical robot. It demonstrates dynamic and
contact-rich motions with a simple gripper that generalizes across objects with
various size, density, surface friction, and shape with a 78% success rate.
Videos can be found at https://sites.google.com/view/grasp-ungraspable/.
- Abstract(参考訳): 単純なグリッパーは、テーブルにオブジェクトを押したり、"Extrinsic Dexterity"と呼ばれる垂直の壁を押したりといった外部環境を活用できれば、より複雑な操作タスクを解決できる。
これまでは、ロボットの設計、ロボットの動き、および物理的なパラメータの変動に制限を課す接触について慎重に仮定されていた。
本研究では,これらの制約に対処する強化学習(RL)に基づくシステムを開発する。
ロボットは物体を把握可能な形状に移動させる必要があるため,物体を最初に把握した形状で把握することを目的とした"occluded grabing"の課題について検討する。
本稿では,モデルフリーなRLを用いたデキスタリティを持つ単純なグリップを用いて,このタスクを成功させるシステムを提案する。
このポリシーは、物体を壁に向けて回転させ、外在性に関する追加の報酬条件なしでそれを把握するという創発的な行動を学ぶ。
本稿では,rl問題の設計,多面的訓練選択,政策一般化など,システムの重要な要素を自動カリキュラムで検討する。
最も重要なのは、シミュレーションで訓練されたポリシーは、物理ロボットにゼロショットで転送されることだ。
これは、様々な大きさ、密度、表面摩擦、形状を78%の成功率で一般化するシンプルなグリッパーで、ダイナミックで接触の多い動きを示す。
ビデオはhttps://sites.google.com/view/grasp-ungraspable/で見ることができる。
関連論文リスト
- HACMan++: Spatially-Grounded Motion Primitives for Manipulation [28.411361363637006]
本稿では,HACMan++における空間的パラメータ化動作プリミティブについて紹介する。
環境中の空間的位置にプリミティブを接地することで、オブジェクトの形状を効果的に一般化し、バリエーションを表現できる。
提案手法は既存の手法,特に高レベルシーケンシャル推論とオブジェクト一般化の両方を必要とする複雑なシナリオにおいて,優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-07-11T15:10:14Z) - Grasp Anything: Combining Teacher-Augmented Policy Gradient Learning with Instance Segmentation to Grasp Arbitrary Objects [18.342569823885864]
TAPG(Teacher-Augmented Policy Gradient)は、強化学習と政策蒸留を統括する新しい2段階学習フレームワークである。
TAPGは、オブジェクトセグメンテーションに基づいて、誘導的かつ適応的でありながら、センセータポリシーの学習を促進する。
トレーニングされたポリシーは、シミュレーションにおける散らかったシナリオや、人間の理解可能なプロンプトに基づいて現実世界から、多種多様なオブジェクトを順応的に把握する。
論文 参考訳(メタデータ) (2024-03-15T10:48:16Z) - Learning Extrinsic Dexterity with Parameterized Manipulation Primitives [8.7221770019454]
我々は、オブジェクトのポーズを変えるために環境を利用する一連のアクションを学習する。
我々のアプローチは、オブジェクトとグリップと環境の間の相互作用を利用してオブジェクトの状態を制御することができる。
拘束されたテーブルトップワークスペースから様々な重量,形状,摩擦特性の箱状物体を選別する手法の評価を行った。
論文 参考訳(メタデータ) (2023-10-26T21:28:23Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Decoupling Skill Learning from Robotic Control for Generalizable Object
Manipulation [35.34044822433743]
ロボット操作の最近の研究は、様々なタスクに取り組む可能性を示している。
これは関節制御のための高次元の作用空間によるものであると推測する。
本稿では,「何をすべきか」を「どうやるか」から「どうやるか」を学習するタスクを,別のアプローチで分離する。
ロボットキネマティック・コントロールは、作業空間のゴールに到達するために高次元の関節運動を実行するように最適化されている。
論文 参考訳(メタデータ) (2023-03-07T16:31:13Z) - Hindsight States: Blending Sim and Real Task Elements for Efficient
Reinforcement Learning [61.3506230781327]
ロボット工学では、第一原理から導かれた力学モデルに基づくシミュレーションに基づいて、トレーニングデータを生成する方法がある。
ここでは、力学の複雑さの不均衡を利用して、より標本効率のよい学習を行う。
提案手法をいくつかの課題に対して検証し,既存の近視アルゴリズムと組み合わせた場合の学習改善を実証する。
論文 参考訳(メタデータ) (2023-03-03T21:55:04Z) - DexTransfer: Real World Multi-fingered Dexterous Grasping with Minimal
Human Demonstrations [51.87067543670535]
本研究では,少数の人間によるデモンストレーションを行い,見えない物体のポーズを学習するロボット学習システムを提案する。
我々は,物体の点群を入力として捉え,物体を異なる初期ロボット状態から把握するための連続的な動作を予測する,厳密な把握ポリシーを訓練する。
我々のデータセットから学んだポリシーは、シミュレーションと現実世界の両方で見えないオブジェクトのポーズをうまく一般化することができる。
論文 参考訳(メタデータ) (2022-09-28T17:51:49Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - A Differentiable Recipe for Learning Visual Non-Prehensile Planar
Manipulation [63.1610540170754]
視覚的非包括的平面操作の問題に焦点をあてる。
本稿では,ビデオデコードニューラルモデルと接触力学の先行情報を組み合わせた新しいアーキテクチャを提案する。
モジュラーで完全に差別化可能なアーキテクチャは、目に見えないオブジェクトやモーションの学習専用手法よりも優れていることが分かりました。
論文 参考訳(メタデータ) (2021-11-09T18:39:45Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - COCOI: Contact-aware Online Context Inference for Generalizable
Non-planar Pushing [87.7257446869134]
一般的なコンタクトリッチな操作問題は、ロボット工学における長年の課題である。
深層強化学習は、ロボット操作タスクの解決に大きな可能性を示している。
動的プロパティのコンテキスト埋め込みをオンラインにエンコードする深層RL法であるCOCOIを提案する。
論文 参考訳(メタデータ) (2020-11-23T08:20:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。