論文の概要: Residual Learning from Demonstration: Adapting DMPs for Contact-rich
Manipulation
- arxiv url: http://arxiv.org/abs/2008.07682v5
- Date: Tue, 22 Mar 2022 17:43:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 21:58:40.664800
- Title: Residual Learning from Demonstration: Adapting DMPs for Contact-rich
Manipulation
- Title(参考訳): デモから学ぶ:コンタクトリッチマニピュレーションのためのDMP適応
- Authors: Todor Davchev, Kevin Sebastian Luck, Michael Burke, Franziska Meier,
Stefan Schaal, Subramanian Ramamoorthy
- Abstract要約: そこで本研究では,ロボットがこのようなスキルを習得する方法を,Pig-in-holeのような挿入に応用した。
本稿では,動的運動プリミティブと強化学習を組み合わせたフレームワークであるResternal Learning from Demonstration (rLfD)を提案する。
- 参考スコア(独自算出の注目度): 23.3501111853443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Manipulation skills involving contact and friction are inherent to many
robotics tasks. Using the class of motor primitives for peg-in-hole like
insertions, we study how robots can learn such skills. Dynamic Movement
Primitives (DMP) are a popular way of extracting such policies through
behaviour cloning (BC) but can struggle in the context of insertion. Policy
adaptation strategies such as residual learning can help improve the overall
performance of policies in the context of contact-rich manipulation. However,
it is not clear how to best do this with DMPs. As a result, we consider several
possible ways for adapting a DMP formulation and propose ``residual Learning
from Demonstration`` (rLfD), a framework that combines DMPs with Reinforcement
Learning (RL) to learn a residual correction policy. Our evaluations suggest
that applying residual learning directly in task space and operating on the
full pose of the robot can significantly improve the overall performance of
DMPs. We show that rLfD offers a gentle to the joints solution that improves
the task success and generalisation of DMPs \rb{and enables transfer to
different geometries and frictions through few-shot task adaptation}. The
proposed framework is evaluated on a set of tasks. A simulated robot and a
physical robot have to successfully insert pegs, gears and plugs into their
respective sockets. Other material and videos accompanying this paper are
provided at https://sites.google.com/view/rlfd/.
- Abstract(参考訳): 接触と摩擦を伴う操作スキルは、多くのロボティクスタスクに固有のものだ。
モータープリミティブのクラスを使って、ロボットがいかにそのようなスキルを身につけるかを研究する。
動的運動プリミティブ(Dynamic Movement Primitives, DMP)は、行動クローニング(BC)を通じてこのようなポリシーを抽出する一般的な方法であるが、挿入の文脈では困難である。
残差学習のようなポリシー適応戦略は、コンタクトが多い操作の文脈におけるポリシーの全体的なパフォーマンスを改善するのに役立つ。
しかし、DMPでこれを最もよく行う方法は不明である。
その結果、DMPの定式化に適応するためのいくつかの方法を検討し、DMPと強化学習(Reinforcement Learning, RL)を組み合わせるフレームワークである ``residual Learning from Demonstration`` (rLfD)を提案する。
本評価は,タスク空間に直接残差学習を適用し,ロボットのフルポーズで操作することで,DMPの全体的な性能を著しく向上できることを示す。
我々は、rLfDが、DMPs \rb{and>のタスク成功と一般化を改善するジョイントソリューションに優しく、数ショットのタスク適応を通じて異なるジオメトリや摩擦への移行を可能にすることを示す。
提案するフレームワークはタスクセットに基づいて評価される。
シミュレーションロボットと物理ロボットは、それぞれのソケットにペグ、ギア、プラグを挿入することに成功した。
その他の資料やビデオはhttps://sites.google.com/view/rlfd/で提供されている。
関連論文リスト
- Hand-Object Interaction Pretraining from Videos [77.92637809322231]
我々は,3次元ハンドオブジェクトインタラクショントラジェクトリから,一般的なロボット操作を学習する。
人間の手と操作された物体を3D空間で共有し、人間の動きをロボットの動きと共有する。
我々は、このポリシーを、強化学習(RL)と行動クローニング(BC)の両方で微調整することで、下流タスクへのサンプル効率の適応を可能にし、従来のアプローチと比較して堅牢性と一般化性を同時に改善できることを実証的に実証した。
論文 参考訳(メタデータ) (2024-09-12T17:59:07Z) - Movement Primitive Diffusion: Learning Gentle Robotic Manipulation of Deformable Objects [14.446751610174868]
運動原始拡散(英: Movement Primitive Diffusion、MPD)は、ロボット支援手術における模倣学習(IL)の新しい手法である。
MPDは拡散型模倣学習(DIL)の汎用性と確率的動特性プリミティブ(ProDMP)の高品質な運動生成能力を組み合わせる
実世界および実世界の様々なロボット作業におけるMPDの評価を,状態観察と画像観察の両方で行う。
論文 参考訳(メタデータ) (2023-12-15T18:24:28Z) - Robotic Handling of Compliant Food Objects by Robust Learning from
Demonstration [79.76009817889397]
本稿では,食品に適合する物体をロボットで把握する上で,実証からの学習(LfD)に基づく頑健な学習方針を提案する。
教師の意図した方針を推定し,無矛盾な実演を自動的に除去するLfD学習ポリシーを提案する。
提案されたアプローチは、前述の業界セクターで幅広い応用が期待できる。
論文 参考訳(メタデータ) (2023-09-22T13:30:26Z) - Accelerating Robot Learning of Contact-Rich Manipulations: A Curriculum
Learning Study [4.045850174820418]
本稿では,Domain Randomization(DR)と組み合わせたカリキュラム学習に基づく,コンタクトリッチな操作タスクのロボット学習の高速化に関する研究を行う。
挿入タスクのような位置制御ロボットによる複雑な産業組み立てタスクに対処する。
また,おもちゃのタスクを用いたシミュレーションでのみトレーニングを行う場合においても,現実のロボットに伝達可能なポリシーを学習できることが示唆された。
論文 参考訳(メタデータ) (2022-04-27T11:08:39Z) - Robot Learning of Mobile Manipulation with Reachability Behavior Priors [38.49783454634775]
モバイルマニピュレーション(MM)システムは、非構造化現実環境におけるパーソナルアシスタントの役割を引き継ぐ上で理想的な候補である。
その他の課題として、MMは移動性と操作性の両方を必要とするタスクを実行するために、ロボットの実施形態を効果的に調整する必要がある。
本研究では,アクタ批判的RL手法におけるロボットの到達可能性の先行性の統合について検討した。
論文 参考訳(メタデータ) (2022-03-08T12:44:42Z) - Learning of Parameters in Behavior Trees for Movement Skills [0.9562145896371784]
振舞い木(BT)は、モジュラーと構成可能なスキルをサポートするポリシー表現を提供することができる。
本稿では,BTポリシーのパラメータをシミュレーションで学習し,追加のトレーニングを伴わずに物理ロボットに一般化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-27T13:46:39Z) - A Framework for Efficient Robotic Manipulation [79.10407063260473]
単一のロボットアームがピクセルからスパースリワード操作ポリシーを学習できることを示します。
デモは10回しかなく、単一のロボットアームがピクセルからスパースリワード操作のポリシーを学習できることを示しています。
論文 参考訳(メタデータ) (2020-12-14T22:18:39Z) - Human-in-the-Loop Imitation Learning using Remote Teleoperation [72.2847988686463]
6-DoF操作設定に合わせたデータ収集システムを構築します。
システムによって収集された新しいデータに基づいて,ポリシーを反復的にトレーニングするアルゴリズムを開発した。
介入型システムで収集したデータに基づいて訓練されたエージェントと、非介入型デモ参加者が収集した同等数のサンプルで訓練されたアルゴリズムを上回るエージェントを実証する。
論文 参考訳(メタデータ) (2020-12-12T05:30:35Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Meta-Reinforcement Learning for Robotic Industrial Insertion Tasks [70.56451186797436]
本研究では,メタ強化学習を用いてシミュレーションの課題の大部分を解決する方法について検討する。
エージェントを訓練して現実の挿入タスクを成功させる手法を実証する。
論文 参考訳(メタデータ) (2020-04-29T18:00:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。