論文の概要: Bootstrapping Motor Skill Learning with Motion Planning
- arxiv url: http://arxiv.org/abs/2101.04736v1
- Date: Tue, 12 Jan 2021 20:19:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-04 04:36:19.963263
- Title: Bootstrapping Motor Skill Learning with Motion Planning
- Title(参考訳): 運動計画を用いたブートストラップモータスキル学習
- Authors: Ben Abbatematteo, Eric Rosen, Stefanie Tellex, George Konidaris
- Abstract要約: ロボットモーターのスキルをスクラッチから学ぶのは非常に遅いので、実際に人間のデモから得られる優れたスキルポリシーを使って学習をブートストラップで行う必要がある。
物体操作のための運動スキル学習をブートストラップする、完全に自律的なサンプルとして運動計画を用いることを提案する。
- 参考スコア(独自算出の注目度): 17.498549039276437
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning a robot motor skill from scratch is impractically slow; so much so
that in practice, learning must be bootstrapped using a good skill policy
obtained from human demonstration. However, relying on human demonstration
necessarily degrades the autonomy of robots that must learn a wide variety of
skills over their operational lifetimes. We propose using kinematic motion
planning as a completely autonomous, sample efficient way to bootstrap motor
skill learning for object manipulation. We demonstrate the use of motion
planners to bootstrap motor skills in two complex object manipulation scenarios
with different policy representations: opening a drawer with a dynamic movement
primitive representation, and closing a microwave door with a deep neural
network policy. We also show how our method can bootstrap a motor skill for the
challenging dynamic task of learning to hit a ball off a tee, where a kinematic
plan based on treating the scene as static is insufficient to solve the task,
but sufficient to bootstrap a more dynamic policy. In all three cases, our
method is competitive with human-demonstrated initialization, and significantly
outperforms starting with a random policy. This approach enables robots to to
efficiently and autonomously learn motor policies for dynamic tasks without
human demonstration.
- Abstract(参考訳): ロボットモーターのスキルをスクラッチから学ぶのは非常に遅いので、実際に人間のデモから得られる優れたスキルポリシーを使って学習をブートストラップする必要がある。
しかし、人間の実演に頼ると、ロボットの自律性が低下し、運用期間を通じて様々なスキルを身につける必要がある。
物体操作のための運動スキル学習をブートストラップする、完全に自律的なサンプルとして運動計画を用いることを提案する。
本研究では,運動プランナーを用いて,動的運動プリミティブ表現を用いた引き出しの開閉と,ディープニューラルネットワークポリシによるマイクロ波ドアの開閉という,複雑な2つの操作シナリオにおいて,モータスキルのブートストラップを行う。
また,本手法では,静的なシーンを考慮に入れたキネマティック計画では,この課題を解決するには不十分であるが,よりダイナミックなポリシーをブートストラップするには十分であることを示す。
これら3例すべてにおいて,本手法は人為的な初期化と競合し,ランダムなポリシーから始めると著しく優れる。
このアプローチにより、ロボットは人間の実演なしに動的タスクの運動ポリシーを効率的かつ自律的に学習することができる。
関連論文リスト
- SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.14969377419633]
タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。
我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文 参考訳(メタデータ) (2024-10-23T17:42:07Z) - A Central Motor System Inspired Pre-training Reinforcement Learning for Robotic Control [7.227887302864789]
本稿では,CMS-PRLを提案する。
まず、基本的なモータ報酬と相互情報報酬を組み合わせた融合報酬機構を導入する。
第2に,基底神経節の運動プログラムにインスパイアされたスキルエンコーディング手法を設計し,リッチかつ継続的なスキル指導を提供する。
第3に,運動能力の制御のためのスキルアクティビティ機能を提案する。
論文 参考訳(メタデータ) (2023-11-14T00:49:12Z) - Quality-Diversity Optimisation on a Physical Robot Through
Dynamics-Aware and Reset-Free Learning [4.260312058817663]
本研究では,リセットフリーQD(RF-QD)アルゴリズムを用いて,物理ロボット上で直接コントローラを学習する。
本手法は,ロボットと環境との相互作用から学習したダイナミクスモデルを用いて,ロボットの動作を予測する。
RF-QDには、ロボットが外を歩いたときに安全なゾーンに戻すリカバリポリシーも含まれており、継続的な学習を可能にしている。
論文 参考訳(メタデータ) (2023-04-24T13:24:00Z) - Dexterous Manipulation from Images: Autonomous Real-World RL via Substep
Guidance [71.36749876465618]
本稿では,ユーザが新しいタスクを定義するための"プログラミング不要"なアプローチを提供する,視覚に基づくデクスタラスな操作システムについて述べる。
本システムには,最終タスクと中間タスクを画像例で定義するためのフレームワークが組み込まれている。
実世界における多段階物体操作の4指ロボットハンドラーによる実験結果
論文 参考訳(メタデータ) (2022-12-19T22:50:40Z) - Bottom-Up Skill Discovery from Unsegmented Demonstrations for
Long-Horizon Robot Manipulation [55.31301153979621]
我々は,実世界の長距離ロボット操作作業に,スキル発見による取り組みを行う。
未解決のデモンストレーションから再利用可能なスキルのライブラリを学ぶためのボトムアップアプローチを提案する。
提案手法は,多段階操作タスクにおける最先端の模倣学習手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-09-28T16:18:54Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - High Acceleration Reinforcement Learning for Real-World Juggling with
Binary Rewards [35.55280687116388]
学習システムは,ロボットを傷つけることなく,現実世界でジャグリングすることを学ぶことができることを示す。
本システムは,56分間の経験から,高速なバレットWAMマニピュレータで2つのボールをジャグリングすることを可能にした。
最終方針は、最大33分間、または約4500回のキャッチを連続的にジャグリングする。
論文 参考訳(メタデータ) (2020-10-26T11:13:47Z) - Learning compositional models of robot skills for task and motion
planning [39.36562555272779]
センサモレータプリミティブを用いて複雑な長距離操作問題を解決することを学ぶ。
能動的学習とサンプリングに最先端の手法を用いる。
我々は,選択した原始行動の質を計測することで,シミュレーションと実世界の双方でアプローチを評価する。
論文 参考訳(メタデータ) (2020-06-08T20:45:34Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。