論文の概要: Learning compositional models of robot skills for task and motion
planning
- arxiv url: http://arxiv.org/abs/2006.06444v2
- Date: Wed, 5 May 2021 03:00:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 01:15:48.342748
- Title: Learning compositional models of robot skills for task and motion
planning
- Title(参考訳): タスクと動作計画のためのロボットスキルの構成モデル学習
- Authors: Zi Wang, Caelan Reed Garrett, Leslie Pack Kaelbling, and Tom\'as
Lozano-P\'erez
- Abstract要約: センサモレータプリミティブを用いて複雑な長距離操作問題を解決することを学ぶ。
能動的学習とサンプリングに最先端の手法を用いる。
我々は,選択した原始行動の質を計測することで,シミュレーションと実世界の双方でアプローチを評価する。
- 参考スコア(独自算出の注目度): 39.36562555272779
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The objective of this work is to augment the basic abilities of a robot by
learning to use sensorimotor primitives to solve complex long-horizon
manipulation problems. This requires flexible generative planning that can
combine primitive abilities in novel combinations and thus generalize across a
wide variety of problems. In order to plan with primitive actions, we must have
models of the actions: under what circumstances will executing this primitive
successfully achieve some particular effect in the world?
We use, and develop novel improvements on, state-of-the-art methods for
active learning and sampling. We use Gaussian process methods for learning the
constraints on skill effectiveness from small numbers of expensive-to-collect
training examples. Additionally, we develop efficient adaptive sampling methods
for generating a comprehensive and diverse sequence of continuous candidate
control parameter values (such as pouring waypoints for a cup) during planning.
These values become end-effector goals for traditional motion planners that
then solve for a full robot motion that performs the skill. By using learning
and planning methods in conjunction, we take advantage of the strengths of each
and plan for a wide variety of complex dynamic manipulation tasks. We
demonstrate our approach in an integrated system, combining traditional
robotics primitives with our newly learned models using an efficient robot task
and motion planner. We evaluate our approach both in simulation and in the real
world through measuring the quality of the selected primitive actions. Finally,
we apply our integrated system to a variety of long-horizon simulated and
real-world manipulation problems.
- Abstract(参考訳): 本研究の目的は,センサモレータプリミティブを用いて複雑な長距離操作問題を解決することで,ロボットの基本能力を高めることである。
これは、新しい組み合わせで原始的な能力を組み合わせ、様々な問題にまたがって一般化できる柔軟な生成計画を必要とする。
プリミティブなアクションを計画するためには、アクションのモデルが必要です。
アクティブラーニングとサンプリングに最先端の手法を駆使し,新しい改良を展開する。
ガウス過程の手法を用いて,少数の学習例からスキルの有効性の制約を学習する。
さらに,提案手法は,計画中の連続候補制御パラメータ(例えばカップの注ぐ経路点など)の包括的かつ多様なシーケンスを生成するための効率的な適応サンプリング手法を開発する。
これらの価値は、従来のモーションプランナーにとってエンドエフェクターの目標となり、そのスキルを実行する完全なロボットの動きを解決します。
学習方法と計画手法を併用することで,それぞれの強みを活かし,様々な複雑な動的操作タスクを計画する。
従来のロボットプリミティブを,効率的なロボットタスクとモーションプランナを用いて,新たに学習したモデルと組み合わせた統合システムによるアプローチを実証する。
我々は,選択した原始行動の質を計測することで,シミュレーションと実世界の双方でアプローチを評価する。
最後に,本システムを様々な長方形シミュレーションおよび実世界の操作問題に適用する。
関連論文リスト
- HYPERmotion: Learning Hybrid Behavior Planning for Autonomous Loco-manipulation [7.01404330241523]
HYPERmotionは、異なるシナリオのタスクに基づいて行動を学び、選択し、計画するフレームワークである。
強化学習と全身最適化を組み合わせることで,38関節の運動を生成する。
シミュレーションと実世界の実験では、学習した動きが新しいタスクに効率的に適応できることが示されている。
論文 参考訳(メタデータ) (2024-06-20T18:21:24Z) - RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation [68.70755196744533]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。
我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文 参考訳(メタデータ) (2023-11-02T17:59:21Z) - Dexterous Manipulation from Images: Autonomous Real-World RL via Substep
Guidance [71.36749876465618]
本稿では,ユーザが新しいタスクを定義するための"プログラミング不要"なアプローチを提供する,視覚に基づくデクスタラスな操作システムについて述べる。
本システムには,最終タスクと中間タスクを画像例で定義するためのフレームワークが組み込まれている。
実世界における多段階物体操作の4指ロボットハンドラーによる実験結果
論文 参考訳(メタデータ) (2022-12-19T22:50:40Z) - Active Exploration for Robotic Manipulation [40.39182660794481]
本稿では,スパース・リワード型ロボット操作作業における効率的な学習を可能にするモデルに基づく能動探索手法を提案する。
我々は,提案アルゴリズムをシミュレーションおよび実ロボットで評価し,スクラッチから本手法を訓練した。
論文 参考訳(メタデータ) (2022-10-23T18:07:51Z) - Robot Skill Adaptation via Soft Actor-Critic Gaussian Mixture Models [29.34375999491465]
現実の世界で行動する自律的エージェントにとっての中核的な課題は、その騒々しい知覚とダイナミクスに対処するために、そのスキルのレパートリーを適応させることである。
ロングホライズンタスクにスキルの学習を拡大するためには、ロボットは学習し、その後、構造化された方法でスキルを洗練する必要がある。
SAC-GMMは,動的システムを通じてロボットのスキルを学習し,学習したスキルを自身の軌道分布空間に適応させる,新しいハイブリッドアプローチである。
論文 参考訳(メタデータ) (2021-11-25T15:36:11Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z) - Scalable Multi-Task Imitation Learning with Autonomous Improvement [159.9406205002599]
我々は、自律的なデータ収集を通じて継続的に改善できる模倣学習システムを構築している。
我々は、ロボット自身の試行を、実際に試みたタスク以外のタスクのデモとして活用する。
従来の模倣学習のアプローチとは対照的に,本手法は,継続的改善のための疎い監視によるデータ収集を自律的に行うことができる。
論文 参考訳(メタデータ) (2020-02-25T18:56:42Z) - Autonomous Planning Based on Spatial Concepts to Tidy Up Home
Environments with Service Robots [5.739787445246959]
本研究では,確率的生成モデルのパラメータを学習することにより,対象物の順序や位置を効率的に推定できる新しい計画法を提案する。
このモデルにより、ロボットは、Tidied環境で収集されたマルチモーダルセンサ情報を用いて、オブジェクトと場所の共起確率の分布を学習することができる。
我々は,世界ロボットサミット2018国際ロボティクスコンペティションのTidy Up Hereタスクの条件を再現する実験シミュレーションにより,提案手法の有効性を評価する。
論文 参考訳(メタデータ) (2020-02-10T11:49:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。