論文の概要: SkillMimicGen: Automated Demonstration Generation for Efficient Skill Learning and Deployment
- arxiv url: http://arxiv.org/abs/2410.18907v1
- Date: Thu, 24 Oct 2024 16:59:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-25 12:51:43.824954
- Title: SkillMimicGen: Automated Demonstration Generation for Efficient Skill Learning and Deployment
- Title(参考訳): SkillMimicGen: 効率的なスキル学習とデプロイのための自動デモ生成
- Authors: Caelan Garrett, Ajay Mandlekar, Bowen Wen, Dieter Fox,
- Abstract要約: 人間のデモからデモデータセットを生成する自動システムであるSkillMimicGenを提案する。
SkillGenは人間のデモを操作スキルに分割し、これらのスキルを新しいコンテキストに適応させ、自由空間の移動と移動運動を通じてそれらを縫い合わせる。
SkillGenの有効性は、わずか60個のヒトのデモンストレーションから18のタスク変種に24K以上のデモを生成して実証する。
- 参考スコア(独自算出の注目度): 33.53559296053225
- License:
- Abstract: Imitation learning from human demonstrations is an effective paradigm for robot manipulation, but acquiring large datasets is costly and resource-intensive, especially for long-horizon tasks. To address this issue, we propose SkillMimicGen (SkillGen), an automated system for generating demonstration datasets from a few human demos. SkillGen segments human demos into manipulation skills, adapts these skills to new contexts, and stitches them together through free-space transit and transfer motion. We also propose a Hybrid Skill Policy (HSP) framework for learning skill initiation, control, and termination components from SkillGen datasets, enabling skills to be sequenced using motion planning at test-time. We demonstrate that SkillGen greatly improves data generation and policy learning performance over a state-of-the-art data generation framework, resulting in the capability to produce data for large scene variations, including clutter, and agents that are on average 24% more successful. We demonstrate the efficacy of SkillGen by generating over 24K demonstrations across 18 task variants in simulation from just 60 human demonstrations, and training proficient, often near-perfect, HSP agents. Finally, we apply SkillGen to 3 real-world manipulation tasks and also demonstrate zero-shot sim-to-real transfer on a long-horizon assembly task. Videos, and more at https://skillgen.github.io.
- Abstract(参考訳): 人間のデモンストレーションからの模倣学習は、ロボット操作に有効なパラダイムであるが、大規模なデータセットの取得はコストが高く、リソース集約的であり、特に長期的タスクには有効である。
この問題に対処するために、数個の人間デモからデモデータセットを生成する自動システムであるSkillMimicGen(SkillGen)を提案する。
SkillGenは人間のデモを操作スキルに分割し、これらのスキルを新しいコンテキストに適応させ、自由空間の移動と移動運動を通じてそれらを縫い合わせる。
また,SkillGenデータセットからスキル開始,制御,終了コンポーネントを学習するためのHybrid Skill Policy (HSP) フレームワークを提案する。
我々は、SkillGenが最先端のデータ生成フレームワークよりもデータ生成とポリシー学習の性能を大幅に向上させ、その結果、乱れや平均24%以上の成功率を持つエージェントを含む大きなシーン変動のためのデータを生成することができることを示した。
SkillGenの有効性は、わずか60のヒトのデモンストレーションからシミュレーションにおいて18のタスク変種に24K以上のデモを生成し、熟練した、しばしばほぼ完全に近いHSPエージェントを訓練することによって実証する。
最後に,SkillGenを3つの実世界の操作タスクに適用し,長時間の組立タスクに対してゼロショットのsim-to-real転送を示す。
ビデオはhttps://skillgen.github.io.comで公開されている。
関連論文リスト
- RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation [68.70755196744533]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。
我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文 参考訳(メタデータ) (2023-11-02T17:59:21Z) - Gen2Sim: Scaling up Robot Learning in Simulation with Generative Models [17.757495961816783]
Gen2Simは、3Dアセット、タスク記述、タスク分解、報酬関数の自動生成によるシミュレーションにおけるロボットスキル学習のスケールアップ方法である。
私たちの研究は、シミュレーションにおける完全に自律的なロボット操作スキル獲得に向けて、何百ものシミュレーション資産、タスク、デモに貢献しています。
論文 参考訳(メタデータ) (2023-10-27T17:55:32Z) - MimicGen: A Data Generation System for Scalable Robot Learning using
Human Demonstrations [55.549956643032836]
MimicGenは、少数の人間のデモから大規模でリッチなデータセットを自動的に合成するシステムである。
ロボットエージェントは,この生成したデータセットを模倣学習により効果的に訓練し,長期的・高精度なタスクにおいて高い性能を達成することができることを示す。
論文 参考訳(メタデータ) (2023-10-26T17:17:31Z) - RH20T: A Comprehensive Robotic Dataset for Learning Diverse Skills in
One-Shot [56.130215236125224]
オープンドメインでのロボット操作における重要な課題は、ロボットの多様性と一般化可能なスキルの獲得方法である。
単発模倣学習の最近の研究は、訓練されたポリシーを実証に基づく新しいタスクに移行する可能性を示唆している。
本稿では,エージェントがマルチモーダルな知覚で数百の現実世界のスキルを一般化する可能性を解き放つことを目的とする。
論文 参考訳(メタデータ) (2023-07-02T15:33:31Z) - Bottom-Up Skill Discovery from Unsegmented Demonstrations for
Long-Horizon Robot Manipulation [55.31301153979621]
我々は,実世界の長距離ロボット操作作業に,スキル発見による取り組みを行う。
未解決のデモンストレーションから再利用可能なスキルのライブラリを学ぶためのボトムアップアプローチを提案する。
提案手法は,多段階操作タスクにおける最先端の模倣学習手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-09-28T16:18:54Z) - A Framework for Efficient Robotic Manipulation [79.10407063260473]
単一のロボットアームがピクセルからスパースリワード操作ポリシーを学習できることを示します。
デモは10回しかなく、単一のロボットアームがピクセルからスパースリワード操作のポリシーを学習できることを示しています。
論文 参考訳(メタデータ) (2020-12-14T22:18:39Z) - Visual Imitation Made Easy [102.36509665008732]
本稿では,ロボットへのデータ転送を容易にしながら,データ収集プロセスを単純化する,模倣のための代替インターフェースを提案する。
我々は、データ収集装置やロボットのエンドエフェクターとして、市販のリーチ・グラブラー補助具を使用する。
我々は,非包括的プッシュと包括的積み重ねという2つの課題について実験的に評価した。
論文 参考訳(メタデータ) (2020-08-11T17:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。