論文の概要: Human-in-the-Loop Task and Motion Planning for Imitation Learning
- arxiv url: http://arxiv.org/abs/2310.16014v1
- Date: Tue, 24 Oct 2023 17:15:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 17:41:40.143825
- Title: Human-in-the-Loop Task and Motion Planning for Imitation Learning
- Title(参考訳): 模倣学習のためのヒューマン・イン・ザ・ループタスクと動作計画
- Authors: Ajay Mandlekar, Caelan Garrett, Danfei Xu, Dieter Fox
- Abstract要約: 人間のデモからの模倣学習は、ロボットに複雑な操作スキルを教えることができるが、時間がかかり労働が集中している。
対照的に、タスク・アンド・モーション・プランニング(TAMP)システムは自動化されており、長距離タスクの解決に優れています。
両アプローチの利点を生かした新しいシステムであるHuman-in-the-Loop Task and Motion Planning (HITL-TAMP)を提案する。
- 参考スコア(独自算出の注目度): 37.75197145733193
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Imitation learning from human demonstrations can teach robots complex
manipulation skills, but is time-consuming and labor intensive. In contrast,
Task and Motion Planning (TAMP) systems are automated and excel at solving
long-horizon tasks, but they are difficult to apply to contact-rich tasks. In
this paper, we present Human-in-the-Loop Task and Motion Planning (HITL-TAMP),
a novel system that leverages the benefits of both approaches. The system
employs a TAMP-gated control mechanism, which selectively gives and takes
control to and from a human teleoperator. This enables the human teleoperator
to manage a fleet of robots, maximizing data collection efficiency. The
collected human data is then combined with an imitation learning framework to
train a TAMP-gated policy, leading to superior performance compared to training
on full task demonstrations. We compared HITL-TAMP to a conventional
teleoperation system -- users gathered more than 3x the number of demos given
the same time budget. Furthermore, proficient agents (75\%+ success) could be
trained from just 10 minutes of non-expert teleoperation data. Finally, we
collected 2.1K demos with HITL-TAMP across 12 contact-rich, long-horizon tasks
and show that the system often produces near-perfect agents. Videos and
additional results at https://hitltamp.github.io .
- Abstract(参考訳): 人間のデモから学ぶ模倣は、複雑な操作スキルをロボットに教えることができるが、時間と労力がかかる。
対照的に、タスク・アンド・モーション・プランニング(TAMP)システムは、長距離タスクの解決に優れ、自動化されているが、コンタクトリッチタスクには適用が難しい。
本稿では,Human-in-the-Loop Task and Motion Planning (HITL-TAMP)を提案する。
このシステムは、人間の遠隔操作者に対して選択的に制御を行うTAMPゲート制御機構を採用している。
これにより、人間の遠隔操作者がロボット群を管理し、データの収集効率を最大化する。
収集されたヒューマンデータは、tamp-gatedポリシーをトレーニングするための模倣学習フレームワークと組み合わせることで、完全なタスクデモでのトレーニングよりも優れたパフォーマンスが得られる。
私たちはHITL-TAMPを従来の遠隔操作システムと比較しました。
さらに、熟練エージェント(75\%+成功)を10分間の非熟練遠隔操作データから訓練することができた。
最後に, HITL-TAMPによる2.1Kのデモを12のコンタクトリッチな長距離タスクで収集した。
ビデオと追加結果はhttps://hitltamp.github.io。
関連論文リスト
- GeRM: A Generalist Robotic Model with Mixture-of-experts for Quadruped Robot [27.410618312830497]
本稿では,GERM(Generalist Robotic Model)を提案する。
データ利用戦略を最適化するためにオフライン強化学習を利用する。
我々は、マルチモーダル入力と出力動作を処理するために、トランスフォーマーベースのVLAネットワークを使用する。
論文 参考訳(メタデータ) (2024-03-20T07:36:43Z) - MimicGen: A Data Generation System for Scalable Robot Learning using
Human Demonstrations [55.549956643032836]
MimicGenは、少数の人間のデモから大規模でリッチなデータセットを自動的に合成するシステムである。
ロボットエージェントは,この生成したデータセットを模倣学習により効果的に訓練し,長期的・高精度なタスクにおいて高い性能を達成することができることを示す。
論文 参考訳(メタデータ) (2023-10-26T17:17:31Z) - Imitating Task and Motion Planning with Visuomotor Transformers [71.41938181838124]
タスク・アンド・モーション・プランニング(TAMP)は、多様なデモンストレーションの大規模なデータセットを自律的に生成できる。
本研究では,TAMPスーパーバイザが生成する大規模データセットと,それらに適合するフレキシブルトランスフォーマーモデルの組み合わせが,ロボット操作の強力なパラダイムであることを示す。
我々は,TAMPエージェントを模倣して大規模ビジュモータトランスフォーマーポリシーを訓練する OPTIMUS という新しい模倣学習システムを提案する。
論文 参考訳(メタデータ) (2023-05-25T17:58:14Z) - PATO: Policy Assisted TeleOperation for Scalable Robot Data Collection [19.04536551595612]
Policy Assisted TeleOperation (PATO) は、学習された支援ポリシーを用いて、デモ収集プロセスの一部を自動化するシステムである。
PATOはデータ収集における反復的な動作を自律的に実行し、どのサブタスクや動作を実行するかが不確実な場合にのみ人間の入力を要求する。
論文 参考訳(メタデータ) (2022-12-09T07:38:09Z) - Robot Learning on the Job: Human-in-the-Loop Autonomy and Learning
During Deployment [25.186525630548356]
Siriusは、人間とロボットが共同作業を行うための、原則化されたフレームワークである。
部分的に自律的なロボットは、意思決定の大部分を確実に行うことを任務としている。
タスク実行から収集したデータに対するポリシーの性能を改善するための新しい学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-15T18:53:39Z) - Learning to Coordinate for a Worker-Station Multi-robot System in Planar
Coverage Tasks [16.323122275188354]
ランダムな動的干渉器を有する大規模平面領域におけるマルチロボットカバレッジパス計画問題に着目する。
本稿では,実際の作業に必要なリソースが限られている複数の作業者と,資源補給に十分なリソースを持つ1つのステーションからなる作業者ステーションMSSを紹介する。
本稿では、労働者のカバレッジプランニングと駅のランデブープランニングを同時に解決する、エンドツーエンドの分散オンラインプランニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-05T05:36:42Z) - Error-Aware Imitation Learning from Teleoperation Data for Mobile
Manipulation [54.31414116478024]
移動操作(MM)では、ロボットは環境内を移動して操作することができる。
本研究では,MMタスクに対する連続的なビジュオモダポリシの学習に模倣学習(IL)を適用する方法について検討する。
論文 参考訳(メタデータ) (2021-12-09T23:54:59Z) - Bottom-Up Skill Discovery from Unsegmented Demonstrations for
Long-Horizon Robot Manipulation [55.31301153979621]
我々は,実世界の長距離ロボット操作作業に,スキル発見による取り組みを行う。
未解決のデモンストレーションから再利用可能なスキルのライブラリを学ぶためのボトムアップアプローチを提案する。
提案手法は,多段階操作タスクにおける最先端の模倣学習手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-09-28T16:18:54Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。