Fugu-MT 論文翻訳(概要): Human-in-the-Loop Task and Motion Planning for Imitation Learning

論文の概要: Human-in-the-Loop Task and Motion Planning for Imitation Learning

arxiv url: http://arxiv.org/abs/2310.16014v1
Date: Tue, 24 Oct 2023 17:15:16 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-25 17:41:40.143825
Title: Human-in-the-Loop Task and Motion Planning for Imitation Learning
Title（参考訳）: 模倣学習のためのヒューマン・イン・ザ・ループタスクと動作計画
Authors: Ajay Mandlekar, Caelan Garrett, Danfei Xu, Dieter Fox
Abstract要約: 人間のデモからの模倣学習は、ロボットに複雑な操作スキルを教えることができるが、時間がかかり労働が集中している。対照的に、タスク・アンド・モーション・プランニング(TAMP)システムは自動化されており、長距離タスクの解決に優れています。両アプローチの利点を生かした新しいシステムであるHuman-in-the-Loop Task and Motion Planning (HITL-TAMP)を提案する。
参考スコア（独自算出の注目度）: 37.75197145733193
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Imitation learning from human demonstrations can teach robots complex manipulation skills, but is time-consuming and labor intensive. In contrast, Task and Motion Planning (TAMP) systems are automated and excel at solving long-horizon tasks, but they are difficult to apply to contact-rich tasks. In this paper, we present Human-in-the-Loop Task and Motion Planning (HITL-TAMP), a novel system that leverages the benefits of both approaches. The system employs a TAMP-gated control mechanism, which selectively gives and takes control to and from a human teleoperator. This enables the human teleoperator to manage a fleet of robots, maximizing data collection efficiency. The collected human data is then combined with an imitation learning framework to train a TAMP-gated policy, leading to superior performance compared to training on full task demonstrations. We compared HITL-TAMP to a conventional teleoperation system -- users gathered more than 3x the number of demos given the same time budget. Furthermore, proficient agents (75\%+ success) could be trained from just 10 minutes of non-expert teleoperation data. Finally, we collected 2.1K demos with HITL-TAMP across 12 contact-rich, long-horizon tasks and show that the system often produces near-perfect agents. Videos and additional results at https://hitltamp.github.io .
Abstract（参考訳）: 人間のデモから学ぶ模倣は、複雑な操作スキルをロボットに教えることができるが、時間と労力がかかる。対照的に、タスク・アンド・モーション・プランニング(TAMP)システムは、長距離タスクの解決に優れ、自動化されているが、コンタクトリッチタスクには適用が難しい。本稿では,Human-in-the-Loop Task and Motion Planning (HITL-TAMP)を提案する。このシステムは、人間の遠隔操作者に対して選択的に制御を行うTAMPゲート制御機構を採用している。これにより、人間の遠隔操作者がロボット群を管理し、データの収集効率を最大化する。収集されたヒューマンデータは、tamp-gatedポリシーをトレーニングするための模倣学習フレームワークと組み合わせることで、完全なタスクデモでのトレーニングよりも優れたパフォーマンスが得られる。私たちはHITL-TAMPを従来の遠隔操作システムと比較しました。さらに、熟練エージェント(75\%+成功)を10分間の非熟練遠隔操作データから訓練することができた。最後に, HITL-TAMPによる2.1Kのデモを12のコンタクトリッチな長距離タスクで収集した。ビデオと追加結果はhttps://hitltamp.github.io。

関連論文リスト

Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models [49.4824734958566]
カオス・オブ・モダリティ(CoM)は、ビジョン言語モデルがマルチモーダルな人間の実演データを推論することを可能にする。 CoMはタスクプランを洗練し、詳細な制御パラメータを生成し、ロボットは単一のマルチモーダルなヒューマンビデオプロンプトに基づいて操作タスクを実行できる。
論文参考訳（メタデータ） (2025-04-17T21:31:23Z)
LLM+MAP: Bimanual Robot Task Planning using Large Language Models and Planning Domain Definition Language [17.914580097058106]
両手間の空間的・時間的調整が複雑になるため、両手操作は固有の課題となる。既存の作業は主に、ロボットハンドのための人間レベルの操作スキルの獲得に重点を置いているが、長い時間軸でのタスクプランニングにはほとんど関心が払われていない。本稿では,LLM推論とマルチエージェント計画を統合した双方向計画フレームワークであるLLM+MAPを紹介する。
論文参考訳（メタデータ） (2025-03-21T17:04:01Z)
SLIM: Sim-to-Real Legged Instructive Manipulation via Long-Horizon Visuomotor Learning [20.33419404756149]
本稿では,シミュレーションで純粋に強化学習によって訓練された実世界の課題を,低コストで解決するモバイル操作システムを提案する。単一のポリシーは、検索、移動、把握、輸送、降下を含む長期的タスクを自律的に解決し、80%近い現実世界の成功を達成します。この性能は、ロボットがより効率的であり、遠隔操作の約1.5倍の速度で動作しているのに対して、同じタスクにおける専門家の遠隔操作に匹敵する。
論文参考訳（メタデータ） (2025-01-17T01:32:18Z)
SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.14969377419633]
タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文参考訳（メタデータ） (2024-10-23T17:42:07Z)
Human-Agent Joint Learning for Efficient Robot Manipulation Skill Acquisition [48.65867987106428]
本稿では,人間とロボットの協調学習システムについて紹介する。これにより、ロボットエンドエフェクターの制御を学習支援エージェントと共有することができる。これにより、ダウンストリームタスクにおいて、収集されたデータが十分な品質であることを保証しながら、人間の適応の必要性を減らすことができる。
論文参考訳（メタデータ） (2024-06-29T03:37:29Z)
Large Language Models for Orchestrating Bimanual Robots [19.60907949776435]
本稿では,Language-based Bimanual Orchestration (LABOR)を提案する。 NICOLヒューマノイドロボットを用いた2種類の長距離作業のシミュレーション実験により,本手法の評価を行った。
論文参考訳（メタデータ） (2024-04-02T15:08:35Z)
GeRM: A Generalist Robotic Model with Mixture-of-experts for Quadruped Robot [27.410618312830497]
本稿では,GERM(Generalist Robotic Model)を提案する。データ利用戦略を最適化するためにオフライン強化学習を利用する。我々は、マルチモーダル入力と出力動作を処理するために、トランスフォーマーベースのVLAネットワークを使用する。
論文参考訳（メタデータ） (2024-03-20T07:36:43Z)
Imitating Task and Motion Planning with Visuomotor Transformers [71.41938181838124]
タスク・アンド・モーション・プランニング(TAMP)は、多様なデモンストレーションの大規模なデータセットを自律的に生成できる。本研究では,TAMPスーパーバイザが生成する大規模データセットと,それらに適合するフレキシブルトランスフォーマーモデルの組み合わせが,ロボット操作の強力なパラダイムであることを示す。我々は,TAMPエージェントを模倣して大規模ビジュモータトランスフォーマーポリシーを訓練する OPTIMUS という新しい模倣学習システムを提案する。
論文参考訳（メタデータ） (2023-05-25T17:58:14Z)
PATO: Policy Assisted TeleOperation for Scalable Robot Data Collection [19.04536551595612]
Policy Assisted TeleOperation (PATO) は、学習された支援ポリシーを用いて、デモ収集プロセスの一部を自動化するシステムである。 PATOはデータ収集における反復的な動作を自律的に実行し、どのサブタスクや動作を実行するかが不確実な場合にのみ人間の入力を要求する。
論文参考訳（メタデータ） (2022-12-09T07:38:09Z)
Error-Aware Imitation Learning from Teleoperation Data for Mobile Manipulation [54.31414116478024]
移動操作(MM)では、ロボットは環境内を移動して操作することができる。本研究では,MMタスクに対する連続的なビジュオモダポリシの学習に模倣学習(IL)を適用する方法について検討する。
論文参考訳（メタデータ） (2021-12-09T23:54:59Z)
Bottom-Up Skill Discovery from Unsegmented Demonstrations for Long-Horizon Robot Manipulation [55.31301153979621]
我々は,実世界の長距離ロボット操作作業に,スキル発見による取り組みを行う。未解決のデモンストレーションから再利用可能なスキルのライブラリを学ぶためのボトムアップアプローチを提案する。提案手法は,多段階操作タスクにおける最先端の模倣学習手法よりも優れた性能を示した。
論文参考訳（メタデータ） (2021-09-28T16:18:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。