論文の概要: Error-Aware Imitation Learning from Teleoperation Data for Mobile
Manipulation
- arxiv url: http://arxiv.org/abs/2112.05251v1
- Date: Thu, 9 Dec 2021 23:54:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-13 14:04:22.211552
- Title: Error-Aware Imitation Learning from Teleoperation Data for Mobile
Manipulation
- Title(参考訳): 移動操作のための遠隔操作データからの誤り認識模倣学習
- Authors: Josiah Wong, Albert Tung, Andrey Kurenkov, Ajay Mandlekar, Li Fei-Fei,
Silvio Savarese, Roberto Mart\'in-Mart\'in
- Abstract要約: 移動操作(MM)では、ロボットは環境内を移動して操作することができる。
本研究では,MMタスクに対する連続的なビジュオモダポリシの学習に模倣学習(IL)を適用する方法について検討する。
- 参考スコア(独自算出の注目度): 54.31414116478024
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In mobile manipulation (MM), robots can both navigate within and interact
with their environment and are thus able to complete many more tasks than
robots only capable of navigation or manipulation. In this work, we explore how
to apply imitation learning (IL) to learn continuous visuo-motor policies for
MM tasks. Much prior work has shown that IL can train visuo-motor policies for
either manipulation or navigation domains, but few works have applied IL to the
MM domain. Doing this is challenging for two reasons: on the data side, current
interfaces make collecting high-quality human demonstrations difficult, and on
the learning side, policies trained on limited data can suffer from covariate
shift when deployed. To address these problems, we first propose Mobile
Manipulation RoboTurk (MoMaRT), a novel teleoperation framework allowing
simultaneous navigation and manipulation of mobile manipulators, and collect a
first-of-its-kind large scale dataset in a realistic simulated kitchen setting.
We then propose a learned error detection system to address the covariate shift
by detecting when an agent is in a potential failure state. We train performant
IL policies and error detectors from this data, and achieve over 45% task
success rate and 85% error detection success rate across multiple multi-stage
tasks when trained on expert data. Codebase, datasets, visualization, and more
available at https://sites.google.com/view/il-for-mm/home.
- Abstract(参考訳): モバイル操作(mm)では、ロボットは環境内をナビゲートしたり操作したりできるため、ナビゲーションや操作しかできないロボットよりも多くのタスクを完了することができる。
本研究では,模倣学習(il)をmmタスクの連続的viso-motorポリシーに適用する方法について検討する。
多くの先行研究により、ILは操作またはナビゲーションのドメインに対してvisuo-motorポリシーをトレーニングできることが示されている。
データ側では、現在のインターフェースによって、高品質な人間のデモの収集が難しくなり、学習側では、限られたデータでトレーニングされたポリシーは、デプロイ時に共変量シフトに悩まされる。
これらの問題を解決するために,移動マニピュレータの同時ナビゲーションと操作が可能な新しい遠隔操作フレームワークであるMobile Manipulation RoboTurk (MoMaRT) を提案する。
次に,エージェントが潜在的な故障状態にあることを検知することで,共変量シフトに対処する学習誤り検出システムを提案する。
このデータから高性能ilポリシとエラー検出をトレーニングし,専門家データを用いた複数の多段階タスクにおいて45%以上のタスク成功率と85%のエラー検出成功率を達成した。
Codebase、データセット、ビジュアライゼーションなどがhttps://sites.google.com/view/il-for-mm/home.comで公開されている。
関連論文リスト
- Zero-Cost Whole-Body Teleoperation for Mobile Manipulation [8.71539730969424]
MoMa-Teleopは、ベースモーションを強化学習エージェントに委譲する新しい遠隔操作手法である。
提案手法は,様々なロボットやタスクに対して,タスク完了時間が大幅に短縮されることを実証する。
論文 参考訳(メタデータ) (2024-09-23T15:09:45Z) - VITAL: Visual Teleoperation to Enhance Robot Learning through Human-in-the-Loop Corrections [10.49712834719005]
本稿では,VITAL と呼ばれる双方向操作作業のための低コストな視覚遠隔操作システムを提案する。
われわれのアプローチは、安価なハードウェアとビジュアル処理技術を利用してデモを収集する。
実環境と模擬環境の両方を活用することにより,学習方針の一般化性と堅牢性を高める。
論文 参考訳(メタデータ) (2024-07-30T23:29:47Z) - Offline Imitation Learning Through Graph Search and Retrieval [57.57306578140857]
模倣学習は、ロボットが操作スキルを取得するための強力な機械学習アルゴリズムである。
本稿では,グラフ検索と検索により,最適下実験から学習する,シンプルで効果的なアルゴリズムGSRを提案する。
GSRは、ベースラインに比べて10%から30%高い成功率、30%以上の熟練を達成できる。
論文 参考訳(メタデータ) (2024-07-22T06:12:21Z) - Harmonic Mobile Manipulation [35.82197562695662]
HarmonicMMはナビゲーションと操作の両方を最適化するエンドツーエンドの学習手法である。
私たちのコントリビューションには、モバイル操作のための新しいベンチマークと、RGBの視覚的観察のみによるデプロイメントの成功が含まれています。
論文 参考訳(メタデータ) (2023-12-11T18:54:42Z) - Multi-skill Mobile Manipulation for Object Rearrangement [75.62774690484022]
本研究では,オブジェクト再構成のための長距離移動操作タスクへのモジュラーアプローチについて検討する。
従来の作業チェーンでは、サブタスクで個別に学習するポイントゴールナビゲーションスキルを備えた複数の静止操作スキルがチェーンされている。
静的な操作ではなく,モバイル操作のスキルを実装し,ポイントゴールではなく,地域目標で訓練されたナビゲーションスキルを訓練することで,これらのアイデアを運用する。
論文 参考訳(メタデータ) (2022-09-06T19:02:08Z) - Human-in-the-Loop Imitation Learning using Remote Teleoperation [72.2847988686463]
6-DoF操作設定に合わせたデータ収集システムを構築します。
システムによって収集された新しいデータに基づいて,ポリシーを反復的にトレーニングするアルゴリズムを開発した。
介入型システムで収集したデータに基づいて訓練されたエージェントと、非介入型デモ参加者が収集した同等数のサンプルで訓練されたアルゴリズムを上回るエージェントを実証する。
論文 参考訳(メタデータ) (2020-12-12T05:30:35Z) - COG: Connecting New Skills to Past Experience with Offline Reinforcement
Learning [78.13740204156858]
我々は、動的プログラミングによって新しいスキルを拡張するために、事前データを再利用できることを示します。
我々は、新しいタスクを解決するために、以前のデータセットに見られるいくつかの動作をチェーンすることで、アプローチの有効性を実証する。
我々は、高次元画像観察を低レベルのロボット制御コマンドにマッピングし、エンドツーエンドでポリシーを訓練する。
論文 参考訳(メタデータ) (2020-10-27T17:57:29Z) - Visual Imitation Made Easy [102.36509665008732]
本稿では,ロボットへのデータ転送を容易にしながら,データ収集プロセスを単純化する,模倣のための代替インターフェースを提案する。
我々は、データ収集装置やロボットのエンドエフェクターとして、市販のリーチ・グラブラー補助具を使用する。
我々は,非包括的プッシュと包括的積み重ねという2つの課題について実験的に評価した。
論文 参考訳(メタデータ) (2020-08-11T17:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。