論文の概要: Fleet-DAgger: Interactive Robot Fleet Learning with Scalable Human
Supervision
- arxiv url: http://arxiv.org/abs/2206.14349v1
- Date: Wed, 29 Jun 2022 01:23:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-30 21:08:27.160144
- Title: Fleet-DAgger: Interactive Robot Fleet Learning with Scalable Human
Supervision
- Title(参考訳): fleet-dagger: スケーラブルな人間の監督によるインタラクティブなロボットフリート学習
- Authors: Ryan Hoque, Lawrence Yunliang Chen, Satvik Sharma, Karthik
Dharmarajan, Brijen Thananjeyan, Pieter Abbeel, Ken Goldberg
- Abstract要約: ロボットの商業的および産業的な展開は、実行中にリモートの人間のテレオペレーターにフォールバックすることが多い。
我々は対話型フリートラーニング(Interactive Fleet Learning, IFL)の設定を定式化し、複数のロボットが対話型クエリを行い、複数の人間スーパーバイザーから学習する。
IFLアルゴリズムのファミリーであるFleet-DAggerを提案し、新しいFleet-DAggerアルゴリズムをシミュレーションで4つのベースラインと比較する。
- 参考スコア(独自算出の注目度): 72.4735163268491
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Commercial and industrial deployments of robot fleets often fall back on
remote human teleoperators during execution when robots are at risk or unable
to make task progress. With continual learning, interventions from the remote
pool of humans can also be used to improve the robot fleet control policy over
time. A central question is how to effectively allocate limited human attention
to individual robots. Prior work addresses this in the single-robot,
single-human setting. We formalize the Interactive Fleet Learning (IFL)
setting, in which multiple robots interactively query and learn from multiple
human supervisors. We present a fully implemented open-source IFL benchmark
suite of GPU-accelerated Isaac Gym environments for the evaluation of IFL
algorithms. We propose Fleet-DAgger, a family of IFL algorithms, and compare a
novel Fleet-DAgger algorithm to 4 baselines in simulation. We also perform 1000
trials of a physical block-pushing experiment with 4 ABB YuMi robot arms.
Experiments suggest that the allocation of humans to robots significantly
affects robot fleet performance, and that our algorithm achieves up to 8.8x
higher return on human effort than baselines. See
https://tinyurl.com/fleet-dagger for code, videos, and supplemental material.
- Abstract(参考訳): ロボットの商業的および産業的展開は、ロボットが作業の進捗を危険にさらす場合、実行中に遠隔の人間テレオペレーターに回帰することが多い。
継続的学習によって、人間の遠隔プールからの介入は、時間とともにロボット艦隊の制御ポリシーを改善するためにも使用できる。
中心となる問題は、人間の注意を個々のロボットに効果的に割り当てる方法だ。
以前の作業では、これをシングルロボット、シングルヒューマン設定で処理していた。
複数のロボットが対話的に複数のヒューマンスーパーバイザからクエリと学習を行う、interactive fleet learning(ifl)の設定を定式化する。
本稿では、iflアルゴリズムの評価のために、gpuアクセラレーションされたアイザックジム環境のiflベンチマークスイートを完全実装した。
IFLアルゴリズムのファミリーであるFleet-DAggerを提案し、新しいFleet-DAggerアルゴリズムをシミュレーションで4つのベースラインと比較する。
4本のabb yumiロボットアームを用いた物理ブロックプッシュ実験も1000回実施した。
実験の結果,ロボットへの人体の配置はロボットの艦隊性能に大きく影響し,我々のアルゴリズムはベースラインよりも最大8.8倍高いリターンを達成できることがわかった。
コード、ビデオ、補足資料についてはhttps://tinyurl.com/fleet-daggerを参照。
関連論文リスト
- OpenBot-Fleet: A System for Collective Learning with Real Robots [45.739144410591805]
ナビゲーションのための総合的なオープンソースクラウドロボティクスシステムであるOpenBot-Fleetを紹介する。
OpenBot-Fleetは、センサー、ローカルコンピューティング、通信にスマートフォン、セキュアなクラウドストレージとオフボードコンピューティングにGoogleを使用している。
実験では、72台のロボットを家庭で操作する労働者の群集に配布し、OpenBot-Fleetが堅牢なナビゲーションポリシーを学習できることを示しました。
論文 参考訳(メタデータ) (2024-05-13T07:22:50Z) - HumanoidBench: Simulated Humanoid Benchmark for Whole-Body Locomotion and Manipulation [50.616995671367704]
そこで本研究では,人型ロボットが器用な手を備えた,高次元シミュレーション型ロボット学習ベンチマークHumanoidBenchを提案する。
その結果,現在最先端の強化学習アルゴリズムがほとんどのタスクに支障をきたすのに対して,階層的学習アプローチはロバストな低レベルポリシーに支えられた場合,優れた性能を達成できることがわかった。
論文 参考訳(メタデータ) (2024-03-15T17:45:44Z) - Interactive Robot Learning from Verbal Correction [42.37176329867376]
OLAFは、ロボットがミスをしたとき、言葉で訂正するロボットを教える。
OLAFの重要な特徴は、言葉のフィードバックに基づいてロボットの視覚運動神経ポリシーを更新する能力である。
本研究では,ユーザがロボットに長期操作タスクを指示する実験において,設計の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-26T16:46:12Z) - ImitationNet: Unsupervised Human-to-Robot Motion Retargeting via Shared Latent Space [9.806227900768926]
本稿では,ロボットの動きに対する新しいディープラーニング手法を提案する。
本手法では,新しいロボットへの翻訳を容易にする,人間とロボットのペアデータを必要としない。
我々のモデルは、効率と精度の観点から、人間とロボットの類似性に関する既存の研究よりも優れています。
論文 参考訳(メタデータ) (2023-09-11T08:55:04Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Decentralised construction of a global coordinate system in a large
swarm of minimalistic robots [0.8701566919381223]
本研究では,最小主義的エラー発生ロボット群における位置自己認識を可能にするアルゴリズムを提案する。
受信メッセージのベアリングを計測できないにもかかわらず、アルゴリズムを実行しているロボットは、定期的に配置されたSwarm内の位置を計算することができる。
我々のソリューションは最先端のアルゴリズムよりも少ない要件を持ち、総合的なノイズフィルタリング機構を含んでいる。
論文 参考訳(メタデータ) (2023-02-28T14:14:17Z) - GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots [87.32145104894754]
四足歩行ロボットのための汎用ロコモーション(GenLoco)コントローラを訓練するためのフレームワークを提案する。
本フレームワークは,多種多様な四足歩行ロボットに展開可能な汎用ロコモーションコントローラを合成する。
我々のモデルは、より一般的な制御戦略を取得し、新しいシミュレーションロボットや実世界のロボットに直接移行できることを示す。
論文 参考訳(メタデータ) (2022-09-12T15:14:32Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - Know Thyself: Transferable Visuomotor Control Through Robot-Awareness [22.405839096833937]
新しいロボットをスクラッチからトレーニングするためには、通常大量のロボット固有のデータを生成する必要がある。
簡単なロボット「自己認識」を活用する「ロボット認識」ソリューションパラダイムを提案する。
シミュレーションおよび実際のロボットにおけるテーブルトップ操作に関する実験により、これらのプラグインの改善により、ビジュモータコントローラの転送性が劇的に向上することを示した。
論文 参考訳(メタデータ) (2021-07-19T17:56:04Z) - Show Me What You Can Do: Capability Calibration on Reachable Workspace
for Human-Robot Collaboration [83.4081612443128]
本稿では,REMPを用いた短時間キャリブレーションにより,ロボットが到達できると考える非専門家と地道とのギャップを効果的に埋めることができることを示す。
この校正手順は,ユーザ認識の向上だけでなく,人間とロボットのコラボレーションの効率化にも寄与することを示す。
論文 参考訳(メタデータ) (2021-03-06T09:14:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。