論文の概要: Co-GAIL: Learning Diverse Strategies for Human-Robot Collaboration
- arxiv url: http://arxiv.org/abs/2108.06038v2
- Date: Wed, 20 Sep 2023 16:45:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-22 02:57:35.827297
- Title: Co-GAIL: Learning Diverse Strategies for Human-Robot Collaboration
- Title(参考訳): Co-GAIL:人間-ロボット協調のための多様な戦略を学ぶ
- Authors: Chen Wang, Claudia P\'erez-D'Arpino, Danfei Xu, Li Fei-Fei, C. Karen
Liu, Silvio Savarese
- Abstract要約: 本研究では,人間とロボットの協調実験から人間とロボットの協調政策を学習する手法を提案する。
本手法は対話型学習プロセスにおけるヒューマンポリシーとロボットポリシーを協調的に最適化する。
- 参考スコア(独自算出の注目度): 51.268988527778276
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a method for learning a human-robot collaboration policy from
human-human collaboration demonstrations. An effective robot assistant must
learn to handle diverse human behaviors shown in the demonstrations and be
robust when the humans adjust their strategies during online task execution.
Our method co-optimizes a human policy and a robot policy in an interactive
learning process: the human policy learns to generate diverse and plausible
collaborative behaviors from demonstrations while the robot policy learns to
assist by estimating the unobserved latent strategy of its human collaborator.
Across a 2D strategy game, a human-robot handover task, and a multi-step
collaborative manipulation task, our method outperforms the alternatives in
both simulated evaluations and when executing the tasks with a real human
operator in-the-loop. Supplementary materials and videos at
https://sites.google.com/view/co-gail-web/home
- Abstract(参考訳): 本稿では,人間とロボットの協調実験から人間とロボットの協調政策を学ぶ方法を提案する。
効果的なロボットアシスタントは、デモで示された多様な人間の行動に対処することを学び、オンラインタスク実行中に人間が戦略を調整すると頑健になる。
本手法は,対話型学習プロセスにおいて,人間ポリシーとロボットポリシーを協調的に最適化する。人間ポリシーは,実証から多種多様な協調行動を生成することを学習し,ロボットポリシーは人間の協力者の意図しない潜在戦略を推定することによって支援する。
2次元戦略ゲーム、人間-ロボットハンドオーバタスク、多段階協調操作タスクにおいて、シミュレーションによる評価と実際の人間のオペレーターによる実行の両方において、この方法が代替案を上回る。
補足資料とビデオ - https://sites.google.com/view/co-gail-web/home
関連論文リスト
- Human-Robot Mutual Learning through Affective-Linguistic Interaction and Differential Outcomes Training [Pre-Print] [0.3811184252495269]
本研究では,感情言語コミュニケーションが人間ロボットの文脈における相互学習にどのように影響するかを検証する。
児童介護のダイナミックスからインスピレーションを得て、私たちの人間とロボットのインタラクションのセットアップは、内部的、ホメオスタティックに制御されたニーズのコミュニケーション方法を学ぶための(シミュレートされた)ロボットで構成されています。
論文 参考訳(メタデータ) (2024-07-01T13:35:08Z) - Learning Video-Conditioned Policies for Unseen Manipulation Tasks [83.2240629060453]
ビデオ条件付きポリシー学習は、以前は目に見えないタスクの人間のデモをロボット操作スキルにマッピングする。
我々は,現在のシーン観察と対象課題のビデオから適切なアクションを生成するためのポリシーを学習する。
われわれは,多タスクロボット操作環境の課題と,技術面における性能の面から,そのアプローチを検証した。
論文 参考訳(メタデータ) (2023-05-10T16:25:42Z) - Learning a Universal Human Prior for Dexterous Manipulation from Human
Preference [35.54663426598218]
本稿では,ビデオ上での人間の嗜好を直接フィードバックすることで,人類の普遍性を学習するフレームワークを提案する。
多様な警察を反復的に生成し、軌道上の人間の嗜好を収集することにより、タスクに依存しない報酬モデルを訓練する。
提案手法は,ロボットの手の動作を,目に見えないタスクを含む多様なタスクで実証的に示す。
論文 参考訳(メタデータ) (2023-04-10T14:17:33Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - HERD: Continuous Human-to-Robot Evolution for Learning from Human
Demonstration [57.045140028275036]
本研究では,マイクロ進化的強化学習を用いて,操作スキルを人間からロボットに伝達可能であることを示す。
本稿では,ロボットの進化経路とポリシーを協調的に最適化する多次元進化経路探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-08T15:56:13Z) - Coordination with Humans via Strategy Matching [5.072077366588174]
協調作業を行う人間と人間のチームを観察することにより、利用可能なタスク補完戦略を自律的に認識するアルゴリズムを提案する。
隠れマルコフモデルを使って、チームアクションを低次元の表現に変換することで、事前の知識なしに戦略を識別できます。
ロボットポリシーは、未確認のパートナーのタスク戦略に適応するMixture-of-Expertsモデルを構築するための、識別された戦略のそれぞれに基づいて学習される。
論文 参考訳(メタデータ) (2022-10-27T01:00:50Z) - Human-to-Robot Imitation in the Wild [50.49660984318492]
本研究では,第三者の視点からの学習を中心に,効率的なワンショットロボット学習アルゴリズムを提案する。
実世界における20種類の操作タスクを含む,ワンショットの一般化と成功を示す。
論文 参考訳(メタデータ) (2022-07-19T17:59:59Z) - Joint Mind Modeling for Explanation Generation in Complex Human-Robot
Collaborative Tasks [83.37025218216888]
本稿では,人間とロボットのコラボレーションにおいて,人間のようなコミュニケーションを実現するための新しい説明可能なAI(XAI)フレームワークを提案する。
ロボットは、人間のユーザの階層的なマインドモデルを構築し、コミュニケーションの一形態として自身のマインドの説明を生成する。
その結果,提案手法はロボットの協調動作性能とユーザ認識を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2020-07-24T23:35:03Z) - Learn Task First or Learn Human Partner First: A Hierarchical Task
Decomposition Method for Human-Robot Cooperation [11.387868752604986]
本研究は、ロボットが人間のパートナーの振る舞いを学習することとは別に、階層的動的制御タスクを学習できるようにする階層的報酬機構を備えた新しいタスク分解手法を提案する。
その結果、ロボットは、まずタスクを学習し、より高いチームパフォーマンスを達成し、次に人間を学習し、より高い学習効率を達成することが示唆された。
論文 参考訳(メタデータ) (2020-03-01T04:41:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。