論文の概要: Dreaming to Assist: Learning to Align with Human Objectives for Shared Control in High-Speed Racing
- arxiv url: http://arxiv.org/abs/2410.10062v1
- Date: Mon, 14 Oct 2024 01:00:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-30 03:23:50.232107
- Title: Dreaming to Assist: Learning to Align with Human Objectives for Shared Control in High-Speed Racing
- Title(参考訳): 支援への夢: 高速レースにおける共有制御のための人的対象との整合性を学ぶ
- Authors: Jonathan DeCastro, Andrew Silva, Deepak Gopinath, Emily Sumner, Thomas M. Balch, Laporsha Dees, Guy Rosman,
- Abstract要約: 高速なダイナミクスと戦術的な決定を含むドメインにおける効果的な人間ロボットチームのために、タイトな調整が求められます。
人間の目的や価値関数を推測できる豊かな世界モデルを組み合わせたフレームワークであるDream2Assistを提案する。
人間の行動と人間の行動とを混ぜ合わせると、人工人間単独よりも優れた結果が得られます。
- 参考スコア(独自算出の注目度): 10.947581892636629
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tight coordination is required for effective human-robot teams in domains involving fast dynamics and tactical decisions, such as multi-car racing. In such settings, robot teammates must react to cues of a human teammate's tactical objective to assist in a way that is consistent with the objective (e.g., navigating left or right around an obstacle). To address this challenge, we present Dream2Assist, a framework that combines a rich world model able to infer human objectives and value functions, and an assistive agent that provides appropriate expert assistance to a given human teammate. Our approach builds on a recurrent state space model to explicitly infer human intents, enabling the assistive agent to select actions that align with the human and enabling a fluid teaming interaction. We demonstrate our approach in a high-speed racing domain with a population of synthetic human drivers pursuing mutually exclusive objectives, such as "stay-behind" and "overtake". We show that the combined human-robot team, when blending its actions with those of the human, outperforms the synthetic humans alone as well as several baseline assistance strategies, and that intent-conditioning enables adherence to human preferences during task execution, leading to improved performance while satisfying the human's objective.
- Abstract(参考訳): タイト調整は、高速なダイナミックスとマルチカーレースのような戦術的な決定を含む領域における効果的な人間ロボットチームのために必要である。
このような設定では、ロボットチームメイトは、人間のチームメイトの戦術的目的の手がかりに反応し、目的(例えば、障害物の周囲を左右に移動する)と整合した方法で支援しなければなりません。
この課題に対処するために、人間の目的と価値機能を推測できる豊かな世界モデルを組み合わせたフレームワークであるDream2Assistと、与えられた人間のチームメイトに適切な専門家支援を提供する支援エージェントを提示する。
我々のアプローチは、人間の意図を明示的に推測するために、リカレントな状態空間モデルに基づいており、補助エージェントは、人間と整合し、流動的なチーム間相互作用を可能にするアクションを選択できる。
我々は,「ステイビハインド」や「オーバーテイク」といった,互いに排他的な目的を追求する合成人間ドライバーの集団による高速レース領域におけるアプローチを実証する。
統合されたロボットチームは、人間の行動と混ざり合った場合、合成された人間だけでなく、いくつかのベースライン支援戦略よりも優れており、インテントコンディショニングにより、タスク実行時の人間の嗜好の順守が可能であり、人間の目的を満足しつつ、パフォーマンスの向上が期待できることを示す。
関連論文リスト
- Learning to Assist Humans without Inferring Rewards [65.28156318196397]
我々は、エンパワーメントのレンズを通して支援を研究する先行研究に基づいて構築する。
補助剤は、人間の行動の影響を最大化することを目的としている。
これらの表現は、先行研究と類似したエンパワーメントの概念を推定する。
論文 参考訳(メタデータ) (2024-11-04T21:31:04Z) - CoNav: A Benchmark for Human-Centered Collaborative Navigation [66.6268966718022]
協調ナビゲーション(CoNav)ベンチマークを提案する。
われわれのCoNavは、現実的で多様な人間の活動を伴う3Dナビゲーション環境を構築するという重要な課題に取り組む。
本研究では,長期的意図と短期的意図の両方を推論する意図認識エージェントを提案する。
論文 参考訳(メタデータ) (2024-06-04T15:44:25Z) - Mixed-Initiative Human-Robot Teaming under Suboptimality with Online Bayesian Adaptation [0.6591036379613505]
我々は,最適人-エージェントチームの性能向上のための計算モデルと最適化手法を開発した。
我々は,ロボットが逐次意思決定ゲームにおいて,その支援に従おうとする人々の意思を推測できるオンラインベイズアプローチを採用する。
ユーザの好みやチームのパフォーマンスは,ロボットの介入スタイルによって明らかに異なります。
論文 参考訳(メタデータ) (2024-03-24T14:38:18Z) - The role of haptic communication in dyadic collaborative object
manipulation tasks [6.46682752231823]
ヒトの協調作業における触覚の役割について検討する。
ボード上の目標位置でボールをバランスさせるタスクを提示する。
触覚フィードバックが利用可能であれば,人間同士のコーディネートがより優れていることが分かっています。
論文 参考訳(メタデータ) (2022-03-02T18:13:54Z) - Show Me What You Can Do: Capability Calibration on Reachable Workspace
for Human-Robot Collaboration [83.4081612443128]
本稿では,REMPを用いた短時間キャリブレーションにより,ロボットが到達できると考える非専門家と地道とのギャップを効果的に埋めることができることを示す。
この校正手順は,ユーザ認識の向上だけでなく,人間とロボットのコラボレーションの効率化にも寄与することを示す。
論文 参考訳(メタデータ) (2021-03-06T09:14:30Z) - Forming Human-Robot Cooperation for Tasks with General Goal using
Evolutionary Value Learning [9.053709318841232]
人間ロボット協力(HRC)では、ロボットは人間と協力してタスクを一緒に達成します。
既存のアプローチでは、人間が協力中に特定の目標を持っていると仮定し、ロボットはそれを推論し行動する。
HRCにおける目標仕様プロセスのダイナミクスをモデル化するEvolutionary Value Learning(EVL)アプローチを紹介します。
論文 参考訳(メタデータ) (2020-12-19T20:27:09Z) - Joint Mind Modeling for Explanation Generation in Complex Human-Robot
Collaborative Tasks [83.37025218216888]
本稿では,人間とロボットのコラボレーションにおいて,人間のようなコミュニケーションを実現するための新しい説明可能なAI(XAI)フレームワークを提案する。
ロボットは、人間のユーザの階層的なマインドモデルを構築し、コミュニケーションの一形態として自身のマインドの説明を生成する。
その結果,提案手法はロボットの協調動作性能とユーザ認識を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2020-07-24T23:35:03Z) - AvE: Assistance via Empowerment [77.08882807208461]
そこで我々は,人間の環境制御能力を高めることで,支援のための新しいパラダイムを提案する。
このタスクに依存しない目的は、個人の自律性と最終的な状態を達成する能力を維持する。
論文 参考訳(メタデータ) (2020-06-26T04:40:11Z) - Social Navigation with Human Empowerment driven Deep Reinforcement
Learning [20.815007485176615]
次世代のモバイルロボットは、人間の協力者によって受け入れられるために、社会的に準拠する必要がある。
本稿では,古典的acfRLのアプローチを超えて,エンパワーメントを用いた本質的なモチベーションをエージェントに提供する。
我々のアプローチは、人間との距離を最小化し、それによって、効率的に目標に向かって移動しながら、人間の移動時間を短縮するので、人間に肯定的な影響を与える。
論文 参考訳(メタデータ) (2020-03-18T11:16:07Z) - Human Grasp Classification for Reactive Human-to-Robot Handovers [50.91803283297065]
本稿では,ロボットが人間に遭遇するロボットのハンドオーバに対するアプローチを提案する。
対象物をさまざまな手形やポーズで保持する典型的な方法をカバーする,人間の把握データセットを収集する。
本稿では,検出した把握位置と手の位置に応じて人手から対象物を取り出す計画実行手法を提案する。
論文 参考訳(メタデータ) (2020-03-12T19:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。