論文の概要: NOPA: Neurally-guided Online Probabilistic Assistance for Building
Socially Intelligent Home Assistants
- arxiv url: http://arxiv.org/abs/2301.05223v1
- Date: Thu, 12 Jan 2023 18:59:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-13 14:00:23.662166
- Title: NOPA: Neurally-guided Online Probabilistic Assistance for Building
Socially Intelligent Home Assistants
- Title(参考訳): NOPA: 社会的にインテリジェントなホームアシスタント構築のためのニューラルネットワークによるオンライン確率的支援
- Authors: Xavier Puig and Tianmin Shu and Joshua B. Tenenbaum and Antonio
Torralba
- Abstract要約: われわれは、家庭内の人々を支援するために、社会的にインテリジェントなロボットを構築する方法を研究する。
ロボットは人間の目標を同時に推測しなければならない。
- 参考スコア(独自算出の注目度): 79.27554831580309
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we study how to build socially intelligent robots to assist
people in their homes. In particular, we focus on assistance with online goal
inference, where robots must simultaneously infer humans' goals and how to help
them achieve those goals. Prior assistance methods either lack the adaptivity
to adjust helping strategies (i.e., when and how to help) in response to
uncertainty about goals or the scalability to conduct fast inference in a large
goal space. Our NOPA (Neurally-guided Online Probabilistic Assistance) method
addresses both of these challenges. NOPA consists of (1) an online goal
inference module combining neural goal proposals with inverse planning and
particle filtering for robust inference under uncertainty, and (2) a helping
planner that discovers valuable subgoals to help with and is aware of the
uncertainty in goal inference. We compare NOPA against multiple baselines in a
new embodied AI assistance challenge: Online Watch-And-Help, in which a helper
agent needs to simultaneously watch a main agent's action, infer its goal, and
help perform a common household task faster in realistic virtual home
environments. Experiments show that our helper agent robustly updates its goal
inference and adapts its helping plans to the changing level of uncertainty.
- Abstract(参考訳): 本研究は,家庭の人を支援するために,社会的に知的なロボットを構築する方法を研究する。
特に,ロボットが同時に人間の目標を推定し,その目標を達成するのにどう役立つかという,オンライン目標推論の支援に焦点を当てる。
事前支援手法には、目標に対する不確実性に対応する支援戦略(例えば、いつ、どのように支援するか)を調整する適応性や、大きな目標空間で高速な推論を行うスケーラビリティが欠けている。
我々のNOPA(Neurally-guided Online Probabilistic Assistance)手法はこれらの課題に対処する。
NOPAは,1)不確実性下での堅牢な推論のための逆計画と粒子フィルタリングを組み合わせたオンラインゴール推論モジュールと,(2)ゴール推論における不確実性を認識し,有効なサブゴールを発見するための支援プランナーから構成される。
オンラインウォッチアンドヘルプ(Online Watch-And-Help)は、ヘルパーエージェントがメインエージェントのアクションを同時に監視し、その目標を推測し、現実的なバーチャルホーム環境で一般的な家庭用タスクを高速に実行できるようにする。
実験の結果,我々のエージェントは,目標推論を堅牢に更新し,その支援計画を変化する不確実性のレベルに適応させることがわかった。
関連論文リスト
- Learning to Assist Humans without Inferring Rewards [65.28156318196397]
我々は、エンパワーメントのレンズを通して支援を研究する先行研究に基づいて構築する。
補助剤は、人間の行動の影響を最大化することを目的としている。
これらの表現は、先行研究と類似したエンパワーメントの概念を推定する。
論文 参考訳(メタデータ) (2024-11-04T21:31:04Z) - Smart Help: Strategic Opponent Modeling for Proactive and Adaptive Robot Assistance in Households [30.33911147366425]
Smart Helpは、多様な障害を持つ人間のエージェントに対して、積極的にかつ適応的なサポートを提供することを目的としている。
本稿では,主エージェントの能力と目標の微妙な理解を提供する,イノベーティブな対戦相手モデリングモジュールを紹介する。
この結果から,AIを組み込んだ支援ロボットが,脆弱なグループの健康向上に寄与する可能性が示唆された。
論文 参考訳(メタデータ) (2024-04-13T13:03:59Z) - It Takes Four to Tango: Multiagent Selfplay for Automatic Curriculum
Generation [107.10235120286352]
汎用強化学習エージェントを効率的に訓練するには、ゴールカリキュラムの自動生成が必要である。
自動ゴール生成フレームワークCuSPを提案する。
本手法は,様々な制御タスクに対して,効率的な目標のカリキュラムを生成するのに有効であることを示す。
論文 参考訳(メタデータ) (2022-02-22T01:23:23Z) - Learning to Assist Agents by Observing Them [41.74498230885008]
動作の表現を生成する能力は、まずオフラインデータで事前訓練される。
我々は、補助エージェントが補助された人工エージェントの環境を操作できるグリッドワールドで設定をテストする。
論文 参考訳(メタデータ) (2021-10-04T10:38:59Z) - Watch-And-Help: A Challenge for Social Perception and Human-AI
Collaboration [116.28433607265573]
我々は、AIエージェントでソーシャルインテリジェンスをテストするための課題であるWatch-And-Help(WAH)を紹介する。
WAHでは、AIエージェントは、人間のようなエージェントが複雑な家庭用タスクを効率的に実行するのを助ける必要がある。
マルチエージェントの家庭環境であるVirtualHome-Socialを構築し、計画と学習ベースのベースラインを含むベンチマークを提供する。
論文 参考訳(メタデータ) (2020-10-19T21:48:31Z) - AvE: Assistance via Empowerment [77.08882807208461]
そこで我々は,人間の環境制御能力を高めることで,支援のための新しいパラダイムを提案する。
このタスクに依存しない目的は、個人の自律性と最終的な状態を達成する能力を維持する。
論文 参考訳(メタデータ) (2020-06-26T04:40:11Z) - Automatic Curriculum Learning through Value Disagreement [95.19299356298876]
新しい未解決タスクを継続的に解決することが、多様な行動を学ぶための鍵です。
エージェントが複数の目標を達成する必要があるマルチタスク領域では、トレーニング目標の選択はサンプル効率に大きな影響を与える可能性がある。
そこで我々は,エージェントが解決すべき目標のための自動カリキュラムを作成することを提案する。
提案手法は,13のマルチゴールロボットタスクと5つのナビゲーションタスクにまたがって評価し,現在の最先端手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2020-06-17T03:58:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。