論文の概要: Planning for Proactive Assistance in Environments with Partial
Observability
- arxiv url: http://arxiv.org/abs/2105.00525v1
- Date: Sun, 2 May 2021 18:12:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-05 00:55:36.462708
- Title: Planning for Proactive Assistance in Environments with Partial
Observability
- Title(参考訳): 部分観測可能な環境におけるアクティブな支援計画
- Authors: Anagha Kulkarni, Siddharth Srivastava and Subbarao Kambhampati
- Abstract要約: 本稿では,人間に積極的なタスク支援を提供するAIエージェントの動作を合成する問題に対処する。
エージェントは、援助が彼女のタスクにどのように影響するかを人間が認識していることを保証することが重要です。
- 参考スコア(独自算出の注目度): 26.895668587111757
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the problem of synthesizing the behavior of an AI agent
that provides proactive task assistance to a human in settings like factory
floors where they may coexist in a common environment. Unlike in the case of
requested assistance, the human may not be expecting proactive assistance and
hence it is crucial for the agent to ensure that the human is aware of how the
assistance affects her task. This becomes harder when there is a possibility
that the human may neither have full knowledge of the AI agent's capabilities
nor have full observability of its activities. Therefore, our \textit{proactive
assistant} is guided by the following three principles: \textbf{(1)} its
activity decreases the human's cost towards her goal; \textbf{(2)} the human is
able to recognize the potential reduction in her cost; \textbf{(3)} its
activity optimizes the human's overall cost (time/resources) of achieving her
goal. Through empirical evaluation and user studies, we demonstrate the
usefulness of our approach.
- Abstract(参考訳): 本稿では,共通の環境下で共存する工場フロアのような環境において,人間に積極的なタスク支援を提供するAIエージェントの動作を合成する問題に対処する。
要求された援助と異なり、人間は積極的援助を期待していないため、エージェントは、人がその援助が彼女のタスクにどう影響するかを知ることが不可欠である。
これは、人間がAIエージェントの能力について完全な知識を持っていないり、アクティビティの完全な可観測性を持っていない場合、難しくなります。
したがって、我々の \textit{proactive assistant} は以下の3つの原則によって導かれる: \textbf{(1)} その活動は人間の目標に対するコストを減少させる; \textbf{(2)} 人間は彼女のコストの潜在的な削減を認識することができる; \textbf{(3)} その活動は彼女の目標を達成するための全体のコスト(時間/資源)を最適化する。
経験的評価とユーザスタディを通して,本手法の有用性を実証する。
関連論文リスト
- Improving Grounded Language Understanding in a Collaborative Environment
by Interacting with Agents Through Help Feedback [42.19685958922537]
我々は、人間とAIのコラボレーションは対話的であり、人間がAIエージェントの作業を監視し、エージェントが理解し活用できるフィードバックを提供するべきだと論じている。
本研究では, IGLUコンペティションによって定義された課題である, マイニングクラフトのような世界における対話型言語理解タスクを用いて, これらの方向を探索する。
論文 参考訳(メタデータ) (2023-04-21T05:37:59Z) - Rearrange Indoor Scenes for Human-Robot Co-Activity [82.22847163761969]
本稿では,室内家具を人間ロボットのコアクティビティを向上するために,室内家具の配置を最適化した枠組みを提案する。
提案アルゴリズムは,SUNCGとConceptNetから抽出した空間的・意味的共起情報を統合することにより,家具間の機能的関係を保っている。
実験の結果、アレンジされたシーンは平均して14%のスペースを提供し、30%以上のオブジェクトをやりとりできることがわかった。
論文 参考訳(メタデータ) (2023-03-10T03:03:32Z) - Robust Robot Planning for Human-Robot Collaboration [11.609195090422514]
人間とロボットのコラボレーションにおいて、人間の目的はしばしばロボットに未知である。
本研究では,各目的関数に対して不確実な人間行動(ポリシー)を自動的に生成する手法を提案する。
また,上記の不確実性に対して頑健なロボット計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T16:02:48Z) - When to Ask for Help: Proactive Interventions in Autonomous
Reinforcement Learning [57.53138994155612]
強化学習の長期的な目標は、世界で自律的に対話し学習できるエージェントを設計することである。
重要な課題は、ロボットアームが物体をテーブルから押し出したときなど、外部からの援助を必要とする不可逆状態の存在である。
本研究では,非可逆状態の検出と回避を効率よく学習し,エージェントが侵入した場合に積極的に支援を求めるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-19T17:57:24Z) - Balancing Performance and Human Autonomy with Implicit Guidance Agent [8.071506311915396]
暗黙のガイダンスは、人間が計画の改善と自律性維持のバランスを維持するために有効であることを示す。
我々は、ベイズ的思考理論を既存の協調計画アルゴリズムに統合することにより、暗黙のガイダンスを持つ協調エージェントをモデル化した。
論文 参考訳(メタデータ) (2021-09-01T14:47:29Z) - Recent Advances in Leveraging Human Guidance for Sequential
Decision-Making Tasks [60.380501589764144]
人工知能の長年の目標は、シーケンシャルな意思決定を必要とするタスクを実行することを学ぶことができる人工知能を作ることである。
学習し行動する人工エージェントであるが、実行すべき特定のタスクを特定するのは人間次第である。
この調査は、主に人間のガイダンスに依存する5つの最近の機械学習フレームワークのハイレベルな概要を提供する。
論文 参考訳(メタデータ) (2021-07-13T03:11:04Z) - Mitigating Negative Side Effects via Environment Shaping [27.400267388362654]
非構造環境で作動するエージェントは、しばしば負の副作用(NSE)を引き起こす
本稿では,この問題を解き,理論特性を解析するアルゴリズムを提案する。
提案手法は,エージェントが割り当てられたタスクを完了させる能力に影響を与えずに,nseを効果的に緩和できることを示す。
論文 参考訳(メタデータ) (2021-02-13T22:15:00Z) - Reinforcement Learning with Efficient Active Feature Acquisition [59.91808801541007]
実生活では、情報取得は患者の医療検査に該当する可能性がある。
本稿では,アクティブな特徴獲得ポリシーを学習するモデルに基づく強化学習フレームワークを提案する。
この成功の鍵は、部分的に観察された状態から高品質な表現を学ぶ新しい逐次変分自動エンコーダである。
論文 参考訳(メタデータ) (2020-11-02T08:46:27Z) - Watch-And-Help: A Challenge for Social Perception and Human-AI
Collaboration [116.28433607265573]
我々は、AIエージェントでソーシャルインテリジェンスをテストするための課題であるWatch-And-Help(WAH)を紹介する。
WAHでは、AIエージェントは、人間のようなエージェントが複雑な家庭用タスクを効率的に実行するのを助ける必要がある。
マルチエージェントの家庭環境であるVirtualHome-Socialを構築し、計画と学習ベースのベースラインを含むベンチマークを提供する。
論文 参考訳(メタデータ) (2020-10-19T21:48:31Z) - AvE: Assistance via Empowerment [77.08882807208461]
そこで我々は,人間の環境制御能力を高めることで,支援のための新しいパラダイムを提案する。
このタスクに依存しない目的は、個人の自律性と最終的な状態を達成する能力を維持する。
論文 参考訳(メタデータ) (2020-06-26T04:40:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。