論文の概要: Collaborative Decision Making Using Action Suggestions
- arxiv url: http://arxiv.org/abs/2209.13160v1
- Date: Tue, 27 Sep 2022 05:16:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 15:24:08.117124
- Title: Collaborative Decision Making Using Action Suggestions
- Title(参考訳): 行動提案を用いた協調意思決定
- Authors: Dylan M. Asmar and Mykel J. Kochenderfer
- Abstract要約: 本稿では,行動選択を改善する行動提案を通じて協調的意思決定の手法を定式化する。
提案手法では,提案によって共有される暗黙の情報を組み込んで,エージェントの信念を変更する。
協調環境の仮定により,エージェントのポリシーを用いて行動提案よりも分布を推定することができる。
- 参考スコア(独自算出の注目度): 41.013477422930755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The level of autonomy is increasing in systems spanning multiple domains, but
these systems still experience failures. One way to mitigate the risk of
failures is to integrate human oversight of the autonomous systems and rely on
the human to take control when the autonomy fails. In this work, we formulate a
method of collaborative decision making through action suggestions that
improves action selection without taking control of the system. Our approach
uses each suggestion efficiently by incorporating the implicit information
shared through suggestions to modify the agent's belief and achieves better
performance with fewer suggestions than naively following the suggested
actions. We assume collaborative agents share the same objective and
communicate through valid actions. By assuming the suggested action is
dependent only on the state, we can incorporate the suggested action as an
independent observation of the environment. The assumption of a collaborative
environment enables us to use the agent's policy to estimate the distribution
over action suggestions. We propose two methods that use suggested actions and
demonstrate the approach through simulated experiments. The proposed
methodology results in increased performance while also being robust to
suboptimal suggestions.
- Abstract(参考訳): 自律性のレベルは、複数のドメインにまたがるシステムで増加しているが、これらのシステムは依然として障害を経験している。
障害のリスクを軽減する1つの方法は、自律システムの人間の監視を統合し、自律性が失敗したときに制御を人間に委ねることである。
本研究では,システム制御を行なわずに行動選択を改善する行動提案による協調的意思決定手法を提案する。
提案手法では,提案者の信念を変えるために提案によって共有される暗黙の情報を効果的に活用し,提案した行動に従うよりも少ない提案でより良い性能を達成する。
協調エージェントは同じ目的を共有し、有効な行動を通じてコミュニケーションをとると仮定する。
提案する動作が状態のみに依存すると仮定することで、提案するアクションを環境の独立した観察として組み込むことができる。
協調環境の仮定により,エージェントのポリシーを用いて行動提案よりも分布を推定することができる。
提案手法を2つ提案し,シミュレーション実験により提案手法を実証する。
提案手法により性能が向上し,提案手法の準最適性も向上する。
関連論文リスト
- Be Aware of the Neighborhood Effect: Modeling Selection Bias under Interference [50.95521705711802]
従来の研究では、予測モデルの偏りのない学習を実現するために、選択バイアスに対処することに注力してきた。
本稿では、因果推論の観点から、近隣効果を干渉問題として公式に定式化する。
本稿では,近隣効果の存在下で選択バイアスに対処できる新しい理想的損失を提案する。
論文 参考訳(メタデータ) (2024-04-30T15:20:41Z) - Optimising Human-AI Collaboration by Learning Convincing Explanations [62.81395661556852]
本研究では,人間による意思決定によって安全を保ちながら協調的なシステムを構築する手法を提案する。
Ardentは、説明のための個人の好みに適応することで、効率的で効果的な意思決定を可能にする。
論文 参考訳(メタデータ) (2023-11-13T16:00:16Z) - Mimicking Better by Matching the Approximate Action Distribution [48.95048003354255]
そこで我々は,Imitation Learning from Observationsのための新しい,サンプル効率の高いオンライン政治アルゴリズムMAADを紹介する。
我々は、専門家のパフォーマンスを達成するためには、かなり少ないインタラクションが必要であり、現在最先端の政治手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T12:43:47Z) - Action Pick-up in Dynamic Action Space Reinforcement Learning [6.15205100319133]
我々は,新しいアクションセットからパフォーマンスを高める可能性が最も高い価値あるアクションを自律的に選択するための,インテリジェントなアクションピックアップ(AP)アルゴリズムを提案する。
本稿では,まず,事前の最適政策が有用な知識と経験を提供することで,行動ピックアップにおいて重要な役割を担っていることを理論的に分析し,発見する。
次に、周波数に基づくグローバルメソッドと、事前の最適ポリシーに基づく状態クラスタリングに基づくローカルメソッドの2つの異なるAPメソッドを設計する。
論文 参考訳(メタデータ) (2023-04-03T10:55:16Z) - Learning to Generate All Feasible Actions [4.333208181196761]
アクションマッピングは、学習プロセスを2つのステップに分割する新しいアプローチである。
本稿では、実現可能性モデルの自己教師型クエリにより、実現可能なすべてのアクションを生成することを学ぶことで、実現可能性部分に焦点を当てる。
エージェントが接続不能な実行可能なアクションセット間でアクションを生成する能力を示す。
論文 参考訳(メタデータ) (2023-01-26T23:15:51Z) - On Optimizing Interventions in Shared Autonomy [5.385379526525158]
本稿では,自律エージェントによる介入回数を制限し,ユーザエクスペリエンスを向上させるためのアプローチについて議論する。
介入回数の厳密な制約とソフトな制約を考慮に入れたモデルフリー強化学習法を2つ提案する。
論文 参考訳(メタデータ) (2021-12-16T19:37:28Z) - Efficient Empowerment Estimation for Unsupervised Stabilization [75.32013242448151]
エンパワーメント原理は 直立位置での 力学系の教師なし安定化を可能にする
本稿では,ガウスチャネルとして動的システムのトレーニング可能な表現に基づく代替解を提案する。
提案手法は, サンプルの複雑さが低く, 訓練時より安定であり, エンパワーメント機能の本質的特性を有し, 画像からエンパワーメントを推定できることを示す。
論文 参考訳(メタデータ) (2020-07-14T21:10:16Z) - Incentivizing Exploration with Selective Data Disclosure [70.11902902106014]
効率的な探索を促すレコメンデーションシステムを提案し設計する。
エージェントは順次到着し、固定されたが未知のアクション固有の分布から引き出されたアクションを選択し、報酬を受け取る。
フレキシブル・頻繁な行動モデルを用いた探索において,最適な後悔率が得られる。
論文 参考訳(メタデータ) (2018-11-14T19:29:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。