論文の概要: Self-Explaining Deviations for Coordination
- arxiv url: http://arxiv.org/abs/2207.12322v1
- Date: Wed, 13 Jul 2022 20:56:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-31 14:19:14.908920
- Title: Self-Explaining Deviations for Coordination
- Title(参考訳): 協調のための自己説明的偏差
- Authors: Hengyuan Hu, Samuel Sokota, David Wu, Anton Bakhtin, Andrei Lupu,
Brandon Cui, Jakob N. Foerster
- Abstract要約: 我々は、人間が自己説明的逸脱(SED)を発見することができる調整問題の特定のサブクラスに焦点を当てる。
SEDは、通常の状況で合理的な振る舞いが何であるかを共通の理解から逸脱する行動である。
本稿では,自己説明的偏差(IMPROVISED)を最大化してSEDを行う新しいアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 31.94421561348329
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fully cooperative, partially observable multi-agent problems are ubiquitous
in the real world. In this paper, we focus on a specific subclass of
coordination problems in which humans are able to discover self-explaining
deviations (SEDs). SEDs are actions that deviate from the common understanding
of what reasonable behavior would be in normal circumstances. They are taken
with the intention of causing another agent or other agents to realize, using
theory of mind, that the circumstance must be abnormal. We first motivate SED
with a real world example and formalize its definition. Next, we introduce a
novel algorithm, improvement maximizing self-explaining deviations
(IMPROVISED), to perform SEDs. Lastly, we evaluate IMPROVISED both in an
illustrative toy setting and the popular benchmark setting Hanabi, where it is
the first method to produce so called finesse plays, which are regarded as one
of the more iconic examples of human theory of mind.
- Abstract(参考訳): 完全な協調的、部分的に観測可能なマルチエージェント問題は、現実の世界においてユビキタスである。
本稿では,人間が自己説明的偏差(SED)を発見できる調整問題の,特定のサブクラスに焦点をあてる。
SEDは、通常の状況で合理的な振る舞いが何であるかを共通の理解から逸脱する行動である。
それらは、他のエージェントまたは他のエージェントに、心の理論を用いて、状況が異常であると認識させる意図をもって取られる。
まず実世界の例でSEDを動機付け、その定義を定式化する。
次に、SEDを実行するための自己説明偏差(IMPROVISED)を最大化する新しいアルゴリズムを提案する。
最後に、図解的な玩具設定と人気のベンチマーク設定の両方において即興的な評価を行い、人間の心の理論のより象徴的な例の1つと見なされる、いわゆるファインスプレイスを製作する最初の方法である。
関連論文リスト
- Action Inference by Maximising Evidence: Zero-Shot Imitation from
Observation with World Models [9.583751440005118]
我々は,この行動を世界モデルを用いて再現するために,エビデンスを最大化する行動推論(AIME)を提案する。
AIMEは、2つの異なるフェーズから構成されており、第1フェーズでは、エージェントが過去の経験から世界モデルを学び、ELBOを最大化することで自身の身体を理解する。
第2フェーズでは、エージェントは、新しいタスクを実行する専門家の観察のみのデモンストレーションを受け、専門家の行動を模倣しようとする。
本手法は実演後の世界モデルや環境とのオンラインインタラクションのさらなる訓練を必要としないという意味で「ゼロショット」である。
論文 参考訳(メタデータ) (2023-12-04T16:43:36Z) - UNcommonsense Reasoning: Abductive Reasoning about Uncommon Situations [62.71847873326847]
異常、予期せぬ、そしてありそうもない状況をモデル化する能力について検討する。
予期せぬ結果のコンテキストが与えられた場合、このタスクは説明を生成するために故意に推論する必要がある。
私たちはUNcommonsenseという新しい英語コーパスをリリースします。
論文 参考訳(メタデータ) (2023-11-14T19:00:55Z) - Habits and goals in synergy: a variational Bayesian framework for
behavior [22.461524318820672]
効果的かつ柔軟に振る舞う方法は、生物学的エージェントを理解し、インテリジェントなエンボディAIを作成するための中心的な問題である。
行動は2つのタイプに分類されることが知られている:報酬を最大化する習慣的行動。
我々は、変分ベイズ理論の原理に基づいて、2つの挙動のギャップを埋めることを提案する。
論文 参考訳(メタデータ) (2023-04-11T06:28:14Z) - Resonating Minds -- Emergent Collaboration Through Hierarchical Active
Inference [0.0]
精神状態(意図,目標)のレベルでの自動調整プロセスが,協調的な問題解決につながるかを検討する。
協調エージェント(HAICA)の階層的アクティブ推論モデルを提案する。
本研究では,信念共鳴と能動的推論により,迅速かつ効率的なエージェント協調が可能であり,協調認知エージェントのビルディングブロックとして機能することを示す。
論文 参考訳(メタデータ) (2021-12-02T13:23:44Z) - Nested Counterfactual Identification from Arbitrary Surrogate
Experiments [95.48089725859298]
観測と実験の任意の組み合わせからネスト反事実の同定について検討した。
具体的には、任意のネストされた反事実を非ネストされたものへ写像できる反ファクト的非ネスト定理(英語版)(CUT)を証明する。
論文 参考訳(メタデータ) (2021-07-07T12:51:04Z) - Modeling the Mistakes of Boundedly Rational Agents Within a Bayesian
Theory of Mind [32.66203057545608]
我々は、ベイズ的マインド理論フレームワークを拡張し、目標、計画、行動の誤りを犯したかもしれない有理論的エージェントをモデル化する。
本研究では,扉の裏に宝石を閉じ込めたグリッドワールドパズル (i) とブロックスタッキングドメイン (ii) の2つの領域において,人間の目標推論を導出する実験を行う。
論文 参考訳(メタデータ) (2021-06-24T18:00:03Z) - End-to-End Learning and Intervention in Games [60.41921763076017]
ゲームにおける学習と介入のための統一的なフレームワークを提供する。
明示的および暗黙的な区別に基づく2つのアプローチを提案する。
分析結果は、実世界のいくつかの問題を用いて検証される。
論文 参考訳(メタデータ) (2020-10-26T18:39:32Z) - Machine Common Sense [77.34726150561087]
機械の常識は、人工知能(AI)において広範で潜在的に無拘束な問題のままである
本稿では、対人インタラクションのようなドメインに焦点を当てたコモンセンス推論のモデル化の側面について論じる。
論文 参考訳(メタデータ) (2020-06-15T13:59:47Z) - Agent-Based Simulation of Collective Cooperation: From Experiment to
Model [0.0]
我々は,人が密集した静的な群集を通り抜けたときに何が起こるのかを観察する実験を行う。
我々は,協力を必要とする状況に対するエージェントの認識と認知処理を取り入れたモデルを構築した。
エージェントが密集した群衆をうまく通過する能力は、心理的モデルの効果として現れる。
論文 参考訳(メタデータ) (2020-05-26T13:29:08Z) - Intrinsic Motivation for Encouraging Synergistic Behavior [55.10275467562764]
スパース・リワード・シナジスティック・タスクにおける強化学習の探索バイアスとしての本質的モチベーションの役割について検討した。
私たちのキーとなる考え方は、シナジスティックなタスクにおける本質的なモチベーションのための優れた指針は、エージェントが自分自身で行動している場合、達成できない方法で世界に影響を与える行動を取ることである。
論文 参考訳(メタデータ) (2020-02-12T19:34:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。