論文の概要: What Do You Think I Think? Accounting for Human Beliefs Using Second-Order Theory of Mind
- arxiv url: http://arxiv.org/abs/2605.12745v1
- Date: Tue, 12 May 2026 20:49:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.685726
- Title: What Do You Think I Think? Accounting for Human Beliefs Using Second-Order Theory of Mind
- Title(参考訳): 私がどう思うか? 2次心論を用いた人間信念の考察
- Authors: Patrick Callaghan, Reid Simmons, Henny Admoni,
- Abstract要約: I-POMDPを2階の心の理論(ToM-2)の枠組みとして使用することにより、エージェントに関する誤った信念の進化をモデル化する能力を持つエージェントを提供する。
エージェントは、対話中にCBHがいつプレイされているかを検出し、それらを考慮に入れたフィードバックを適応的に生成する。
In-person user studyでは、ToM-2学習者が教師のCBHの効果を考慮し、教師の行動の情報性を大幅に向上させる方法を示している。
- 参考スコア(独自算出の注目度): 2.8899723681039475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discrepancies between an agent's actual knowledge and what a person thinks the agent knows can hinder interactions. If an agent could detect such discrepancies, it could provide feedback to account for them and improve current and future interactions. Using the I-POMDP as a framework for a second-order Theory of Mind (ToM-2), this work endows an agent with the ability to model the evolution of a person's erroneous beliefs about an agent and the cognitive biases and heuristics (CBH) from which they arise. In doing so, the agent can detect when CBH might be at play during an interaction and adaptively generate feedback that accounts for them. An in-person user study shows how a ToM-2 learner can account for the effects of a teacher's CBH to significantly improve the informativeness of teacher actions, and subjective results suggest people find the ToM-2 learner's feedback more useful.
- Abstract(参考訳): エージェントの実際の知識とエージェントが知っていると考えるものとの違いは、相互作用を妨げる。
もしエージェントがそのような不一致を検知できれば、それらを考慮し、現在と将来の相互作用を改善するフィードバックを提供することができる。
I-POMDPを第2次心の理論(ToM-2)の枠組みとして使用することにより、エージェントに関する誤った信念とそれらが生み出す認知バイアスとヒューリスティックス(CBH)の進化をモデル化する能力を持つエージェントを提供する。
エージェントは、対話中にCBHがいつプレイされているかを検出し、それらを考慮に入れたフィードバックを適応的に生成する。
In-person user study is shown how a ToM-2 learner can account of the effects of a teacher's CBH to significantly improve the informationativeness of teacher actions and subjective results suggest people find the ToM-2 learner's feedback more useful。
関連論文リスト
- Don't lie to your friends: Learning what you know from collaborative self-play [63.0121884175594]
我々は、AIエージェントが知っていることを教えるために、根本的に新しいアプローチを提案する。
我々は,集団が正解に到達して報奨を受けるマルチエージェントコラボレーションを構築した。
望ましいメタ知識は、相互作用の構造に組み込まれたインセンティブから生まれる。
論文 参考訳(メタデータ) (2025-03-18T17:53:20Z) - Large Language Models as Theory of Mind Aware Generative Agents with Counterfactual Reflection [31.38516078163367]
ToM-agentは、オープンドメインの会話相互作用において、LLMベースの生成エージェントがToMをシミュレートできるように設計されている。
ToM-Adntは、精神状態に対するエージェントの認識のエミュレーションを促進するため、精神状態からの信頼を解き放つ。
以上の結果から,ToM-agentは,意味的情緒的支援や意思決定に限らず,相手の行動の根底にある要因を把握できることが示唆された。
論文 参考訳(メタデータ) (2025-01-26T00:32:38Z) - Position: Theory of Mind Benchmarks are Broken for Large Language Models [41.832853832803046]
我々の論文は、大きな言語モデルが新しいパートナーにどのように適応するかを直接テストできないため、マインドベンチマークの大多数が壊れていると論じている。
この問題は、心の理論が人間の心の理論をテストする方法から圧倒的にインスピレーションを受けているという事実に起因している。
本稿では,精神機能理論の概念を紹介し,その行動に対する合理的な反応に従って,文脈内でエージェントに適応する能力について紹介する。
論文 参考訳(メタデータ) (2024-12-27T16:30:12Z) - Information Design in Multi-Agent Reinforcement Learning [61.140924904755266]
強化学習(Reinforcement Learning、RL)は、人間の幼児や動物が環境から学ぶ方法にインスパイアされている。
計算経済学の研究は、他者に直接影響を与える2つの方法を蒸留する: 有形物(機械設計)の提供と情報(情報設計)の提供である。
論文 参考訳(メタデータ) (2023-05-08T07:52:15Z) - My Actions Speak Louder Than Your Words: When User Behavior Predicts
Their Beliefs about Agents' Attributes [5.893351309010412]
行動科学は、人々が時々無関係な情報を使用することを示唆している。
この現象の例としては、人間とエージェントの相互作用においてより良い結果を経験したユーザーが、そのエージェントをより優れた能力を持ち、好意的であり、また、自身の行動の結果である、より悪い結果を経験したユーザーよりも、ポストホックアセスメントにおいてより整合性を示すと体系的に評価した。
分析の結果,モデルの拡張の必要性が示唆され,そのような偏見を考慮し,エージェントがこのようなバイアスを検知し,積極的に行動し,ユーザの類似した偏見を補正するメカニズムも説明できる。
論文 参考訳(メタデータ) (2023-01-21T21:26:32Z) - Define, Evaluate, and Improve Task-Oriented Cognitive Capabilities for
Instruction Generation Models [5.975913042883176]
最近の研究は、人間のために設計された心理学的テストを通して言語モデルの認知能力を研究する。
我々は、言語モデルがタスクを実行するために利用する人間のような認知能力であるタスク指向認知能力を定式化する。
論文 参考訳(メタデータ) (2022-12-21T04:43:19Z) - Learning Theory of Mind via Dynamic Traits Attribution [59.9781556714202]
本稿では,過去のトラジェクトリからアクターの潜在特性ベクトルを生成するニューラルToMアーキテクチャを提案する。
この特性ベクトルは、予測ニューラルネットワークの高速重み付けスキームを介して予測機構を乗法的に変調する。
実験により,高速重量はエージェントの特性をモデル化し,マインドリーディング能力を向上させるために優れた誘導バイアスを与えることが示された。
論文 参考訳(メタデータ) (2022-04-17T11:21:18Z) - An Algorithmic Theory of Metacognition in Minds and Machines [1.52292571922932]
強化学習におけるトレードオフをよく理解したメタ認知のアルゴリズム理論を提案する。
深層MACを実装することにより,機械におけるメタ認知の作り方を示す。
論文 参考訳(メタデータ) (2021-11-05T22:31:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。