論文の概要: Learning Dynamic Belief Graphs for Theory-of-mind Reasoning
- arxiv url: http://arxiv.org/abs/2603.20170v1
- Date: Fri, 20 Mar 2026 17:46:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:39.265346
- Title: Learning Dynamic Belief Graphs for Theory-of-mind Reasoning
- Title(参考訳): ミンド推論のための動的信念グラフの学習
- Authors: Ruxiao Chen, Xilei Zhao, Thomas J. Cova, Frank A. Drews, Susu Xu,
- Abstract要約: 大規模言語モデル(LLM)を用いた心の理論(ToM)は、人々の暗黙的、進化的信念が、何を求めているか、不確実性の下でどのように振舞うかを推論する必要がある。
動的信念グラフとして精神状態を表すLLMベースのToMのための構造化認知軌道モデルを提案する。
我々のモデルは行動予測を大幅に改善し、人間の推論と整合した解釈可能な信念軌道を復元する。
- 参考スコア(独自算出の注目度): 5.807546348023422
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Theory of Mind (ToM) reasoning with Large Language Models (LLMs) requires inferring how people's implicit, evolving beliefs shape what they seek and how they act under uncertainty -- especially in high-stakes settings such as disaster response, emergency medicine, and human-in-the-loop autonomy. Prior approaches either prompt LLMs directly or use latent-state models that treat beliefs as static and independent, often producing incoherent mental models over time and weak reasoning in dynamic contexts. We introduce a structured cognitive trajectory model for LLM-based ToM that represents mental state as a dynamic belief graph, jointly inferring latent beliefs, learning their time-varying dependencies, and linking belief evolution to information seeking and decisions. Our model contributes (i) a novel projection from textualized probabilistic statements to consistent probabilistic graphical model updates, (ii) an energy-based factor graph representation of belief interdependencies, and (iii) an ELBO-based objective that captures belief accumulation and delayed decisions. Across multiple real-world disaster evacuation datasets, our model significantly improves action prediction and recovers interpretable belief trajectories consistent with human reasoning, providing a principled module for augmenting LLMs with ToM in high-uncertainty environment. https://anonymous.4open.science/r/ICML_submission-6373/
- Abstract(参考訳): 大規模言語モデル(LLM)による心の理論(ToM)推論では、人々の暗黙的かつ進化した信念が、彼らが求めているもの、不確実性の下でどのように振舞うかを推測する必要がある。
以前のアプローチでは、LSMを直接的に促すか、あるいは、信念を静的で独立したものとして扱う潜在状態モデルを使用するか、しばしば時間とともに一貫性のない精神モデルを生成し、動的文脈において弱い推論を行う。
LLMに基づくToMのための構造化認知軌道モデルを導入し、精神状態を動的信念グラフとして表現し、共同で潜伏した信念を推定し、その時間依存性を学習し、信念の進化を情報探索と意思決定に結びつける。
私たちのモデルは貢献します
(i)テキスト化された確率的ステートメントから一貫した確率的グラフィカルモデル更新への新規なプロジェクション。
二 信仰相互依存性のエネルギーに基づく因子グラフ表示、及び
三 信条の蓄積及び決定の遅れを捉えたELBOに基づく目的
複数の現実世界の災害避難データセット全体にわたって、我々のモデルは行動予測を大幅に改善し、人間の推論と整合した解釈可能な信念軌道を復元し、高い不確実性環境下でLLMをToMで拡張するための原則モジュールを提供する。
https://anonymous.4open.science/r/ICML_submission-6373/
関連論文リスト
- Dynamic Theory of Mind as a Temporal Memory Problem: Evidence from Large Language Models [0.8666275811953881]
心の理論 (ToM) は社会的認知と人間とAIの相互作用の中心である。
大規模言語モデル(LLM)はToMの理解と表現に役立つ。
我々はDTOM-Trackを導入し、制御されたマルチターン会話における時間的信念推論について検討する。
論文 参考訳(メタデータ) (2026-03-15T22:54:03Z) - Beyond Words: Evaluating and Bridging Epistemic Divergence in User-Agent Interaction via Theory of Mind [8.740788873949471]
大規模言語モデル(LLM)は急速に発展し、汎用タスクと専門タスクの両方に広く応用されている。
意図や指示が不正確に伝達されるとき、彼らは依然として、真のユーザニーズを理解し、応答するのに苦労しています。
論文 参考訳(メタデータ) (2026-02-14T16:01:59Z) - Analyzing Reasoning Consistency in Large Multimodal Models under Cross-Modal Conflicts [74.47786985522762]
テキスト慣性(textual inertia)と呼ばれる重要な障害モードを特定し、矛盾する視覚的証拠を無視しながら、モデルは間違ったテキストに盲目的に固執する傾向がある。
本稿では,多種多様なLMMの推論連鎖に摂動を構造的に注入するLogicGraph摂動プロトコルを提案する。
その結果,10%未満の症例で自己修正が成功し,主に視覚的テキスト誤りの伝播に寄与することが判明した。
論文 参考訳(メタデータ) (2026-01-07T16:39:34Z) - Forgetting as a Feature: Cognitive Alignment of Large Language Models [39.146761527401424]
本研究では,Large Language Models (LLM) が過去の情報を体系的に忘れていることを示す。
人間の記憶力学からインスピレーションを得て,LLM推論を指数的崩壊によって支配される確率的記憶過程としてモデル化する。
これらの観測に基づいて,人間のような記憶崩壊を模倣するエビデンス統合を形作る軽量な戦略である確率的記憶促進法を提案する。
論文 参考訳(メタデータ) (2025-12-28T10:43:00Z) - Active Confusion Expression in Large Language Models: Leveraging World Models toward Better Social Reasoning [31.08532996770416]
大規模言語モデル(LLM)は、認知的混乱、論理的矛盾、および客観的世界状態と主観的信念状態の衝突を示す。
本研究では,動的テキスト世界モデルを構築し,実体状態と時間的シーケンスを追跡する適応的世界モデル拡張推論機構を提案する。
論文 参考訳(メタデータ) (2025-10-09T09:07:31Z) - Superficial Self-Improved Reasoners Benefit from Model Merging [49.09091498084467]
高品質データコーパスの合成ソリューションとしての自己改善
特に,本分析の結果から,LMがドメイン内推論の精度を向上したとしても,それらの一般的な推論能力を損なうことが判明した。
提案手法は,オリジナルモデルと自己改善モデルとの重みを戦略的に組み合わせ,一般化を保ちながら反復モデルマージング(IMM)を提案する。
論文 参考訳(メタデータ) (2025-03-03T22:41:25Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。