論文の概要: Towards Machine Theory of Mind with Large Language Model-Augmented Inverse Planning
- arxiv url: http://arxiv.org/abs/2507.03682v1
- Date: Fri, 04 Jul 2025 16:01:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.834027
- Title: Towards Machine Theory of Mind with Large Language Model-Augmented Inverse Planning
- Title(参考訳): 大規模言語モデルによる逆計画による心の機械理論に向けて
- Authors: Rebekah A. Gelpí, Eric Xue, William A. Cunningham,
- Abstract要約: 本稿では,大言語モデル(LLM)を仮説と可能性関数を生成するメカニズムとして用いたマシン理論(ToM)のハイブリッド手法を提案する。
また、オープンエンドタスクにおいて精神状態を予測するモデルの可能性を示す。
- 参考スコア(独自算出の注目度): 0.022940141855172035
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We propose a hybrid approach to machine Theory of Mind (ToM) that uses large language models (LLMs) as a mechanism for generating hypotheses and likelihood functions with a Bayesian inverse planning model that computes posterior probabilities for an agent's likely mental states given its actions. Bayesian inverse planning models can accurately predict human reasoning on a variety of ToM tasks, but these models are constrained in their ability to scale these predictions to scenarios with a large number of possible hypotheses and actions. Conversely, LLM-based approaches have recently demonstrated promise in solving ToM benchmarks, but can exhibit brittleness and failures on reasoning tasks even when they pass otherwise structurally identical versions. By combining these two methods, this approach leverages the strengths of each component, closely matching optimal results on a task inspired by prior inverse planning models and improving performance relative to models that utilize LLMs alone or with chain-of-thought prompting, even with smaller LLMs that typically perform poorly on ToM tasks. We also exhibit the model's potential to predict mental states on open-ended tasks, offering a promising direction for future development of ToM models and the creation of socially intelligent generative agents.
- Abstract(参考訳): エージェントの精神状態に対する後部確率を計算するベイズ逆計画モデルを用いて,大きな言語モデル(LLM)を仮説と可能性関数を生成するメカニズムとして用いたマシン理論(ToM)のハイブリッドアプローチを提案する。
ベイズ逆計画モデルは、様々なToMタスクで人間の推論を正確に予測することができるが、これらのモデルは、これらの予測を多くの仮説とアクションを持つシナリオに拡張する能力に制約されている。
逆に、LLMベースのアプローチは、最近ToMベンチマークの解決の可能性を実証しているが、構造的に同じバージョンをパスしても、推論タスクの脆さと失敗を示すことができる。
これらの2つの手法を組み合わせることで、各コンポーネントの強みを活用し、従来の逆計画モデルにインスパイアされたタスク上で最適な結果と密に一致し、通常ToMタスクでは不十分な小さなLSMであっても、LSMのみまたはチェーン・オブ・プルーピングのモデルと比較して性能が向上する。
また、オープンエンドタスクにおいて精神状態を予測するモデルの可能性を示し、ToMモデルの将来の発展と社会的にインテリジェントな生成エージェントの創出に有望な方向性を提供する。
関連論文リスト
- Overcoming Multi-step Complexity in Multimodal Theory-of-Mind Reasoning: A Scalable Bayesian Planner [32.33827730707331]
本稿では,ToM推論を段階的にベイズ更新に分解するスケーラブルなベイズToMプランナを提案する。
提案フレームワークでは,より小さな言語モデルでToM固有の推定を専門に行うことのできる,弱いストロング制御を導入している。
提案手法は,マルチモーダルToMベンチマークにおける最先端技術よりも4.6%の精度向上を実現している。
論文 参考訳(メタデータ) (2025-06-02T04:23:45Z) - AutoToM: Scaling Model-based Mental Inference via Automated Agent Modeling [8.034600950988535]
AutoToMは、スケーラブルで堅牢で解釈可能なメンタル推論のための自動エージェントモデリング手法である。
我々は,AutoToMが人間のような信頼度を推定し,具体的意思決定のためのオンライン精神推論を可能にすることを示す。
論文 参考訳(メタデータ) (2025-02-21T18:57:52Z) - On the Modeling Capabilities of Large Language Models for Sequential Decision Making [52.128546842746246]
大規模な事前訓練されたモデルでは、推論や計画タスクのパフォーマンスがますます向上している。
我々は、直接的または間接的に、意思決定ポリシーを作成する能力を評価する。
未知の力学を持つ環境において、合成データを用いた微調整LDMが報酬モデリング能力を大幅に向上させる方法について検討する。
論文 参考訳(メタデータ) (2024-10-08T03:12:57Z) - Deliberate Reasoning in Language Models as Structure-Aware Planning with an Accurate World Model [14.480267340831542]
高精度世界モデル(SWAP)による構造認識計画
SWAPは構造化知識表現と学習計画を統合する。
SWAPは,数理推論,論理推論,コーディングタスクなど,多種多様な推論集約型ベンチマークで評価される。
論文 参考訳(メタデータ) (2024-10-04T04:23:36Z) - Investigating the Impact of Model Complexity in Large Language Models [3.7919508292745676]
事前訓練された微調整パラダイムに基づく大規模言語モデル(LLM)は、自然言語処理タスクの解決において重要な役割を担っている。
本稿では,自己回帰 LLM に着目し,HMM (Hidden Markov Models) を用いたモデリングを提案する。
論文 参考訳(メタデータ) (2024-10-01T13:53:44Z) - MAP: Low-compute Model Merging with Amortized Pareto Fronts via Quadratic Approximation [80.47072100963017]
Amortized Pareto Front (MAP) を用いた新しい低演算アルゴリズム Model Merging を導入する。
MAPは、複数のモデルをマージするためのスケーリング係数のセットを効率的に識別し、関連するトレードオフを反映する。
また,タスク数が比較的少ないシナリオではベイジアンMAP,タスク数の多い状況ではNested MAPを導入し,計算コストを削減した。
論文 参考訳(メタデータ) (2024-06-11T17:55:25Z) - Limits of Theory of Mind Modelling in Dialogue-Based Collaborative Plan Acquisition [8.919069368217594]
心の理論(ToM)モデリングは、非対称なスキルセットと知識を持つ設定において、不足する知識予測を改善することができる。
我々は、CPAの性能が自分の知識の欠如を予測するときにほぼ2倍になるので、ToMモデリングによる改善は減少することを示した。
論文 参考訳(メタデータ) (2024-05-21T09:23:39Z) - Predictable MDP Abstraction for Unsupervised Model-Based RL [93.91375268580806]
予測可能なMDP抽象化(PMA)を提案する。
元のMDPで予測モデルを訓練する代わりに、学習されたアクション空間を持つ変換MDPでモデルを訓練する。
我々はPMAを理論的に解析し、PMAが以前の教師なしモデルベースRLアプローチよりも大幅に改善することを示す。
論文 参考訳(メタデータ) (2023-02-08T07:37:51Z) - Forethought and Hindsight in Credit Assignment [62.05690959741223]
我々は、前向きモデルや後向きモデルによる後向き操作による予測として使われる計画の利益と特異性を理解するために活動する。
本稿では,予測を(再)評価すべき状態の選択に主眼を置いて,計画におけるモデルの利用について検討する。
論文 参考訳(メタデータ) (2020-10-26T16:00:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。