論文の概要: Why Do LLMs Struggle in Strategic Play? Broken Links Between Observations, Beliefs, and Actions
- arxiv url: http://arxiv.org/abs/2605.00226v1
- Date: Thu, 30 Apr 2026 21:04:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.752167
- Title: Why Do LLMs Struggle in Strategic Play? Broken Links Between Observations, Beliefs, and Actions
- Title(参考訳): LLMはなぜ戦略的なプレイでゆがむのか? 観察、信念、行動のリンクを壊す
- Authors: Jan Sobotka, Mustafa O. Karabag, Ufuk Topcu,
- Abstract要約: 大規模言語モデル(LLM)は、不完全な情報の下での戦略的意思決定にますます取り組まれている。
不完全情報ゲームにおけるLSMの意思決定の基盤となる内部メカニズムには,2つの根本的なギャップがある。
- 参考スコア(独自算出の注目度): 22.817330994735254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) are increasingly tasked with strategic decision-making under incomplete information, such as in negotiation and policymaking. While LLMs can excel at many such tasks, they also fail in ways that are poorly understood. We shed light on these failures by uncovering two fundamental gaps in the internal mechanisms underlying the decision-making of LLMs in incomplete-information games, supported by experiments with open-weight models Llama 3.1, Qwen3, and gpt-oss. First, an observation-belief gap: LLMs encode internal beliefs about latent game states that are substantially more accurate than their own verbal reports, yet these beliefs are brittle. In particular, the belief accuracy degrades with multi-hop reasoning, exhibits primacy and recency biases, and drifts away from Bayesian coherence over extended interactions. Second, a belief-action gap: The implicit conversion of internal beliefs into actions is weaker than that of the beliefs externalized in the prompt, yet neither belief-conditioning consistently achieves higher game payoffs. These results show how analyzing LLMs' internal processes can expose systematic vulnerabilities that warrant caution before deploying LLMs in strategic domains without robust guardrails.
- Abstract(参考訳): 大規模言語モデル(LLM)は、交渉や政策決定といった不完全な情報の下での戦略的意思決定にますます取り組まれている。
LLMは多くのタスクに優れるが、理解が不十分な方法で失敗する。
オープンウェイトモデル Llama 3.1, Qwen3, gpt-oss を用いた実験により, 不完全情報ゲームにおける LLM の意思決定の基盤となる内部メカニズムの2つの基本的なギャップを明らかにすることにより, これらの失敗を浮き彫りにした。
LLMは、潜在ゲームについての内的信念を符号化し、彼らの言葉による報告よりもかなり正確であるが、これらの信念は脆弱である。
特に、信念の正確さはマルチホップ推論によって低下し、優性や傾向バイアスを示し、拡張された相互作用よりもベイズ的コヒーレンスから遠ざかる。
第二に、信念-行動ギャップ: 内部の信念の行動への暗黙的な変換は、プロンプトで外部化された信念よりも弱いが、信念-条件が常により高いゲームペイオフを達成することはない。
これらの結果は,LSMの内部プロセスを分析することで,ロバストガードレールを使わずに戦略的ドメインにLSMを配置する前に,警告を保証できる系統的脆弱性を明らかにすることができることを示す。
関連論文リスト
- Are Reasoning LLMs Robust to Interventions on Their Chain-of-Thought? [79.86483056611105]
推論 LLM は、答えを出す前にステップバイステップの思考連鎖を生成する。
これらの推論は、その内部で発生する破壊の痕跡をどれほど堅牢にしていますか?
一定のタイミングでモデル自身のCoTを摂動させる制御された評価フレームワークを導入する。
論文 参考訳(メタデータ) (2026-02-07T10:02:58Z) - The Facade of Truth: Uncovering and Mitigating LLM Susceptibility to Deceptive Evidence [49.94160400740222]
MisBeliefは、協調的な多ラウンドの相互作用によって誤解を招く証拠を生成するフレームワークである。
MisBeliefを用いて、3つの難易度で4,800のインスタンスを生成し、7つの代表的なLCMを評価する。
結果は、モデルは直接的な誤報に対して堅牢であるが、この洗練された証拠に非常に敏感であることを示している。
本稿では,疑似意図を証拠裏で推測することにより早期警告信号を提供するガバナンス機構である,認知的意図遮蔽(DIS)を提案する。
論文 参考訳(メタデータ) (2026-01-09T02:28:00Z) - Incoherent Beliefs & Inconsistent Actions in Large Language Models [33.54139088666698]
現実世界のタスクや環境は、大きな言語モデル(LLM)が一般的に評価される静的データセットとは異なる。
LLMのパフォーマンスの2つの重要な要素について検討する: LLMが彼らの信念を一貫性を持って更新する能力と、彼らが取っている行動がそれらの信念と整合している範囲である。
本結果は,複雑な実世界の環境下でのLCMの挙動を予測することの難しさを浮き彫りにする。
論文 参考訳(メタデータ) (2025-11-17T11:04:00Z) - Reason-KE++: Aligning the Process, Not Just the Outcome, for Faithful LLM Knowledge Editing [63.96040994220329]
SFTに基づく手法、例えばReason-KEは「偽りのギャップ」に悩まされている。
このギャップにより、LLMの強力なパラメトリック先行は、新しい文脈事実をオーバーライドすることができる。
本稿では,プロセスレベルの忠実性を具現化するSFT+RLフレームワークReason-KE++を提案する。
論文 参考訳(メタデータ) (2025-11-16T15:49:01Z) - Beyond Prompt-Induced Lies: Investigating LLM Deception on Benign Prompts [79.1081247754018]
大規模言語モデル(LLM)は、推論、計画、意思決定のタスクに広くデプロイされている。
そこで我々は, 接触探索質問(CSQ)に基づく枠組みを提案し, 騙しの可能性を定量化する。
論文 参考訳(メタデータ) (2025-08-08T14:46:35Z) - How to Protect Yourself from 5G Radiation? Investigating LLM Responses to Implicit Misinformation [35.365004091470944]
大規模言語モデル(LLM)は多様なシナリオに広くデプロイされている。
彼らが誤報をうまく広める程度は、重大な安全上の懸念として浮かび上がっている。
私たちは、暗黙の誤報の最初のベンチマークであるEchoMistをキュレートしました。
論文 参考訳(メタデータ) (2025-03-12T17:59:18Z) - Aligning Large Language Models for Faithful Integrity Against Opposing Argument [71.33552795870544]
大規模言語モデル(LLM)は複雑な推論タスクにおいて印象的な機能を示している。
原文が正しい場合でも、会話中に不誠実な議論によって容易に誤解される。
本稿では,信頼度と信頼度を両立させる新しい枠組みを提案する。
論文 参考訳(メタデータ) (2025-01-02T16:38:21Z) - Dissecting the Ullman Variations with a SCALPEL: Why do LLMs fail at Trivial Alterations to the False Belief Task? [1.4936946857731093]
SCALPEL -- LLMが失敗する理由に関するさまざまな仮説をテストするために、刺激を段階的に修正するテクニックを導入します。
以上の結果から,LLMは本質的な常識推論を行なわなかったため,よくうまくいかないことが示唆された。
現代のLLMは単なるパターンマッチングを超えてはいるものの、頑健な人間のようなToMには相変わらず不足していると結論付けている。
論文 参考訳(メタデータ) (2024-06-20T21:02:30Z) - GTBench: Uncovering the Strategic Reasoning Limitations of LLMs via Game-Theoretic Evaluations [87.99872683336395]
大規模言語モデル(LLM)は、重要な現実世界のアプリケーションに統合される。
本稿では,LLMの競合環境における推論能力について検討する。
まず,広く認識されている10のタスクを構成する言語駆動型環境であるGTBenchを提案する。
論文 参考訳(メタデータ) (2024-02-19T18:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。