Fugu-MT 論文翻訳(概要): LLM Reasoning Is Latent, Not the Chain of Thought

論文の概要: LLM Reasoning Is Latent, Not the Chain of Thought

arxiv url: http://arxiv.org/abs/2604.15726v1
Date: Fri, 17 Apr 2026 05:59:08 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-20 22:00:19.75786
Title: LLM Reasoning Is Latent, Not the Chain of Thought
Title（参考訳）: LLMの推論は遅すぎる、思考の連鎖ではない
Authors: Wenshuo Wang,
Abstract要約: 大規模言語モデル(LLM)推論は潜在状態軌跡形成として研究されるべきである。これは、忠実性、解釈可能性、推論ベンチマーク、推論時間の介入に関する主張がすべて、推論の主要な対象である分野にかかっているためである。
参考スコア（独自算出の注目度）: 3.0001636668817597
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This position paper argues that large language model (LLM) reasoning should be studied as latent-state trajectory formation rather than as faithful surface chain-of-thought (CoT). This matters because claims about faithfulness, interpretability, reasoning benchmarks, and inference-time intervention all depend on what the field takes the primary object of reasoning to be. We ask what that object should be once three often-confounded factors are separated and formalize three competing hypotheses: H1, reasoning is primarily mediated by latent-state trajectories; H2, reasoning is primarily mediated by explicit surface CoT; and H0, most apparent reasoning gains are better explained by generic serial compute than by any privileged representational object. Reorganizing recent empirical, mechanistic, and survey work under this framework, and adding compute-audited worked exemplars that factorize surface traces, latent interventions, and matched budget expansions, we find that current evidence most strongly supports H1 as a default working hypothesis rather than as a task-independent verdict. We therefore make two recommendations: the field should treat latent-state dynamics as the default object of study for LLM reasoning, and it should evaluate reasoning with designs that explicitly disentangle surface traces, latent states, and serial compute.
Abstract（参考訳）: このポジションペーパーでは、大きな言語モデル(LLM)推論は、忠実な表面連鎖(CoT)ではなく、潜在状態の軌道形成として研究されるべきであると論じている。これは、忠実性、解釈可能性、推論ベンチマーク、推論時間の介入に関する主張がすべて、推論の主要な対象である分野にかかっているためである。 H1, 推論は主として潜在状態軌道によって媒介される; H2, 推論は主として明示的な曲面 CoT によって媒介される; H0, 最も明らかな推論ゲインは、任意の特権表現対象よりも一般的な直列計算によって説明される。この枠組みの下での最近の経験的、機械的、および調査作業を再編成し、表面トレース、潜伏介入、予算拡張を分解する計算監査された作業例を追加することにより、現在の証拠はタスク非依存の判断というよりも、H1をデフォルトの作業仮説として強く支持していることがわかった。したがって、フィールドはLLM推論のデフォルト対象として潜在状態力学を扱い、表面のトレース、潜状態、シリアル計算を明示的に切り離した設計で推論を評価するべきである。

関連論文リスト

CausalFlip: A Benchmark for LLM Causal Judgment Beyond Semantic Matching [50.65932158912512]
そこで我々は,新しい大言語モデルの開発を促進するために,因果推論ベンチマークCausalFlipを提案する。 CaulFlipは、イベントトリプル上に構築された因果判断の質問で構成されており、共同創設者、チェーン、コライダーの関係が異なっている。回答のみのトレーニング,明示的なチェーン・オブ・ソート監視,そして内在型因果推論アプローチなどを含む,複数の訓練パラダイムによるLCMの評価を行った。
論文参考訳（メタデータ） (2026-02-23T18:06:15Z)
Dynamics Within Latent Chain-of-Thought: An Empirical Study of Causal Structure [58.89643769707751]
表現空間における潜在連鎖を操作可能な因果過程として研究する。遅延ステップの予算は、均質な余分な深さよりも、非局所的なルーティングを備えたステージ機能のように振る舞う。これらの結果は、モード条件と安定性を意識した分析を、潜伏推論システムの解釈と改善のための信頼性の高いツールとして動機付けている。
論文参考訳（メタデータ） (2026-02-09T15:25:12Z)
Latent Chain-of-Thought as Planning: Decoupling Reasoning from Verbalization [9.193078163792427]
CoT(Chain-of-Thought)は、大規模言語モデル(LLM)に複雑な問題に取り組む権限を与える。最近の潜伏推論手法は、連続した隠蔽状態内で推論を行うことによって効率を最適化しようとする。 PLaTは、潜在推論を言語化から根本的に切り離すことによって計画として再構成するフレームワークである。
論文参考訳（メタデータ） (2026-01-29T07:38:18Z)
Thinking Longer, Not Always Smarter: Evaluating LLM Capabilities in Hierarchical Legal Reasoning [11.255428720705204]
本稿では,ケース間の重要な区別を3段階の推論タスクに分解する枠組みを提案する。我々のフレームワークは、要因と呼ばれる事実的述語を使用してケースをモデル化し、それらを法的知識階層に整理し、区別を識別するための検証可能なルールを定義します。我々は、モデルが正しい応答よりも間違った応答について、常に多くの計算資源を消費していることを発見し、「より長く考えることは、必ずしも「より賢く考える」という意味ではないことを示唆している。
論文参考訳（メタデータ） (2025-10-09T18:15:28Z)
Implicit Reasoning in Large Language Models: A Comprehensive Survey [67.53966514728383]
大規模言語モデル(LLM)は、幅広いタスクにまたがる強力な一般化を実証している。最近の研究は、暗黙の推論に拍車をかけた、明示的な思考の連鎖から注意を向けている。本調査では,表現形式から計算戦略へ焦点を移し,実行パラダイムを中心とした分類を紹介した。
論文参考訳（メタデータ） (2025-09-02T14:16:02Z)
A Survey on Latent Reasoning [100.54120559169735]
大きな言語モデル(LLM)は印象的な推論機能を示している。中間ステップを言語化するCoT推論は、モデルの表現帯域幅を制限する。潜在的推論は、モデルの連続的な隠れ状態に完全にマルチステップの推論を実行することで、このボトルネックに対処する。
論文参考訳（メタデータ） (2025-07-08T17:29:07Z)
CLATTER: Comprehensive Entailment Reasoning for Hallucination Detection [60.98964268961243]
我々は,系統的かつ包括的な推論プロセスを実行するためのモデルを導くことで,モデルがよりきめ細やかで正確な絞り込み決定を実行できることを提案する。我々は,(i)クレームの分解,(ii)サブクレームの属性と包含分類,および(iii)集約分類から成る3段階の推論プロセスを定義し,そのような導出推論が実際に幻覚検出の改善をもたらすことを示す。
論文参考訳（メタデータ） (2025-06-05T17:02:52Z)
Interactive Model with Structural Loss for Language-based Abductive Reasoning [36.02450824915494]
帰納的自然言語推論タスク(alpha$NLI)は、原因と事象の間の最も明確な説明を推測するために提案される。我々はこの新モデルを$alpha$NLI: Interactive Model with Structure Loss (IMSL) と命名する。 IMSL は RoBERTa-large Pretrained model で最高性能を達成し,ACC と AUC はそれぞれ約1%,AUC は5% 向上した。
論文参考訳（メタデータ） (2021-12-01T05:21:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。