論文の概要: The Periodic Table of LLM Reasoning: A Structured Survey of Reasoning Paradigms, Methods, and Failure Modes
- arxiv url: http://arxiv.org/abs/2606.11470v1
- Date: Tue, 09 Jun 2026 21:59:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.190538
- Title: The Periodic Table of LLM Reasoning: A Structured Survey of Reasoning Paradigms, Methods, and Failure Modes
- Title(参考訳): LLM推論の周期表:推論パラダイム,方法,障害モードの構造的調査
- Authors: Avinash Anand, Mahisha Ramesh, Avni Mittal, Ashutosh Kumar, Erik Cambria, Zhengkui Wang, Timothy Liu, Aik Beng Ng, Simon See, Rajiv Ratn Shah,
- Abstract要約: この調査は、arXiv、Semantic Scholar、Google Scholar、Papers with Code、ACL Anthologyの300以上の最近の論文の体系的な分析を提供する。
本稿では、推論研究の構造的分類を導入し、チェーン・オブ・ソート推論、マルチホップ推論、数学的推論、常識推論、視覚的および時間的推論、コードとアルゴリズム的推論、検索強化推論、ツール強化およびエージェント的推論、強化学習に基づく推論について紹介する。
我々は、繰り返し発生する制限と失敗モードを合成する。例えば、幻覚の推論、脆い多段階推論、弱い因果的抽象、貧弱な交差などである。
- 参考スコア(独自算出の注目度): 55.42597391158023
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) have achieved strong performance across natural language processing tasks, yet reliable reasoning remains an open challenge. Although modern LLMs show progress in structured inference, multi-step problem solving, and contextual understanding, their reasoning behavior is often inconsistent and sensitive to prompting strategies, task design, and model scale. This survey provides a systematic analysis of more than 300 recent papers from arXiv, Semantic Scholar, Google Scholar, Papers with Code, and the ACL Anthology to examine how reasoning capabilities emerge in LLMs and where they fail. We make three main contributions. First, we introduce a structured taxonomy of LLM reasoning research, covering Chain-of-Thought reasoning, multi-hop reasoning, mathematical reasoning, common sense reasoning, visual and temporal reasoning, code and algorithmic reasoning, retrieval-augmented reasoning, tool-augmented and agentic reasoning, and reinforcement learning-based reasoning. Second, we analyze methodological trends across these paradigms, including prompting methods, model architectures, training objectives, reward modeling, and evaluation benchmarks. Third, we synthesize recurring limitations and failure modes, such as reasoning hallucinations, brittle multi-step inference, weak causal abstraction, and poor cross-domain generalization. By organizing a rapidly expanding literature, this survey offers a unified view of the current capabilities and limitations of reasoning in LLMs. We also identify emerging research directions, including meta-reasoning, self-evolving reasoning frameworks, multimodal reasoning, and socially grounded reasoning. Overall, this work aims to serve as a reference for developing more robust, interpretable, and generalizable reasoning systems in future language models.
- Abstract(参考訳): 大きな言語モデル(LLM)は、自然言語処理タスク全体にわたって強力なパフォーマンスを実現していますが、信頼できる推論は依然としてオープンな課題です。
現代のLCMは、構造化推論、多段階問題解決、文脈理解の進歩を示すが、それらの推論動作は、しばしば矛盾し、戦略、タスクデザイン、モデルスケールの促進に敏感である。
この調査では、arXiv、Semantic Scholar、Google Scholar、Papers with Code、ACL Anthologyの300以上の最近の論文を体系的に分析し、LCMにおける推論機能がどのように出現し、どこで失敗するのかを調べた。
主な貢献は3つある。
まず,LLM推論研究の構造的分類を導入し,階層推論,マルチホップ推論,数学的推論,共通感覚推論,視覚的・時間的推論,コードとアルゴリズム推論,検索強化推論,ツール強化・エージェント推論,強化学習に基づく推論について紹介する。
第2に,手法,モデルアーキテクチャ,トレーニング目標,報酬モデリング,評価ベンチマークなど,これらのパラダイムの方法論的傾向を分析する。
第三に、幻覚の推論、脆弱な多段階推論、因果抽象化の弱さ、ドメイン間の一般化の弱さなど、繰り返し発生する制限や障害モードを合成する。
急速に拡大する文献を整理することにより、この調査はLLMにおける現在の能力と推論の限界の統一的な見解を提供する。
また,メタ推論,自己進化的推論フレームワーク,マルチモーダル推論,社会的基盤的推論など,新たな研究の方向性を明らかにした。
全体として、この研究は将来の言語モデルにおいてより堅牢で解釈可能で一般化可能な推論システムを開発するためのリファレンスとして機能することを目的としている。
関連論文リスト
- Wiring the 'Why': A Unified Taxonomy and Survey of Abductive Reasoning in LLMs [6.369429101077227]
本稿では,Large Language Models (LLMs) における帰納的推論に関する最初の調査について述べる。
この分野で広く普及している概念的混乱とタスク定義の合成に対処するため,我々は,先行作業を正式に分類する統合された2段階定義を確立する。
文献を包括的に分類し,それらの帰納的タスク,データセット,基礎となる方法論,評価戦略に基づいて事前作業の分類を行う。
論文 参考訳(メタデータ) (2026-04-09T09:16:00Z) - Large Language Model Reasoning Failures [3.139060394530521]
大規模言語モデル(LLM)における推論失敗に関する総合的な調査を初めて紹介する。
我々は、推論をエンボディード型と非エンボディード型に区別する新しい分類フレームワークを導入する。
それぞれの推論失敗に対して、明確な定義を提供し、既存の研究を分析し、根本原因を探究し、緩和戦略を提示する。
論文 参考訳(メタデータ) (2026-02-05T20:29:26Z) - Implicit Reasoning in Large Language Models: A Comprehensive Survey [67.53966514728383]
大規模言語モデル(LLM)は、幅広いタスクにまたがる強力な一般化を実証している。
最近の研究は、暗黙の推論に拍車をかけた、明示的な思考の連鎖から注意を向けている。
本調査では,表現形式から計算戦略へ焦点を移し,実行パラダイムを中心とした分類を紹介した。
論文 参考訳(メタデータ) (2025-09-02T14:16:02Z) - On the Eligibility of LLMs for Counterfactual Reasoning: A Decompositional Study [15.617243755155686]
対物推論は、大規模言語モデルの推論能力を一般化するための重要な手法として現れてきた。
本稿では, 因果関係の構築から, 逆因果関係の介入に対する推論まで, 逆因果関係の生成を分解する分解戦略を提案する。
論文 参考訳(メタデータ) (2025-05-17T04:59:32Z) - LogiDynamics: Unraveling the Dynamics of Inductive, Abductive and Deductive Logical Inferences in LLM Reasoning [74.0242521818214]
本稿では,大言語モデル(LLM)におけるインダクティブ(システム1)と帰納的/帰納的(システム2)の推論の比較力学を体系的に検討する。
我々は、制御されたアナログ推論環境、多様度(テキスト、視覚、記号)、難易度、タスク形式(MCQ/フリーテキスト)を利用する。
我々の分析によると、System 2のパイプラインは一般的に、特に視覚的/象徴的なモダリティや難しいタスクにおいて優れており、System 1はテキストやより簡単な問題に対して競争力がある。
論文 参考訳(メタデータ) (2025-02-16T15:54:53Z) - Advancing Reasoning in Large Language Models: Promising Methods and Approaches [0.0]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて著しく成功している。
複雑な推論スパンニング論理推論、数学的問題解決、コモンセンス推論、そして多段階推論を実行する能力は、人間の期待に届かない。
本調査は, LLMにおける推論向上技術に関する総合的なレビューを提供する。
論文 参考訳(メタデータ) (2025-02-05T23:31:39Z) - Towards LogiGLUE: A Brief Survey and A Benchmark for Analyzing Logical Reasoning Capabilities of Language Models [56.34029644009297]
大規模言語モデル(LLM)は、形式的知識表現(KR)システムの様々な制限を克服する能力を示した。
LLMは誘導的推論において最も優れているが、誘導的推論では最も効果が低い。
モデルの性能を評価するため,シングルタスクトレーニング,マルチタスクトレーニング,および「チェーンオブ思考」知識蒸留細調整技術について検討した。
論文 参考訳(メタデータ) (2023-10-02T01:00:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。