論文の概要: The Shape of Reasoning: Topological Analysis of Reasoning Traces in Large Language Models
- arxiv url: http://arxiv.org/abs/2510.20665v1
- Date: Thu, 23 Oct 2025 15:43:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:18.246419
- Title: The Shape of Reasoning: Topological Analysis of Reasoning Traces in Large Language Models
- Title(参考訳): 推論の形状:大規模言語モデルにおける推論トレースのトポロジ的解析
- Authors: Xue Wen Tan, Nathaniel Tan, Galen Lee, Stanley Kok,
- Abstract要約: そこで我々は,推論トレースの幾何を捉えるトポロジカルデータ分析フレームワークを導入し,ラベル効率の評価を可能にした。
コンパクトで安定なトポロジカルな特徴集合は、トレース品質を確実に示し、将来の強化学習アルゴリズムのための実用的な信号を提供する。
- 参考スコア(独自算出の注目度): 2.846561253333858
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Evaluating the quality of reasoning traces from large language models remains understudied, labor-intensive, and unreliable: current practice relies on expert rubrics, manual annotation, and slow pairwise judgments. Automated efforts are dominated by graph-based proxies that quantify structural connectivity but do not clarify what constitutes high-quality reasoning; such abstractions can be overly simplistic for inherently complex processes. We introduce a topological data analysis (TDA)-based evaluation framework that captures the geometry of reasoning traces and enables label-efficient, automated assessment. In our empirical study, topological features yield substantially higher predictive power for assessing reasoning quality than standard graph metrics, suggesting that effective reasoning is better captured by higher-dimensional geometric structures rather than purely relational graphs. We further show that a compact, stable set of topological features reliably indicates trace quality, offering a practical signal for future reinforcement learning algorithms.
- Abstract(参考訳): 大規模言語モデルからの推論トレースの質を評価することは、まだ未調査であり、労働集約的であり、信頼できない。
自動的な作業は、構造的な接続を定量化するグラフベースのプロキシによって支配されるが、高品質な推論を構成するものを明確にはしない。
本稿では,トポロジカルデータ解析(TDA)に基づく評価フレームワークを提案する。
実験的検討では、トポロジカルな特徴は、標準グラフの指標よりも推論品質を評価する上で、かなり高い予測力をもたらし、真の推論は純粋に関係グラフではなく、高次元の幾何学的構造によって捕えられることが示唆された。
さらに,コンパクトで安定なトポロジカルな特徴集合がトレース品質を確実に示し,将来の強化学習アルゴリズムに実用的な信号を提供することを示す。
関連論文リスト
- On Multi-Step Theorem Prediction via Non-Parametric Structural Priors [50.16583672681106]
本研究では,インコンテキスト学習(ICL)のレンズによる学習自由な定理予測について検討する。
本稿では,過去の解の時間的依存関係を有向グラフとしてエンコードし,推論中に探索空間を効果的に引き起こす明示的なトポロジ的制約を課すTheorem Precedence Graphsを提案する。
FormalGeo7kベンチマークの実験から,本手法は89.29%の精度を実現し,ICLベースラインを著しく上回り,最先端の教師付きモデルに適合することがわかった。
論文 参考訳(メタデータ) (2026-03-05T06:08:50Z) - Unmasking Reasoning Processes: A Process-aware Benchmark for Evaluating Structural Mathematical Reasoning in LLMs [20.82580343824728]
最近の大規模言語モデル (LLM) は、多くの確立された数学的推論ベンチマークにおいて、ほぼ飽和の精度を達成している。
この飽和はテンプレートベースの計算と浅い算術分解の優位性に起因している。
本稿ではReasoningMath-Plusについて紹介する。
論文 参考訳(メタデータ) (2026-01-31T07:09:17Z) - Schoenfeld's Anatomy of Mathematical Reasoning by Language Models [56.656180566692946]
我々は、Schoenfeldのエピソード理論を誘導型中間スケールレンズとして採用し、ThinkARM(モデルにおける推論の解剖学)を紹介する。
ThinkARMは、推論トレースを分析、探索、実装、検証などの機能的推論ステップに明示的に抽象化する。
エピソードレベルの表現は推論ステップを明確にし、現代の言語モデルにおける推論がどのように構造化され、安定化され、変更されるかの体系的な分析を可能にする。
論文 参考訳(メタデータ) (2025-12-23T02:44:25Z) - TopInG: Topologically Interpretable Graph Learning via Persistent Rationale Filtration [10.830399323047265]
TopInG: Topologically Interpretable Graph Learning を提案する。
TopInGは、有理グラフの自動回帰生成過程をモデル化するために、有理フィルタ学習アプローチを採用している。
本手法は,予測精度と解釈品質の両面において最先端の手法を改良する。
論文 参考訳(メタデータ) (2025-10-06T17:59:44Z) - Demystifying Topological Message-Passing with Relational Structures: A Case Study on Oversquashing in Simplicial Message-Passing [11.759008086355914]
トポロジカルディープラーニング(TDL)は,関係データの高次相互作用をモデル化するための強力なツールとして登場した。
本稿では,グラフとトポロジカルメッセージパッシングを橋渡しする,統一的な公理的フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-06T23:31:36Z) - Causality can systematically address the monsters under the bench(marks) [64.36592889550431]
ベンチマークはさまざまなバイアス、アーティファクト、リークに悩まされている。
モデルは、調査の不十分な障害モードのため、信頼できない振る舞いをする可能性がある。
因果関係はこれらの課題を体系的に解決するための 理想的な枠組みを提供します
論文 参考訳(メタデータ) (2025-02-07T17:01:37Z) - Topograph: An efficient Graph-Based Framework for Strictly Topology Preserving Image Segmentation [78.54656076915565]
位相的正しさは多くの画像分割タスクにおいて重要な役割を果たす。
ほとんどのネットワークは、Diceのようなピクセル単位の損失関数を使って、トポロジカルな精度を無視して訓練されている。
トポロジ的に正確な画像セグメンテーションのための新しいグラフベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-05T16:20:14Z) - Is Smoothness the Key to Robustness? A Comparison of Attention and Convolution Models Using a Novel Metric [0.0]
既存の堅牢性評価アプローチは理論的な一般性を欠いているか、経験的評価に大きく依存していることが多い。
本研究では,トポロジカルデータ解析とリプシッツ連続性を橋渡ししてロバスト性評価を行う層解析に基づくトポリップを提案する。
論文 参考訳(メタデータ) (2024-10-23T07:44:14Z) - Enhancing Systematic Decompositional Natural Language Inference Using Informal Logic [51.967603572656266]
我々は,分解包含を注釈付けするための一貫した理論的なアプローチを導入する。
我々の新しいデータセットRDTEは、前回の分解エンターメントデータセットよりもかなり高い内部整合性(+9%)を持つことがわかった。
また,RDTE による知識蒸留によるエンテーメント分類器の訓練や,エンテーメントツリー推論エンジンへの導入により,精度と検証精度が向上することが確認された。
論文 参考訳(メタデータ) (2024-02-22T18:55:17Z) - Modeling Hierarchical Reasoning Chains by Linking Discourse Units and
Key Phrases for Reading Comprehension [80.99865844249106]
本稿では,論理的推論の基盤として,対話レベルと単語レベルの両方の文脈を扱う総合グラフネットワーク(HGN)を提案する。
具体的には、ノードレベルの関係とタイプレベルの関係は、推論過程におけるブリッジと解釈できるが、階層的な相互作用機構によってモデル化される。
論文 参考訳(メタデータ) (2023-06-21T07:34:27Z) - On the Robustness of Aspect-based Sentiment Analysis: Rethinking Model,
Data, and Training [109.9218185711916]
アスペクトベースの感情分析(ABSA)は、ソーシャルメディアのテキストやレビューの背後にある製品やサービスの特定の側面に対して、特定の感情の極性を自動的に推測することを目的としている。
我々は、モデル、データ、トレーニングを含むあらゆる可能な角度からボトルネックを体系的に再考することで、ABSAの堅牢性を高めることを提案する。
論文 参考訳(メタデータ) (2023-04-19T11:07:43Z) - On the Expressivity of Persistent Homology in Graph Learning [13.608942872770855]
計算トポロジのテクニックである永続化ホモロジーは、最近、グラフ分類の文脈において、強い経験的性能を示した。
本稿では、グラフの文脈における永続的ホモロジーの簡単な紹介と、グラフ学習タスクにおけるその表現性に関する理論的議論と実証分析について述べる。
論文 参考訳(メタデータ) (2023-02-20T08:19:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。