論文の概要: LogicGraph : Benchmarking Multi-Path Logical Reasoning via Neuro-Symbolic Generation and Verification
- arxiv url: http://arxiv.org/abs/2602.21044v1
- Date: Tue, 24 Feb 2026 16:04:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.829038
- Title: LogicGraph : Benchmarking Multi-Path Logical Reasoning via Neuro-Symbolic Generation and Verification
- Title(参考訳): LogicGraph : ニューロシンボリック生成と検証によるマルチパス論理推論のベンチマーク
- Authors: Yanrui Wu, Lingling Zhang, Xinyu Zhang, Jiayu Chang, Pengyu Li, Xu Jiang, Jingtao Hu, Jun Liu,
- Abstract要約: 本稿では,マルチパス論理推論を体系的に評価する最初のベンチマークであるLogicGraphを紹介する。
このパイプラインは、高深度マルチパス推論によって定式化されたソルバ検証推論問題を導出する。
収束状態と発散状態の両方においてモデル性能を厳格に評価する参照フリー評価フレームワークを提案する。
- 参考スコア(独自算出の注目度): 24.91906506651266
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Evaluations of large language models (LLMs) primarily emphasize convergent logical reasoning, where success is defined by producing a single correct proof. However, many real-world reasoning problems admit multiple valid derivations, requiring models to explore diverse logical paths rather than committing to one route. To address this limitation, we introduce LogicGraph, the first benchmark aimed to systematically evaluate multi-path logical reasoning, constructed via a neuro-symbolic framework that leverages backward logic generation and semantic instantiation. This pipeline yields solver-verified reasoning problems formalized by high-depth multi-path reasoning and inherent logical distractions, where each instance is associated with an exhaustive set of minimal proofs. We further propose a reference-free evaluation framework to rigorously assess model performance in both convergent and divergent regimes. Experiments on state-of-the-art language models reveal a common limitation: models tend to commit early to a single route and fail to explore alternatives, and the coverage gap grows substantially with reasoning depth. LogicGraph exposes this divergence gap and provides actionable insights to motivate future improvements. Our code and data will be released at https://github.com/kkkkarry/LogicGraph.
- Abstract(参考訳): 大規模言語モデル(LLM)の評価は主に収束論理的推論に重点を置いており、成功は単一の正しい証明を生成することによって定義される。
しかし、現実の推論問題の多くは、複数の有効な導出を認めており、モデルが1つの経路にコミットするのではなく、多様な論理経路を探索する必要がある。
この制限に対処するために、我々は、バックワード論理生成とセマンティックインスタンス化を活用するニューロシンボリックフレームワークを用いて構築されたマルチパス論理推論を体系的に評価する最初のベンチマークであるLogicGraphを紹介した。
このパイプラインは、高深さのマルチパス推論と固有の論理的散逸によって定式化されたソルバ検証推論問題を導出し、各インスタンスは最小限の証明の徹底的な集合に関連付けられている。
さらに、収束状態と発散状態の両方において、モデル性能を厳格に評価する参照フリー評価フレームワークを提案する。
最新の言語モデルに関する実験では、ひとつのルートに早期にコミットする傾向があり、代替手段を探索できない傾向があり、カバーギャップは推論の深さとともに大幅に増大する、という共通の制限が示される。
LogicGraphはこの分散ギャップを公開し、将来の改善を動機付けるための実用的な洞察を提供する。
私たちのコードとデータはhttps://github.com/kkkkarry/LogicGraph.orgで公開されます。
関連論文リスト
- MuSLR: Multimodal Symbolic Logical Reasoning [133.85551954182105]
マルチモーダルな論理的推論は、自律運転や診断などの高度な応用において重要である。
形式論理規則を基礎としたマルチモーダルな記号論理的推論のための最初のベンチマーク Mu SLR を導入する。
我々は,GPT-4.1のChain-of-Thought性能を14.13%向上させるモジュール型フレームワークであるLogiCAMを提案する。
論文 参考訳(メタデータ) (2025-09-30T06:42:20Z) - From Ambiguity to Verdict: A Semiotic-Grounded Multi-Perspective Agent for LLM Logical Reasoning [16.381034926435074]
LogicAgentは、論理的な複雑さと意味的な複雑さを共同で扱うように設計された、セミオティックな2乗誘導フレームワークである。
既存のデータセットのセマンティックな単純さと論理的な複雑さを克服するために、大学レベルの難易度に達するベンチマークであるRepublicQAを導入する。
LogicAgentはRepublicQAで最先端のパフォーマンスを実現しており、強いベースラインよりも平均6.25%向上している。
論文 参考訳(メタデータ) (2025-09-29T13:31:22Z) - PathReasoner: Modeling Reasoning Path with Equivalent Extension for Logical Question Answering [27.50008553118866]
我々は、各論理サンプルを推論パスに変換することによって、論理推論タスクをモデル化する。
論理サンプルの多様性を高めるために,等価な論理式によって支持される原子拡張戦略を提案する。
実験により、PathReasonerは2つの論理的推論ベンチマークと大きな一般化能力で競合性能を達成することが示された。
論文 参考訳(メタデータ) (2024-05-29T14:14:05Z) - Improving Complex Reasoning over Knowledge Graph with Logic-Aware Curriculum Tuning [89.89857766491475]
カリキュラムベースの論理認識型チューニングフレームワークであるLACTを提案する。
具体的には、任意の一階論理クエリをバイナリツリー分解によって拡張する。
広く使われているデータセットに対する実験では、LATは高度な手法よりも大幅に改善(平均+5.5% MRRスコア)し、新しい最先端技術を実現している。
論文 参考訳(メタデータ) (2024-05-02T18:12:08Z) - LOGICSEG: Parsing Visual Semantics with Neural Logic Learning and
Reasoning [73.98142349171552]
LOGICSEGは、神経誘導学習と論理推論をリッチデータとシンボリック知識の両方に統合する、全体論的視覚意味論である。
ファジィ論理に基づく連続的な緩和の間、論理式はデータとニューラルな計算グラフに基礎を置いており、論理によるネットワークトレーニングを可能にする。
これらの設計によりLOGICSEGは、既存のセグメンテーションモデルに容易に統合できる汎用的でコンパクトなニューラル論理マシンとなる。
論文 参考訳(メタデータ) (2023-09-24T05:43:19Z) - Logic Diffusion for Knowledge Graph Reasoning [29.260922651325412]
本稿では,周辺環境から未知のクエリを発見するために,Logic Diffusion (LoD) と呼ばれるプラグインモジュールを提案する。
LoDは異なる種類のパターン間の動的平衡を達成する。
4つの公開データセットの実験は、LoDを用いた主流知識グラフ推論モデルの最先端性を示している。
論文 参考訳(メタデータ) (2023-06-06T09:01:17Z) - Discourse-Aware Graph Networks for Textual Logical Reasoning [142.0097357999134]
パッセージレベルの論理関係は命題単位間の係り合いまたは矛盾を表す(例、結論文)
論理的推論QAを解くための論理構造制約モデリングを提案し、談話対応グラフネットワーク(DAGN)を導入する。
ネットワークはまず、インラインの談話接続とジェネリック論理理論を利用した論理グラフを構築し、その後、エッジ推論機構を用いて論理関係を進化させ、グラフ機能を更新することで論理表現を学習する。
論文 参考訳(メタデータ) (2022-07-04T14:38:49Z) - Abstract Reasoning via Logic-guided Generation [65.92805601327649]
抽象的推論、すなわち、与えられた観測から複雑なパターンを推測することは、人工知能の中心的な構成要素である。
本稿では,後者のアプローチの枠組みを設計し,人工知能と人間の知能のギャップを埋めることを目的とする。
本稿では,提案する論理の最適化問題として,抽象的推論を削減した新しい生成型DNNフレームワークであるLoGeを提案する。
論文 参考訳(メタデータ) (2021-07-22T07:28:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。