Fugu-MT 論文翻訳(概要): LogicGraph : Benchmarking Multi-Path Logical Reasoning via Neuro-Symbolic Generation and Verification

論文の概要: LogicGraph : Benchmarking Multi-Path Logical Reasoning via Neuro-Symbolic Generation and Verification

arxiv url: http://arxiv.org/abs/2602.21044v1
Date: Tue, 24 Feb 2026 16:04:26 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-25 17:34:53.829038
Title: LogicGraph : Benchmarking Multi-Path Logical Reasoning via Neuro-Symbolic Generation and Verification
Title（参考訳）: LogicGraph : ニューロシンボリック生成と検証によるマルチパス論理推論のベンチマーク
Authors: Yanrui Wu, Lingling Zhang, Xinyu Zhang, Jiayu Chang, Pengyu Li, Xu Jiang, Jingtao Hu, Jun Liu,
Abstract要約: 本稿では,マルチパス論理推論を体系的に評価する最初のベンチマークであるLogicGraphを紹介する。このパイプラインは、高深度マルチパス推論によって定式化されたソルバ検証推論問題を導出する。収束状態と発散状態の両方においてモデル性能を厳格に評価する参照フリー評価フレームワークを提案する。
参考スコア（独自算出の注目度）: 24.91906506651266
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Evaluations of large language models (LLMs) primarily emphasize convergent logical reasoning, where success is defined by producing a single correct proof. However, many real-world reasoning problems admit multiple valid derivations, requiring models to explore diverse logical paths rather than committing to one route. To address this limitation, we introduce LogicGraph, the first benchmark aimed to systematically evaluate multi-path logical reasoning, constructed via a neuro-symbolic framework that leverages backward logic generation and semantic instantiation. This pipeline yields solver-verified reasoning problems formalized by high-depth multi-path reasoning and inherent logical distractions, where each instance is associated with an exhaustive set of minimal proofs. We further propose a reference-free evaluation framework to rigorously assess model performance in both convergent and divergent regimes. Experiments on state-of-the-art language models reveal a common limitation: models tend to commit early to a single route and fail to explore alternatives, and the coverage gap grows substantially with reasoning depth. LogicGraph exposes this divergence gap and provides actionable insights to motivate future improvements. Our code and data will be released at https://github.com/kkkkarry/LogicGraph.
Abstract（参考訳）: 大規模言語モデル(LLM)の評価は主に収束論理的推論に重点を置いており、成功は単一の正しい証明を生成することによって定義される。しかし、現実の推論問題の多くは、複数の有効な導出を認めており、モデルが1つの経路にコミットするのではなく、多様な論理経路を探索する必要がある。この制限に対処するために、我々は、バックワード論理生成とセマンティックインスタンス化を活用するニューロシンボリックフレームワークを用いて構築されたマルチパス論理推論を体系的に評価する最初のベンチマークであるLogicGraphを紹介した。このパイプラインは、高深さのマルチパス推論と固有の論理的散逸によって定式化されたソルバ検証推論問題を導出し、各インスタンスは最小限の証明の徹底的な集合に関連付けられている。さらに、収束状態と発散状態の両方において、モデル性能を厳格に評価する参照フリー評価フレームワークを提案する。最新の言語モデルに関する実験では、ひとつのルートに早期にコミットする傾向があり、代替手段を探索できない傾向があり、カバーギャップは推論の深さとともに大幅に増大する、という共通の制限が示される。 LogicGraphはこの分散ギャップを公開し、将来の改善を動機付けるための実用的な洞察を提供する。私たちのコードとデータはhttps://github.com/kkkkarry/LogicGraph.orgで公開されます。

関連論文リスト

On the Out-of-Distribution Generalization of Reasoning in Multimodal LLMs for Simple Visual Planning Tasks [56.98385132295952]
簡単な計画課題において,チェーン・オブ・ソート・アプローチがいかに一般化するかを評価する。複数のテキスト形式を組み合わせた推論トレースが、最高の(かつ非自明な)OOD一般化をもたらすことが分かりました。純粋にテキストベースのモデルは、画像ベースの入力を利用するモデルよりも一貫して優れています。
論文参考訳（メタデータ） (2026-02-17T09:51:40Z)
Neural Chain-of-Thought Search: Searching the Optimal Reasoning Path to Enhance Large Language Models [61.55758048622473]
最適思考戦略の動的探索として推論を再構成するフレームワークであるNeural Chain-of-Thought Search (NCoTS)を導入する。解空間を定量的に特徴づけることで、標準出力よりも正確かつ簡潔なスパース優良推論経路の存在を明らかにする。
論文参考訳（メタデータ） (2026-01-16T14:38:18Z)
MuSLR: Multimodal Symbolic Logical Reasoning [133.85551954182105]
マルチモーダルな論理的推論は、自律運転や診断などの高度な応用において重要である。形式論理規則を基礎としたマルチモーダルな記号論理的推論のための最初のベンチマーク Mu SLR を導入する。我々は,GPT-4.1のChain-of-Thought性能を14.13%向上させるモジュール型フレームワークであるLogiCAMを提案する。
論文参考訳（メタデータ） (2025-09-30T06:42:20Z)
From Ambiguity to Verdict: A Semiotic-Grounded Multi-Perspective Agent for LLM Logical Reasoning [16.381034926435074]
LogicAgentは、論理的な複雑さと意味的な複雑さを共同で扱うように設計された、セミオティックな2乗誘導フレームワークである。既存のデータセットのセマンティックな単純さと論理的な複雑さを克服するために、大学レベルの難易度に達するベンチマークであるRepublicQAを導入する。 LogicAgentはRepublicQAで最先端のパフォーマンスを実現しており、強いベースラインよりも平均6.25%向上している。
論文参考訳（メタデータ） (2025-09-29T13:31:22Z)
You Don't Need Pre-built Graphs for RAG: Retrieval Augmented Generation with Adaptive Reasoning Structures [16.867592142212203]
大型言語モデル(LLM)はしばしば幻覚に悩まされ、知識を超えた質問を処理する際に、事実的に誤った文を生成する。 Retrieval-augmented Generation (RAG)は、LLM推論をサポートするために、知識ベースからクエリ関連コンテキストを取得することで、この問題に対処する。既存のGraphベースのRAGメソッドは、コーパスをグラフに変換するためのコストの高いプロセスに依存しており、圧倒的なトークンコストとアップデートのレイテンシを導入している。本稿では,推論時に推論構造を動的に抽出し,事前に構築したグラフを使わずに適応検索を誘導するLogicRAGを提案する。
論文参考訳（メタデータ） (2025-08-08T08:07:40Z)
LAD-Reasoner: Tiny Multimodal Models are Good Reasoners for Logical Anomaly Detection [27.45348890285863]
本稿では,論理的推論を組み込んで従来の異常検出を拡張したReasoning Logical Anomaly Detection (RLAD)を提案する。本稿では,Qwen2.5-VL 3B上に構築された小型マルチモーダル言語モデルであるLAD-Reasonerを提案する。 MVTec LOCO ADデータセットの実験では、LAD-Reasonerははるかに小さく、精度はQwen2.5-VL-72BとF1のスコアと一致している。
論文参考訳（メタデータ） (2025-04-17T08:41:23Z)
PathReasoner: Modeling Reasoning Path with Equivalent Extension for Logical Question Answering [27.50008553118866]
我々は、各論理サンプルを推論パスに変換することによって、論理推論タスクをモデル化する。論理サンプルの多様性を高めるために,等価な論理式によって支持される原子拡張戦略を提案する。実験により、PathReasonerは2つの論理的推論ベンチマークと大きな一般化能力で競合性能を達成することが示された。
論文参考訳（メタデータ） (2024-05-29T14:14:05Z)
Improving Complex Reasoning over Knowledge Graph with Logic-Aware Curriculum Tuning [89.89857766491475]
カリキュラムベースの論理認識型チューニングフレームワークであるLACTを提案する。具体的には、任意の一階論理クエリをバイナリツリー分解によって拡張する。広く使われているデータセットに対する実験では、LATは高度な手法よりも大幅に改善(平均+5.5% MRRスコア)し、新しい最先端技術を実現している。
論文参考訳（メタデータ） (2024-05-02T18:12:08Z)
LOGICSEG: Parsing Visual Semantics with Neural Logic Learning and Reasoning [73.98142349171552]
LOGICSEGは、神経誘導学習と論理推論をリッチデータとシンボリック知識の両方に統合する、全体論的視覚意味論である。ファジィ論理に基づく連続的な緩和の間、論理式はデータとニューラルな計算グラフに基礎を置いており、論理によるネットワークトレーニングを可能にする。これらの設計によりLOGICSEGは、既存のセグメンテーションモデルに容易に統合できる汎用的でコンパクトなニューラル論理マシンとなる。
論文参考訳（メタデータ） (2023-09-24T05:43:19Z)
Logic Diffusion for Knowledge Graph Reasoning [29.260922651325412]
本稿では,周辺環境から未知のクエリを発見するために,Logic Diffusion (LoD) と呼ばれるプラグインモジュールを提案する。 LoDは異なる種類のパターン間の動的平衡を達成する。 4つの公開データセットの実験は、LoDを用いた主流知識グラフ推論モデルの最先端性を示している。
論文参考訳（メタデータ） (2023-06-06T09:01:17Z)
Discourse-Aware Graph Networks for Textual Logical Reasoning [142.0097357999134]
パッセージレベルの論理関係は命題単位間の係り合いまたは矛盾を表す(例、結論文) 論理的推論QAを解くための論理構造制約モデリングを提案し、談話対応グラフネットワーク(DAGN)を導入する。ネットワークはまず、インラインの談話接続とジェネリック論理理論を利用した論理グラフを構築し、その後、エッジ推論機構を用いて論理関係を進化させ、グラフ機能を更新することで論理表現を学習する。
論文参考訳（メタデータ） (2022-07-04T14:38:49Z)
Abstract Reasoning via Logic-guided Generation [65.92805601327649]
抽象的推論、すなわち、与えられた観測から複雑なパターンを推測することは、人工知能の中心的な構成要素である。本稿では,後者のアプローチの枠組みを設計し,人工知能と人間の知能のギャップを埋めることを目的とする。本稿では,提案する論理の最適化問題として,抽象的推論を削減した新しい生成型DNNフレームワークであるLoGeを提案する。
論文参考訳（メタデータ） (2021-07-22T07:28:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。