論文の概要: Graph of Verification: Structured Verification of LLM Reasoning with Directed Acyclic Graphs
- arxiv url: http://arxiv.org/abs/2506.12509v1
- Date: Sat, 14 Jun 2025 13:46:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:46.396832
- Title: Graph of Verification: Structured Verification of LLM Reasoning with Directed Acyclic Graphs
- Title(参考訳): 検証グラフ:直進非巡回グラフを用いたLLM推論の構造的検証
- Authors: Jiwei Fang, Bin Zhang, Changwei Wang, Jin Wan, Zhiwei Xu,
- Abstract要約: LLMを検証するためのグラフ・オブ・バリデーション(GoV)フレームワークを提案する。
GoVは、下層の導出過程を有向非巡回グラフ(DAG)として明示的にモデル化する。
DAGのトポロジカルな順序を強制し、段階的に検証する。
- 参考スコア(独自算出の注目度): 8.833716779340358
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Verifying the reliability of complex, multi-step reasoning in Large Language Models (LLMs) remains a fundamental challenge, as existing methods often lack both faithfulness and precision. To address this issue, we propose the Graph of Verification (GoV) framework. GoV offers three key contributions: First, it explicitly models the underlying deductive process as a directed acyclic graph (DAG), whether this structure is implicit or explicitly constructed. Second, it enforces a topological order over the DAG to guide stepwise verification. Third, GoV introduces the notion of customizable node blocks, which flexibly define the verification granularity, from atomic propositions to full paragraphs, while ensuring that all requisite premises derived from the graph are provided as contextual input for each verification unit. We evaluate GoV on the Number Triangle Summation task and the ProcessBench benchmark with varying levels of reasoning complexity. Experimental results show that GoV substantially improves verification accuracy, faithfulness, and error localization when compared to conventional end-to-end verification approaches. Our code and data are available at https://github.com/Frevor/Graph-of-Verification.
- Abstract(参考訳): 大規模言語モデル(LLM)における複雑な多段階推論の信頼性を検証することは、既存の手法には忠実さと正確さが欠如しているため、根本的な課題である。
この問題に対処するため,我々はGraph of Verification (GoV)フレームワークを提案する。
GoVは3つの重要なコントリビューションを提供する: 第一に、この構造が暗黙的か明示的かにかかわらず、下層の導出過程を有向非巡回グラフ(DAG)として明示的にモデル化する。
第二に、DAGに対するトポロジカルな順序を適用して、段階的に検証する。
第三に、GoVはカスタマイズ可能なノードブロックの概念を導入し、原子命題から全段落まで、検証の粒度を柔軟に定義し、グラフから派生したすべての必要な前提が検証単位ごとにコンテキスト入力として提供されるようにした。
我々は,数三角和タスクとProcessBenchベンチマークのGoVを,様々なレベルの推論複雑性で評価した。
実験の結果,従来のエンドツーエンドの検証手法と比較して,GoVは精度,忠実度,誤差の局所化を著しく改善することがわかった。
私たちのコードとデータはhttps://github.com/Frevor/Graph-of-Verification.comで公開されています。
関連論文リスト
- Graph-KV: Breaking Sequence via Injecting Structural Biases into Large Language Models [63.64507678113921]
構造的帰納バイアスを通して相互作用を管理するグラフ-KVを導入する。
このフレームワークでは、「ターゲット」セグメントは指定された「ソース」セグメントのKV-cacheのみに選択的に参加する。
我々は,(1)直接推論,マルチホップ推論,長期文書理解にまたがる7つのRAGベンチマーク,(2)引用エゴグラフとして構造化された全文科学論文を用いた新しい学術論文QAタスクArxiv-QA,(3)引用ネットワーク内の論文トピック分類の3つのシナリオでグラフ-KVを評価する。
論文 参考訳(メタデータ) (2025-06-09T00:30:08Z) - Verify-in-the-Graph: Entity Disambiguation Enhancement for Complex Claim Verification with Interactive Graph Representation [3.864321514889099]
グラフ表現 - 入力クレームは構造化三重項に分解され、構造化情報と非構造化情報の両方を統合するグラフベースの表現を形成する。
論文 参考訳(メタデータ) (2025-05-29T02:02:55Z) - Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [75.9865035064794]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。
Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。
本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文 参考訳(メタデータ) (2025-05-22T05:15:27Z) - A Graph-based Verification Framework for Fact-Checking [25.875698681028794]
ファクトチェックのためのグラフベースのフレームワークGraphFCを提案する。
この中核的な考え方に基づいて,ファクトチェックのためのグラフベースのフレームワークであるGraphFCを提案する。
論文 参考訳(メタデータ) (2025-03-10T13:02:29Z) - GraphCheck: Multi-Path Fact-Checking with Entity-Relationship Graphs [5.10832476049103]
GraphCheckは、クレームを構造化および体系的な検証のためにエンティティ関連グラフに変換するフレームワークである。
DP-GraphCheckは、ダイレクトプロンプトとGraphCheckを適応的に選択するために軽量戦略セレクタを使用する変種である。
提案手法は既存の手法,特にマルチホップクレームよりも優れている。
論文 参考訳(メタデータ) (2025-02-28T07:06:19Z) - Beyond Message Passing: Neural Graph Pattern Machine [50.78679002846741]
本稿では,グラフサブストラクチャから直接学習することで,メッセージパッシングをバイパスする新しいフレームワークであるNeural Graph Pattern Machine(GPM)を紹介する。
GPMはタスク関連グラフパターンを効率的に抽出し、エンコードし、優先順位付けする。
論文 参考訳(メタデータ) (2025-01-30T20:37:47Z) - FactGraph: Evaluating Factuality in Summarization with Semantic Graph
Representations [114.94628499698096]
文書と要約を構造化された意味表現(MR)に分解するFactGraphを提案する。
MRは、コアセマンティックの概念とその関係を記述し、文書と要約の両方の主要な内容を標準形式で集約し、データの疎結合を減少させる。
事実性を評価するための異なるベンチマークの実験では、FactGraphは以前のアプローチよりも最大15%優れていた。
論文 参考訳(メタデータ) (2022-04-13T16:45:33Z) - Generalized Zero-Shot Learning via VAE-Conditioned Generative Flow [83.27681781274406]
一般化されたゼロショット学習は、意味的記述から視覚的表現へ知識を移すことによって、目に見えないクラスと見えないクラスの両方を認識することを目的としている。
近年のGZSLはデータ不足問題として定式化されており、主にGANやVAEを採用して、目に見えないクラスの視覚的特徴を生成する。
GZSLのための条件付き生成フロー,すなわちVAE-Conditioned Generative Flow (VAE-cFlow)を提案する。
論文 参考訳(メタデータ) (2020-09-01T09:12:31Z) - Alleviating the Inconsistency Problem of Applying Graph Neural Network
to Fraud Detection [78.88163190021798]
不整合問題に対処するために、新しいGNNフレームワークである$mathsfGraphConsis$を導入します。
4つのデータセットの実証分析は、不正検出タスクにおいて不整合の問題が不可欠であることを示唆している。
我々はまた、SOTAモデルを実装したGNNベースの不正検出ツールボックスもリリースした。
論文 参考訳(メタデータ) (2020-05-01T21:43:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。