論文の概要: Beyond Chunk-Local Extraction: Cross-Chunk Graph Augmentation for GraphRAG
- arxiv url: http://arxiv.org/abs/2605.28004v1
- Date: Wed, 27 May 2026 05:55:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.78531
- Title: Beyond Chunk-Local Extraction: Cross-Chunk Graph Augmentation for GraphRAG
- Title(参考訳): チャンクローカル抽出を超えて: GraphRAGのためのクロスチャンクグラフ拡張
- Authors: Jiaming Zhang, Yibo Zhao, Jing Yu, Jianxiang Yu, Xiang Li,
- Abstract要約: GraphRAGは、コーパスを明示的な知識グラフとして整理することで、検索拡張生成を拡張する。
既存のフレームワークは個々のチャンク内のエンティティとリレーションを抽出し、クロスチャンクの関係はインデックスから体系的に欠落している。
GNN誘導のCROSS-Chunk Graph AUGmentation法であるCrossAugを提案する。
- 参考スコア(独自算出の注目度): 11.699085890492833
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: GraphRAG extends retrieval-augmented generation by organizing corpora as explicit knowledge graphs, enabling graph-based retrieval for complex question answering. However, existing frameworks extract entities and relations within individual chunks, leaving cross-chunk relations -- those whose evidence spans multiple passages -- systematically absent from the index. Exhaustive LLM-based recovery of such relations is impractical due to the combinatorial explosion of chunk combinations. We present CrossAug, a GNN-guided CROSS-Chunk Graph AUGmentation method that enriches GraphRAG indices with cross-chunk relational structure as an offline step before query-time retrieval. CrossAug derives training supervision through self-supervised graph corruption, uses a topology-aware GNN to score subgraphs for missingness, and applies evidence-grounded LLM completion only to selected high-scoring regions. Experiments on three LLM-based GraphRAG frameworks across four multi-hop and long-document QA benchmarks demonstrate that CrossAug consistently improves performance, confirming the benefit of cross-chunk graph augmentation for retrieval-based question answering. Our code is available at https://github.com/DonFinliani/CrossAug.
- Abstract(参考訳): GraphRAGは、コーパスを明示的な知識グラフとして整理することにより、検索拡張生成を拡張し、複雑な質問応答のためのグラフベースの検索を可能にする。
しかし、既存のフレームワークは個々のチャンク内のエンティティや関係を抽出し、複数の通路にまたがるクロスチャンクの関係は、インデックスから体系的に欠落している。
LLMによるこのような関係の回復は、チャンク結合の組合せ爆発により不可能である。
GNN誘導のCROSS-Chunk Graph AUGmentation法であるCrossAugを提案する。
CrossAugは、自己監督グラフの破損によるトレーニングの監督を導出し、トポロジを意識したGNNを使用して、不足した部分グラフをスコアし、エビデンス基底のLLM補完を選択されたハイスコア領域にのみ適用する。
LLMベースのGraphRAGフレームワークを4つのマルチホップおよび長期ドキュメントQAベンチマークで実験した結果、CrossAugは一貫してパフォーマンスを改善し、検索ベースの質問応答に対するクロスチャンクグラフ強化のメリットを確認している。
私たちのコードはhttps://github.com/DonFinliani/CrossAug.orgから入手可能です。
関連論文リスト
- ProGraph-R1: Progress-aware Reinforcement Learning for Graph Retrieval Augmented Generation [37.11787010202267]
ProGraph-R1は,グラフベースの検索と多段階推論のためのプログレッシブ・エージェント・フレームワークである。
ProGraph-R1は、意味的関連性とグラフ接続性について共同で検討する構造対応のハイパーグラフ検索機構を導入している。
マルチホップ質問応答ベンチマークの実験では、ProGraph-R1は既存のGraphRAG法よりも推論精度と生成品質を一貫して改善している。
論文 参考訳(メタデータ) (2026-01-25T08:58:44Z) - Graph-Anchored Knowledge Indexing for Retrieval-Augmented Generation [53.42323544075114]
グラフアンコール型知識インデックス手法であるGraphAnchorを提案する。
4つのマルチホップ質問応答ベンチマークの実験では、GraphAnchorの有効性が示されている。
論文 参考訳(メタデータ) (2026-01-23T05:41:05Z) - LinearRAG: Linear Graph Retrieval Augmented Generation on Large-scale Corpora [17.929144506419064]
Retrieval-Augmented Generation (RAG) は大規模言語モデル(LLM)の幻覚を軽減するために広く用いられている。
既存のグラフベースのRAG法は、グラフ構築のための不安定でコストのかかる関係抽出に依存している。
信頼性の高いグラフ構築と正確な経路抽出を可能にする効率的なフレームワークであるLinearRAGを提案する。
論文 参考訳(メタデータ) (2025-10-11T08:43:45Z) - GRIL: Knowledge Graph Retrieval-Integrated Learning with Large Language Models [59.72897499248909]
本稿では,Large Language Models (LLM) を用いたエンドツーエンド学習のための新しいグラフ検索手法を提案する。
抽出したサブグラフでは, 構造的知識と意味的特徴をそれぞれ軟式トークンと言語化グラフで符号化し, LLMに注入する。
提案手法は、複雑な推論タスクに対する結合グラフ-LLM最適化の強みを検証し、最先端の性能を一貫して達成する。
論文 参考訳(メタデータ) (2025-09-20T02:38:00Z) - GraphRunner: A Multi-Stage Framework for Efficient and Accurate Graph-Based Retrieval [3.792463570467098]
GraphRunnerは、新しいグラフベースの検索フレームワークで、計画、検証、実行の3つの異なる段階で動作する。
推論エラーを著しく低減し、実行前に幻覚を検出する。
GRBenchデータセットによる評価は、GraphRunnerが既存のアプローチを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-07-11T18:10:01Z) - Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [79.75818239774952]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。
Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。
本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文 参考訳(メタデータ) (2025-05-22T05:15:27Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z) - RGL: A Graph-Centric, Modular Framework for Efficient Retrieval-Augmented Generation on Graphs [58.10503898336799]
完全なRAGパイプラインをシームレスに統合するモジュラーフレームワークであるRAG-on-Graphs Library(RGL)を紹介した。
RGLは、さまざまなグラフフォーマットをサポートし、必須コンポーネントの最適化実装を統合することで、重要な課題に対処する。
評価の結果,RGLはプロトタイピングプロセスの高速化だけでなく,グラフベースRAGシステムの性能や適用性の向上も図っている。
論文 参考訳(メタデータ) (2025-03-25T03:21:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。