論文の概要: ContextRAG: Extraction-Free Hierarchical Graph Construction for Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2605.19735v1
- Date: Tue, 19 May 2026 12:08:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.316903
- Title: ContextRAG: Extraction-Free Hierarchical Graph Construction for Retrieval-Augmented Generation
- Title(参考訳): ContextRAG:Retrieval-Augmented Generationのための抽出自由階層グラフ構築
- Authors: Roman Prosvirnin, Sergei Kuznetsov, Seungmin Jin,
- Abstract要約: グラフ構造化検索拡張生成システム(RAG)は,マルチホップ質問に対する回答品質を向上させることができる。
現在のシステムは、インデックス作成中にエンティティ、関係、要約を抽出するために、大きな言語モデル(LLM)に依存している。
グラフトポロジをLCMベースのエンティティや関係抽出なしで構築したグラフRAGシステムであるContextRAGを提案する。
- 参考スコア(独自算出の注目度): 0.9936176521793759
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graph-structured retrieval-augmented generation (RAG) systems can improve answer quality on multi-hop questions, but many current systems rely on large language models (LLMs) to extract entities, relations, and summaries during indexing. These calls add token and wall-clock costs that grow with corpus size. We present ContextRAG, a graph RAG system whose graph topology is constructed without LLM-based entity or relation extraction. ContextRAG derives a fuzzy concept graph over chunk embeddings using residual-quantization k-means and Formal Concept Analysis with Lukasiewicz residuated logic. Bridge-like and meet-derived context nodes are induced by soft fuzzy join and meet operations, rather than by LLM-written graph edges. On a 130-task UltraDomain subset, ContextRAG builds its index with 30 LLM calls and 22,073 tokens. In contrast, a local HiRAG reproduction stress test required 870 indexing calls and 3.54M tokens on a 20-task subset before failing during graph construction; linear extrapolation to 130 tasks implies over 23M indexing tokens. ContextRAG obtains 33.6% F1 overall and 36.8% F1 on multi-hop tasks. An activation analysis shows that queries retrieving at least one lattice-derived node in the top five achieve +3.9 percentage points F1 over queries that do not; this association is diagnostic rather than causal.
- Abstract(参考訳): グラフ構造化検索拡張生成システム(RAG)は、マルチホップ質問に対する回答品質を改善することができるが、現在のシステムの多くは、インデックス作成中にエンティティ、関係、要約を抽出するために、大きな言語モデル(LLM)に依存している。
これらの呼び出しは、コーパスサイズに応じて成長するトークンとウォールクロックコストを追加する。
グラフトポロジをLCMベースのエンティティや関係抽出なしで構築したグラフRAGシステムであるContextRAGを提案する。
ContextRAG は、残留量子化 k-means と Lukasiewicz 置換論理を用いた形式的概念解析を用いたチャンク埋め込み上のファジィ概念グラフを導出する。
ブリッジ型およびミート型コンテキストノードは、LSMで書かれたグラフエッジではなく、ソフトファジィ結合と整合演算によって誘導される。
130タスクのUltraDomainサブセット上で、ContextRAGは30のLLMコールと22,073トークンでインデックスを構築する。
対照的に、局所的なHiRAG再生ストレステストでは、グラフ構築時に失敗する20タスクのサブセットに870のインデックス化コールと3.54Mトークンが必要であり、130タスクへの線形外挿は23M以上のインデックス化トークンを意味する。
ContextRAGは、総合的に33.6%のF1、マルチホップタスクで36.8%のF1を獲得している。
アクティベーション分析は、上位5つの格子由来ノードのうち少なくとも1つを検索するクエリが、そうでないクエリに対して+3.9パーセントのF1を達成することを示している。
関連論文リスト
- MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries [2.756584457554517]
Map-Disambiguate-Enrich-Reduce (MDER)はコンテキスト由来の3重記述を生成し、エンティティレベルの要約と統合する。
Decompose-Resolve (DR)は、ユーザクエリを解決可能なトリプルに分解し、知識グラフに格納する。
MDERとDRはLLM駆動のQAパイプラインを形成し、スパース、不完全、複雑なリレーショナルデータに対して堅牢である。
論文 参考訳(メタデータ) (2026-03-11T18:38:44Z) - TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework [62.66056331998838]
TeaRAGは、検索内容と推論ステップの両方を圧縮できるトークン効率のエージェントRAGフレームワークである。
報奨関数は,過剰な推論ステップをペナルティ化しながら,知識マッチング機構によって知識満足度を評価する。
論文 参考訳(メタデータ) (2025-11-07T16:08:34Z) - Interpretable Question Answering with Knowledge Graphs [0.19695349076827803]
本稿では,知識グラフ検索のみで動作する質問応答システムを提案する。
知識グラフのクエリから取得したエンティティ関係エッジをパラフレーズ化するために、小さなパラフレーズモデルが使用される。
この研究はCRAGベンチマークでLCM-as-a-judgeを用いて評価され、71.9%と54.4%の精度が得られた。
論文 参考訳(メタデータ) (2025-10-22T02:36:35Z) - Enrich-on-Graph: Query-Graph Alignment for Complex Reasoning with LLM Enriching [61.824094419641575]
大言語モデル(LLM)は知識グラフ質問応答(KGQA)のような知識集約的なシナリオにおける幻覚と事実的誤りに苦しむ
これは、構造化知識グラフ(KG)と非構造化クエリのセマンティックギャップによるもので、その焦点や構造に固有の違いが原因である。
既存の手法は通常、バニラKGの資源集約的で非スケーリング可能な推論を用いるが、このギャップを見落としている。
我々は、LLMの事前知識を活用してKGを充実させる柔軟なフレームワークEnrich-on-Graph(EoG)を提案し、グラフとクエリ間のセマンティックギャップを埋める。
論文 参考訳(メタデータ) (2025-09-25T06:48:52Z) - GRIL: Knowledge Graph Retrieval-Integrated Learning with Large Language Models [59.72897499248909]
本稿では,Large Language Models (LLM) を用いたエンドツーエンド学習のための新しいグラフ検索手法を提案する。
抽出したサブグラフでは, 構造的知識と意味的特徴をそれぞれ軟式トークンと言語化グラフで符号化し, LLMに注入する。
提案手法は、複雑な推論タスクに対する結合グラフ-LLM最適化の強みを検証し、最先端の性能を一貫して達成する。
論文 参考訳(メタデータ) (2025-09-20T02:38:00Z) - Clue-RAG: Towards Accurate and Cost-Efficient Graph-based RAG via Multi-Partite Graph and Query-Driven Iterative Retrieval [15.599544326509436]
Retrieval-Augmented Generation (RAG) は、しばしばグラフ構造化データから外部情報を統合することで制限に対処する。
本稿では,マルチパーティグラフインデックスとクエリ駆動反復検索戦略を導入した新しいアプローチであるClue-RAGを提案する。
3つのQAベンチマークの実験により、Clue-RAGは最先端のベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2025-07-11T09:36:45Z) - Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [79.75818239774952]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。
Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。
本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文 参考訳(メタデータ) (2025-05-22T05:15:27Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。