Fugu-MT 論文翻訳(概要): KET-RAG: A Cost-Efficient Multi-Granular Indexing Framework for Graph-RAG

論文の概要: KET-RAG: A Cost-Efficient Multi-Granular Indexing Framework for Graph-RAG

arxiv url: http://arxiv.org/abs/2502.09304v1
Date: Thu, 13 Feb 2025 13:16:16 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-14 20:05:35.282644
Title: KET-RAG: A Cost-Efficient Multi-Granular Indexing Framework for Graph-RAG
Title（参考訳）: KET-RAG - Graph-RAGのための費用効率の良いマルチグラニュラーインデックスフレームワーク
Authors: Yiqian Huang, Shiqi Zhang, Xiaokui Xiao,
Abstract要約: Graph-RAGは、Large Language Model (LLM)ベースの質問応答における検索を改善するために、テキストチャンクから知識グラフを構築する。既存のGraph-RAGシステムでは、テキストチャンクの関連性に基づいてKNNグラフを構築しているが、この粗い粒度のアプローチでは、テキスト内のエンティティ関係をキャプチャできない。 KET-RAGは,インデクシングコストを低減しつつ,良好な結果の精度を確保するための多粒性インデックスフレームワークである。
参考スコア（独自算出の注目度）: 21.62060252772377
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Graph-RAG constructs a knowledge graph from text chunks to improve retrieval in Large Language Model (LLM)-based question answering. It is particularly useful in domains such as biomedicine, law, and political science, where retrieval often requires multi-hop reasoning over proprietary documents. Some existing Graph-RAG systems construct KNN graphs based on text chunk relevance, but this coarse-grained approach fails to capture entity relationships within texts, leading to sub-par retrieval and generation quality. To address this, recent solutions leverage LLMs to extract entities and relationships from text chunks, constructing triplet-based knowledge graphs. However, this approach incurs significant indexing costs, especially for large document collections. To ensure a good result accuracy while reducing the indexing cost, we propose KET-RAG, a multi-granular indexing framework. KET-RAG first identifies a small set of key text chunks and leverages an LLM to construct a knowledge graph skeleton. It then builds a text-keyword bipartite graph from all text chunks, serving as a lightweight alternative to a full knowledge graph. During retrieval, KET-RAG searches both structures: it follows the local search strategy of existing Graph-RAG systems on the skeleton while mimicking this search on the bipartite graph to improve retrieval quality. We evaluate eight solutions on two real-world datasets, demonstrating that KET-RAG outperforms all competitors in indexing cost, retrieval effectiveness, and generation quality. Notably, it achieves comparable or superior retrieval quality to Microsoft's Graph-RAG while reducing indexing costs by over an order of magnitude. Additionally, it improves the generation quality by up to 32.4% while lowering indexing costs by around 20%.
Abstract（参考訳）: Graph-RAGは、Large Language Model (LLM)ベースの質問応答における検索を改善するために、テキストチャンクから知識グラフを構築する。バイオメディシン、法学、政治学などの分野では特に有用であり、検索にはプロプライエタリな文書に対するマルチホップ推論が必要となることが多い。既存のGraph-RAGシステムでは、テキストチャンクの関連性に基づいてKNNグラフを構築しているが、この粗い粒度のアプローチではテキスト内のエンティティ関係をキャプチャできず、サブパー検索と生成品質に繋がる。この問題に対処するために、最近のソリューションでは、LCMを活用して、テキストチャンクからエンティティと関係を抽出し、トリプルトベースの知識グラフを構築する。しかし、このアプローチは、特に大規模なドキュメント収集において、大幅なインデックス作成コストを発生させる。インデクシングコストを低減しつつ、良好な結果の精度を確保するため、マルチグラニュラインデックスフレームワークであるKET-RAGを提案する。 KET-RAGはまず、キーテキストチャンクの小さなセットを特定し、LLMを活用して知識グラフスケルトンを構築する。その後、すべてのテキストチャンクからテキストキーワードの2部グラフを構築し、完全な知識グラフの軽量な代替として機能する。検索中、KET-RAGは2つの構造を検索する: 既存のGraph-RAGシステムのスケルトン上の局所的な検索戦略に従い、この検索を二部グラフ上で模倣して検索品質を向上させる。実世界の2つのデータセット上で8つのソリューションを評価し、KET-RAGが索引付けコスト、検索効率、生成品質において全ての競合より優れていることを示した。特に、インデックス作成コストを桁違いに削減しながら、MicrosoftのGraph-RAGに匹敵する、あるいは優れた検索品質を実現している。さらに、インデックス作成コストを約20%削減しながら、生成品質を最大32.4%向上させる。

関連論文リスト

Graph-Anchored Knowledge Indexing for Retrieval-Augmented Generation [53.42323544075114]
グラフアンコール型知識インデックス手法であるGraphAnchorを提案する。 4つのマルチホップ質問応答ベンチマークの実験では、GraphAnchorの有効性が示されている。
論文参考訳（メタデータ） (2026-01-23T05:41:05Z)
GraphSearch: Agentic Search-Augmented Reasoning for Zero-Shot Graph Learning [9.147800129236918]
GraphSearchは、検索強化推論をグラフ学習に拡張するフレームワークである。セマンティックなクエリから検索空間(例えば1ホップ、マルチホップ、グローバルな隣人など)を切り離す。ゼロショットノード分類とリンク予測に最先端の結果を設定する。
論文参考訳（メタデータ） (2026-01-13T15:00:57Z)
TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework [62.66056331998838]
TeaRAGは、検索内容と推論ステップの両方を圧縮できるトークン効率のエージェントRAGフレームワークである。報奨関数は,過剰な推論ステップをペナルティ化しながら,知識マッチング機構によって知識満足度を評価する。
論文参考訳（メタデータ） (2025-11-07T16:08:34Z)
GraphSearch: An Agentic Deep Searching Workflow for Graph Retrieval-Augmented Generation [35.65907480060404]
textscGraphSearchは、GraphRAGの二重チャネル検索を備えた新しいエージェントディープ検索ワークフローである。 textscGraphSearchは、従来の戦略よりも解答精度と生成品質を一貫して改善する。
論文参考訳（メタデータ） (2025-09-26T07:45:56Z)
DGP: A Dual-Granularity Prompting Framework for Fraud Detection with Graph-Enhanced LLMs [55.13817504780764]
実世界の不正検出アプリケーションは、しばしばテキストデータに富んだノード特徴とグラフ構造情報を共同で活用するグラフ学習技術の恩恵を受ける。グラフ強化LSMは、グラフ情報をプロンプトに変換する、有望なグラフ学習アプローチとして登場します。目的ノードの細粒度テキストの詳細を保存し,情報過負荷を軽減するDGPを提案する。
論文参考訳（メタデータ） (2025-07-29T10:10:47Z)
Clue-RAG: Towards Accurate and Cost-Efficient Graph-based RAG via Multi-Partite Graph and Query-Driven Iterative Retrieval [7.542076325904203]
Retrieval-Augmented Generation (RAG) は、しばしばグラフ構造化データから外部情報を統合することで制限に対処する。本稿では,マルチパーティグラフインデックスとクエリ駆動反復検索戦略を導入した新しいアプローチであるClue-RAGを提案する。 3つのQAベンチマークの実験により、Clue-RAGは最先端のベースラインを著しく上回っている。
論文参考訳（メタデータ） (2025-07-11T09:36:45Z)
Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering [75.12322966980003]
大規模言語モデル(LLM)は、様々な領域にわたって強い帰納的推論能力を示している。既存のRAGパイプラインのほとんどは非構造化テキストに依存しており、解釈可能性と構造化推論を制限する。近年,知識グラフ解答のための知識グラフとLLMの統合について検討している。 KGQAにおける効率的なグラフ検索のための新しいフレームワークであるRAPLを提案する。
論文参考訳（メタデータ） (2025-06-11T12:03:52Z)
Hierarchical Lexical Graph for Enhanced Multi-Hop Retrieval [22.33550491040999]
RAGは、大きな言語モデルを外部の証拠に基礎を置いているが、セマンティックに遠く離れた文書で答えをまとめなければならないと、いまだに混乱している。私たちは、StatementGraphRAGとTopicGraphRAGという2つのプラグイン・アンド・プレイレトリバーを構築します。提案手法は,検索リコールと正当性において平均23.1%の相対的改善を達成し,有意なチャンクベースRAGよりも優れていた。
論文参考訳（メタデータ） (2025-06-09T17:58:35Z)
E^2GraphRAG: Streamlining Graph-based RAG for High Efficiency and Effectiveness [15.829377965705746]
本稿では,グラフベースのRAGフレームワークであるE2GraphRAGを提案する。 E2GraphRAGはGraphRAGの最大10倍のインデックス化を実現し、LightRAGの100倍の高速化を実現している。
論文参考訳（メタデータ） (2025-05-30T05:27:40Z)
Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [75.9865035064794]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。 Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文参考訳（メタデータ） (2025-05-22T05:15:27Z)
Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文参考訳（メタデータ） (2025-05-20T06:44:34Z)
GraphRAFT: Retrieval Augmented Fine-Tuning for Knowledge Graphs on Graph Databases [0.0]
GraphRAFTは、LCMを微調整して、確実に正しいCypherクエリを生成する、検索と推論のためのフレームワークである。本手法は,自然グラフDBに格納された知識グラフを用いて,棚から取り出すことができる最初の方法である。
論文参考訳（メタデータ） (2025-04-07T20:16:22Z)
RGL: A Graph-Centric, Modular Framework for Efficient Retrieval-Augmented Generation on Graphs [58.10503898336799]
完全なRAGパイプラインをシームレスに統合するモジュラーフレームワークであるRAG-on-Graphs Library(RGL)を紹介した。 RGLは、さまざまなグラフフォーマットをサポートし、必須コンポーネントの最適化実装を統合することで、重要な課題に対処する。評価の結果,RGLはプロトタイピングプロセスの高速化だけでなく,グラフベースRAGシステムの性能や適用性の向上も図っている。
論文参考訳（メタデータ） (2025-03-25T03:21:48Z)
PathRAG: Pruning Graph-based Retrieval Augmented Generation with Relational Paths [42.01377074786958]
Retrieval-augmented Generation (RAG)は、外部データベースから知識を取得することで、大規模言語モデル(LLM)の応答品質を改善する。本稿では、インデックス化グラフから重要な関係経路を検索し、これらの経路をテキスト形式に変換してLLMを誘導するPathRAGを提案する。 PathRAGは、6つのデータセットと5つの評価次元で、最先端のベースラインを一貫して上回る。
論文参考訳（メタデータ） (2025-02-18T11:18:55Z)
CG-RAG: Research Question Answering by Citation Graph Retrieval-Augmented LLMs [9.718354494802002]
CG-RAG(Contextualized Graph Retrieval-Augmented Generation)は、グラフ構造に疎密な検索信号を統合する新しいフレームワークである。まず、引用グラフの文脈グラフ表現を提案し、文書内および文書間の明示的および暗黙的な接続を効果的にキャプチャする。次にLexical-Semantic Graph Retrieval(LeSeGR)を提案する。第3に,検索したグラフ構造化情報を利用した文脈認識生成手法を提案する。
論文参考訳（メタデータ） (2025-01-25T04:18:08Z)
Retrieval-Augmented Generation with Graphs (GraphRAG) [84.29507404866257]
Retrieval-augmented Generation (RAG) は、追加情報を取得することによって下流タスクの実行を向上させる強力な技術である。グラフは、その固有の「エッジで接続されたノード」の性質により、巨大な異種情報と関係情報を符号化する。従来のRAGとは異なり、多種多様な形式とドメイン固有の関係知識のようなグラフ構造化データのユニークさは、異なるドメインでGraphRAGを設計する際、ユニークで重要な課題を生じさせる。
論文参考訳（メタデータ） (2024-12-31T06:59:35Z)
LEGO-GraphRAG: Modularizing Graph-based Retrieval-Augmented Generation for Design Space Exploration [17.514586423233872]
LEGO-GraphRAGは,GraphRAGワークフローのきめ細かい分解を可能にするモジュール型フレームワークである。本フレームワークは,大規模実世界のグラフと多様なクエリセット上でのグラフRAGの総合的研究を促進する。
論文参考訳（メタデータ） (2024-11-06T15:32:28Z)
Graph Retrieval-Augmented Generation: A Survey [28.979898837538958]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の課題に再トレーニングを必要とせずに対処することに成功した。本稿では,GraphRAGの方法論について概観する。 Graph-Based Indexing、Graph-Guided Retrieval、Graph-Enhanced Generationを含むGraphRAGワークフローを形式化する。
論文参考訳（メタデータ） (2024-08-15T12:20:24Z)
Towards Lightweight Graph Neural Network Search with Curriculum Graph Sparsification [48.334100429553644]
本稿では,有意義なグラフデータを通じて重要なサブアーキテクチャを識別する結合グラフデータとアーキテクチャ機構を設計することを提案する。最適軽量グラフニューラルネット(GNN)を探索するために,グラフスペーシングとネットワーク・プルーニング(GASSIP)法を用いた軽量グラフニューラル・アーキテクチャ・サーチを提案する。本手法は,探索したGNNとスペーサーグラフのモデルパラメータを半分以下にすることで,オンパーあるいはそれ以上高いノード分類性能を実現する。
論文参考訳（メタデータ） (2024-06-24T06:53:37Z)
GRAG: Graph Retrieval-Augmented Generation [14.98084919101233]
Graph Retrieval-Augmented Generation (GRAG)は、テキストサブグラフを取得する際の根本的な課題に取り組む。本稿では,線形時間で最適な部分グラフ構造を検索する新たな分割・対数戦略を提案する。提案手法は現状のRAG法を著しく上回っている。
論文参考訳（メタデータ） (2024-05-26T10:11:40Z)
Graph Chain-of-Thought: Augmenting Large Language Models by Reasoning on Graphs [60.71360240206726]
大規模言語モデル(LLM)は、特に知識集約的なタスクにおいて幻覚に悩まされる。既存の研究は、外部知識コーパスから取得した個々のテキスト単位でLLMを拡張することを提案する。本稿では,グラフを反復的に推論することで,LLMをグラフで拡張するためのGraph Chain-of-thinkt (Graph-CoT) というフレームワークを提案する。
論文参考訳（メタデータ） (2024-04-10T15:41:53Z)
G-Retriever: Retrieval-Augmented Generation for Textual Graph Understanding and Question Answering [61.93058781222079]
現実のテキストグラフを対象とするフレキシブルな問合せフレームワークを開発した。一般のテキストグラフに対する最初の検索拡張生成(RAG)手法を提案する。 G-Retrieverは、このタスクをSteiner Tree最適化問題として定式化し、グラフ上でRAGを実行する。
論文参考訳（メタデータ） (2024-02-12T13:13:04Z)
Automatic Relation-aware Graph Network Proliferation [182.30735195376792]
GNNを効率的に検索するためのARGNP(Automatic Relation-Aware Graph Network Proliferation)を提案する。これらの操作は階層的なノード/リレーショナル情報を抽出し、グラフ上のメッセージパッシングのための異方的ガイダンスを提供する。 4つのグラフ学習タスクのための6つのデータセットの実験により、我々の手法によって生成されたGNNは、現在最先端の手作りおよび検索に基づくGNNよりも優れていることが示された。
論文参考訳（メタデータ） (2022-05-31T10:38:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。