論文の概要: SlimRAG: Retrieval without Graphs via Entity-Aware Context Selection
- arxiv url: http://arxiv.org/abs/2506.17288v1
- Date: Sun, 15 Jun 2025 15:36:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.311853
- Title: SlimRAG: Retrieval without Graphs via Entity-Aware Context Selection
- Title(参考訳): SlimRAG: Entity-Aware Context Selectionによるグラフなし検索
- Authors: Jiale Zhang, Jiaxiang Chen, Zhucong Li, Jie Ding, Kui Zhao, Zenglin Xu, Xin Pang, Yinghui Xu,
- Abstract要約: SlimRAGはグラフのない検索のための軽量フレームワークである。
構造が重いコンポーネントを、シンプルで効果的なエンティティ認識メカニズムで置き換える。
実験により、SlimRAGは強い平坦線とグラフベースのベースラインよりも精度が高いことが示された。
- 参考スコア(独自算出の注目度): 38.200971604630524
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieval-Augmented Generation (RAG) enhances language models by incorporating external knowledge at inference time. However, graph-based RAG systems often suffer from structural overhead and imprecise retrieval: they require costly pipelines for entity linking and relation extraction, yet frequently return subgraphs filled with loosely related or tangential content. This stems from a fundamental flaw -- semantic similarity does not imply semantic relevance. We introduce SlimRAG, a lightweight framework for retrieval without graphs. SlimRAG replaces structure-heavy components with a simple yet effective entity-aware mechanism. At indexing time, it constructs a compact entity-to-chunk table based on semantic embeddings. At query time, it identifies salient entities, retrieves and scores associated chunks, and assembles a concise, contextually relevant input -- without graph traversal or edge construction. To quantify retrieval efficiency, we propose Relative Index Token Utilization (RITU), a metric measuring the compactness of retrieved content. Experiments across multiple QA benchmarks show that SlimRAG outperforms strong flat and graph-based baselines in accuracy while reducing index size and RITU (e.g., 16.31 vs. 56+), highlighting the value of structure-free, entity-centric context selection. The code will be released soon. https://github.com/continue-ai-company/SlimRAG
- Abstract(参考訳): Retrieval-Augmented Generation (RAG)は、推論時に外部知識を組み込むことで言語モデルを強化する。
しかし、グラフベースのRAGシステムは、しばしば構造上のオーバーヘッドと不正確な検索に悩まされる:それらはエンティティリンクと関係抽出のために高価なパイプラインを必要とするが、緩やかに関連づけられた内容で満たされたサブグラフを頻繁に返す。
セマンティックな類似性はセマンティックな関連性を暗示しない。
グラフのない検索のための軽量フレームワークであるSlimRAGを紹介する。
SlimRAGは構造重成分をシンプルで効果的な実体認識機構で置き換える。
インデックス化時に、セマンティック埋め込みに基づいたコンパクトなエンティティ・トゥ・チャンクテーブルを構築する。
クエリ時に、適切なエンティティを特定し、関連するチャンクを検索し、スコアし、グラフのトラバーサルやエッジ構成なしで、簡潔でコンテキスト的に関連する入力を組み立てる。
検索効率を定量化するために,検索したコンテンツのコンパクト性を測定する指標である相対指数トークン利用法(RITU)を提案する。
複数のQAベンチマークによる実験によると、SlimRAGは、インデックスサイズとRITU(例:16.31 vs. 56+)を削減しつつ、強いフラットとグラフベースのベースラインを精度で上回り、構造のないエンティティ中心のコンテキスト選択の価値を強調している。
コードはまもなくリリースされる。
https://github.com/continue-ai-company/SlimRAG
関連論文リスト
- Respecting Temporal-Causal Consistency: Entity-Event Knowledge Graphs for Retrieval-Augmented Generation [69.45495166424642]
我々は,物語文書における時間的,因果的,文字的整合性を理解するために,頑健で差別的なQAベンチマークを開発する。
次に、バイナリマッピングでリンクされたエンティティとイベントのサブグラフを分離したまま保持するデュアルグラフフレームワークであるEntity-Event RAG(E2RAG)を紹介します。
ChronoQA全体で、我々のアプローチは最先端の非構造化およびKGベースのRAGベースラインよりも優れており、因果一貫性クエリや文字整合性クエリが顕著である。
論文 参考訳(メタデータ) (2025-06-06T10:07:21Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [18.96570718233786]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z) - ELITE: Embedding-Less retrieval with Iterative Text Exploration [5.8851517822935335]
大規模言語モデル(LLM)は自然言語処理において顕著な進歩を遂げた。
長期のコンテキスト制約を維持する能力は、ドキュメントレベルやマルチターンタスクのパフォーマンスを制限します。
論文 参考訳(メタデータ) (2025-05-17T08:48:43Z) - PathRAG: Pruning Graph-based Retrieval Augmented Generation with Relational Paths [42.01377074786958]
Retrieval-augmented Generation (RAG)は、外部データベースから知識を取得することで、大規模言語モデル(LLM)の応答品質を改善する。
本稿では、インデックス化グラフから重要な関係経路を検索し、これらの経路をテキスト形式に変換してLLMを誘導するPathRAGを提案する。
PathRAGは、6つのデータセットと5つの評価次元で、最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-02-18T11:18:55Z) - SiReRAG: Indexing Similar and Related Information for Multihop Reasoning [96.60045548116584]
SiReRAGは、類似情報と関連する情報の両方を明示的に考慮する新しいRAGインデックス方式である。
SiReRAGは、3つのマルチホップデータセットの最先端インデックス手法を一貫して上回る。
論文 参考訳(メタデータ) (2024-12-09T04:56:43Z) - Less is More: Making Smaller Language Models Competent Subgraph Retrievers for Multi-hop KGQA [51.3033125256716]
本研究では,小言語モデルで処理される条件生成タスクとして,サブグラフ検索タスクをモデル化する。
2億2千万のパラメータからなる基本生成部分グラフ検索モデルでは,最先端モデルと比較して競合検索性能が向上した。
LLMリーダを接続した最大の3Bモデルは、WebQSPとCWQベンチマークの両方で、SOTAのエンドツーエンドパフォーマンスを新たに設定します。
論文 参考訳(メタデータ) (2024-10-08T15:22:36Z) - Modeling Fine-grained Information via Knowledge-aware Hierarchical Graph
for Zero-shot Entity Retrieval [11.533614615010643]
我々は,よりきめ細かい情報を文埋め込みに補完するものとして,GERを提案する。
これらの知識ユニットから情報を集約することで、言及/関心に関するきめ細かい情報を学習する。
一般的なベンチマーク実験の結果,提案するGERフレームワークは,従来の最先端モデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-11-20T14:37:53Z) - Autoregressive Entity Retrieval [55.38027440347138]
エンティティは、知識の表現と集約の方法の中心にあります。
クエリが与えられたエンティティを検索できることは、エンティティリンクやオープンドメインの質問応答のような知識集約的なタスクに基本となる。
本稿では,自己回帰方式でトークン・バイ・トークンを左から右に生成し,エンティティを検索する最初のシステムであるGENREを提案する。
論文 参考訳(メタデータ) (2020-10-02T10:13:31Z) - Iterative Context-Aware Graph Inference for Visual Dialog [126.016187323249]
本稿では,新しいコンテキスト認識グラフ(CAG)ニューラルネットワークを提案する。
グラフの各ノードは、オブジェクトベース(視覚)と履歴関連(テキスト)コンテキスト表現の両方を含む、共同意味機能に対応している。
論文 参考訳(メタデータ) (2020-04-05T13:09:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。