論文の概要: SproutRAG: Attention-Guided Tree Search with Progressive Embeddings for Long-Document RAG
- arxiv url: http://arxiv.org/abs/2606.18381v1
- Date: Tue, 16 Jun 2026 18:28:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:50.841669
- Title: SproutRAG: Attention-Guided Tree Search with Progressive Embeddings for Long-Document RAG
- Title(参考訳): SproutRAG:長期文書RAGのためのプログレッシブ埋め込みを用いた注意誘導木探索
- Authors: Amirhossein Abaskohi, Issam H. Laradji, Peter West, Giuseppe Carenini,
- Abstract要約: 本稿では,注意誘導型階層型RAGフレームワークであるSproutRAGを紹介する。
文レベルのチャンクを徐々に大きく、意味的に一貫性のある単位に整理する。
どのアテンションヘッドとレイヤがセマンティックドキュメント構造を最もよく捉えているかを学ぶ。
- 参考スコア(独自算出の注目度): 23.48941508046885
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-augmented generation (RAG) systems must balance retrieval granularity with contextual coherence, a challenge that existing methods address through LLM-guided chunking, single-level context expansion, or hierarchical summarization. These approaches variously depend on costly LLM calls during indexing or retrieval, limit context aggregation to a single granularity level, or introduce information loss through summarization. We present SproutRAG, an attention-guided hierarchical RAG framework that addresses this trade-off by organizing sentence-level chunks into progressively larger but semantically coherent units, using learned inter-sentence attention to construct a binary chunking tree. Unlike prior approaches that rely on external LLMs, fixed context expansion, or lossy summarization, SproutRAG learns which attention heads and layers best capture semantic document structure, enabling multi-granularity retrieval without additional LLM calls or compressed summaries. At retrieval time, SproutRAG uses hierarchical beam search to retrieve candidates at multiple granularities, capturing multi-sentence relevance beyond flat retrieval. The framework is trained end-to-end with a joint objective that improves both embeddings and tree structure. Experiments across four benchmarks spanning scientific, legal, and open-domain settings demonstrate that SproutRAG improves information efficiency (IE) by 6.1% on average over the strongest baseline. Code is available on https://github.com/AmirAbaskohi/SproutRAG.
- Abstract(参考訳): Retrieval-augmented Generation (RAG) システムは、検索の粒度とコンテキストコヒーレンス(文脈コヒーレンス)のバランスをとる必要がある。
これらのアプローチは、インデックス作成や検索においてコストのかかるLCM呼び出しに依存し、コンテキストアグリゲーションを1つの粒度レベルに制限するか、あるいは要約による情報損失を導入する。
SproutRAGは、文レベルのチャンクを徐々に大きく、意味的に一貫性のある単位に整理し、学習された文間注意を用いてバイナリチャンクツリーを構築することで、このトレードオフに対処する注意誘導階層型RAGフレームワークである。
SproutRAGは、外部のLLM、固定コンテキスト拡張、あるいはロスリーの要約に依存する従来のアプローチとは異なり、どのアテンションヘッドとレイヤがセマンティックドキュメント構造を最もよくとらえるかを学習し、追加のLLM呼び出しや圧縮サマリーなしで複数のグラニュラリティ検索を可能にする。
検索時に、SproutRAGは階層的なビームサーチを使用して、複数の粒度の候補を検索し、平坦な検索を超えた多文関係をキャプチャする。
このフレームワークは、埋め込みとツリー構造の両方を改善する共同目的でエンドツーエンドにトレーニングされている。
科学的、法的、そしてオープンドメインの設定にまたがる4つのベンチマークの実験では、SproutRAGは最強のベースラインよりも平均して情報効率(IE)を6.1%改善している。
コードはhttps://github.com/AmirAbaskohi/SproutRAGで入手できる。
関連論文リスト
- HCRE: LLM-based Hierarchical Classification for Cross-Document Relation Extraction with a Prediction-then-Verification Strategy [54.91468501159335]
文書間関係抽出 (RE) は, 異なる文書に存在する頭部尾部エンティティ間の関係を識別することを目的としている。
本稿では,各レベルでの多視点検証により信頼性を向上させる推論戦略を提案する。
論文 参考訳(メタデータ) (2026-04-09T07:55:27Z) - GrepRAG: An Empirical Study and Optimization of Grep-Like Retrieval for Code Completion [32.17127975368661]
リポジトリレベルのコード補完は、大きな言語モデルでは依然として困難である。
本稿では,軽量でインデックスなし,意図認識型語彙検索について検討する。
本稿では,LLMが関連するコンテキストを自動生成するベースラインフレームワークであるNaive GrepRAGを紹介する。
論文 参考訳(メタデータ) (2026-01-30T18:22:15Z) - M-RAG: Making RAG Faster, Stronger, and More Efficient [15.147969102210759]
大規模言語モデルのための新しいチャンクフリー検索戦略であるM-RAGを提案する。
M-RAGは構造化されたk-v分解メタマーカーを軽量で意図に整合した検索キーで抽出する。
M-RAGは高い効率で解答フレンドリーな証拠を回収できることを示す。
論文 参考訳(メタデータ) (2026-01-06T15:14:54Z) - LLM-guided Hierarchical Retrieval [54.73080745446999]
LATTICEは階層的な検索フレームワークであり、LLMは対数探索の複雑さで大きなコーパスを推論し、ナビゲートすることができる。
LLM誘導探索における中心的な課題は、モデルの関連性判断がノイズが多く、文脈に依存し、階層性に気付かないことである。
我々のフレームワークは、推論集約型BRIGHTベンチマークで最先端のゼロショット性能を実現する。
論文 参考訳(メタデータ) (2025-10-15T07:05:17Z) - GRIL: Knowledge Graph Retrieval-Integrated Learning with Large Language Models [59.72897499248909]
本稿では,Large Language Models (LLM) を用いたエンドツーエンド学習のための新しいグラフ検索手法を提案する。
抽出したサブグラフでは, 構造的知識と意味的特徴をそれぞれ軟式トークンと言語化グラフで符号化し, LLMに注入する。
提案手法は、複雑な推論タスクに対する結合グラフ-LLM最適化の強みを検証し、最先端の性能を一貫して達成する。
論文 参考訳(メタデータ) (2025-09-20T02:38:00Z) - Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.56450566014625]
ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文 参考訳(メタデータ) (2025-09-08T10:58:42Z) - LeanRAG: Knowledge-Graph-Based Generation with Semantic Aggregation and Hierarchical Retrieval [10.566901995776025]
LeanRAGは知識集約と検索戦略を組み合わせたフレームワークです。
グラフ上のパス検索に関連するかなりのオーバーヘッドを軽減し、冗長な情報検索を最小限にする。
論文 参考訳(メタデータ) (2025-08-14T06:47:18Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。