論文の概要: Uncertainty-Aware Hybrid Retrieval for Long-Document RAG
- arxiv url: http://arxiv.org/abs/2606.13550v1
- Date: Thu, 11 Jun 2026 16:30:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.916101
- Title: Uncertainty-Aware Hybrid Retrieval for Long-Document RAG
- Title(参考訳): 長期文書RAGにおける不確実性を考慮したハイブリッド検索
- Authors: Hoin Jung, Xiaoqian Wang,
- Abstract要約: Uncertainty-aware Multi-Granularity RAG (UMG-RAG) は、チャンクの粒度をクエリ固有の信頼性推定として扱う訓練不要なハイブリッド検索フレームワークである。
UMG-RAGは、複数の塊の粒度にまたがる相補的な専門家として、既存の高密度でスパースなレトリバーを使用している。
UMGP-RAGは,局所的コヒーレンスのために,より広範に非冗長な親チャンクを返却しながら,微細なヒットを用いて関連する証拠を発見できる親促進型である。
- 参考スコア(独自算出の注目度): 18.83395586542378
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval augmented generation (RAG) depends critically on the quality and granularity of retrieved evidence. Large retrieval units preserve context but often introduce irrelevant content, which can dilute answer bearing evidence and worsen long context utilization. Fine-grained units are more compact, but they may be difficult to retrieve reliably because short chunks can lack semantic, lexical, or bridging cues needed to match the query. We propose Uncertainty-aware Multi-Granularity RAG (UMG-RAG), a training-free hybrid retrieval framework that treats chunk granularity as query-specific reliability estimation. Instead of training a new retriever or modifying the generator, UMG-RAG uses existing dense and sparse retrievers as complementary experts across multiple chunk granularities. For each query, it converts each expert-granularity score list into an evidence distribution, estimates reliability from distribution entropy, and fuses candidates according to query-specific semantic, lexical, and granularity confidence. We further introduce UMGP-RAG, a parent promotion variant that uses fine-grained hits to locate relevant evidence while returning broader non-redundant parent chunks for local coherence. Experiments on question answering benchmarks show that uncertainty-aware fusion and parent promotion improve generation quality while maintaining a lightweight, plug-and-play retrieval pipeline.
- Abstract(参考訳): 検索拡張生成(RAG)は、検索された証拠の品質と粒度に大きく依存する。
大規模な検索ユニットは文脈を保存するが、しばしば無関係な内容を導入する。
細粒度単位はよりコンパクトであるが、短いチャンクはクエリにマッチするために必要な意味、語彙、またはブリッジングキューを欠いているため、確実に検索することは困難である。
本研究では,チャンクの粒度をクエリ固有の信頼性評価として扱う訓練不要なハイブリッド検索フレームワークである Uncertainty-aware Multi-Granularity RAG (UMG-RAG) を提案する。
UMG-RAGは、新しいレトリバーをトレーニングしたり、ジェネレータを変更する代わりに、既存の高密度でスパースなレトリバーを、複数のチャンクの粒度にまたがる補完的な専門家として使用する。
各クエリに対して、各専門家-粒度スコアリストをエビデンス分布に変換し、分布エントロピーから信頼性を推定し、クエリ固有のセマンティクス、語彙、粒度信頼に基づいて候補を融合させる。
UMGP-RAGは,局所的コヒーレンスのために,より広範に非冗長な親チャンクを返却しながら,微細なヒットを用いて関連する証拠を発見できる親促進型である。
質問応答ベンチマークの実験により、不確実性を考慮した融合と親の促進により、軽量でプラグアンドプレイのパイプラインを維持しながら生成品質が向上することが示された。
関連論文リスト
- Rethinking the Reranker: Boundary-Aware Evidence Selection for Robust Retrieval-Augmented Generation [64.09110141948693]
Retrieval-Augmented Generation (RAG) システムは、現実的な検索ノイズの下でも不安定である。
そこで我々は,BAR-RAGを提案する。このBAR-RAGは,発電機のGoldilocks Zoneをターゲットとした境界認識型エビデンスセレクタである。
Bar-RAGはノイズ検索において、エンドツーエンドのパフォーマンスを一貫して改善する。
論文 参考訳(メタデータ) (2026-02-03T16:08:23Z) - MARA: A Multimodal Adaptive Retrieval-Augmented Framework for Document Question Answering [51.19392014547221]
検索型マルチモーダル文書QAは,視覚的にリッチな文書から複雑なマルチモーダル構造を持つ関連情報を識別し,統合することを目的としている。
現在のアプローチは、サージェントなコンテンツを見渡すクエリに依存しないドキュメント表現に依存しています。
本稿では,クエリ適応生成を導入したMultimodal Adaptive Retrieval-Augmented (MARA)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-01T12:27:40Z) - PruneRAG: Confidence-Guided Query Decomposition Trees for Efficient Retrieval-Augmented Generation [19.832367438725306]
PruneRAGは、安定かつ効率的な推論を行うために構造化されたクエリ分解ツリーを構築する。
我々は,ゴールデンエビデンスを回収するが正しく使用しない事例を定量化するための指標として,エビデンス予測率を定義した。
論文 参考訳(メタデータ) (2026-01-16T06:38:17Z) - ReAG: Reasoning-Augmented Generation for Knowledge-based Visual Question Answering [54.72902502486611]
ReAG(Reasoning-Augmented Multimodal RAG)は、粗い部分ときめ細かい部分の検索と、無関係な通路をフィルタリングする批評家モデルを組み合わせた手法である。
ReAGは従来の手法よりも優れており、解答精度が向上し、検索された証拠に根ざした解釈可能な推論を提供する。
論文 参考訳(メタデータ) (2025-11-27T19:01:02Z) - SIRAG: Towards Stable and Interpretable RAG with A Process-Supervised Multi-Agent Framework [7.37561751991963]
本稿では,レシーバとジェネレータのギャップを埋めるプロセス管理型マルチエージェントフレームワークを提案する。
提案するフレームワークはモジュール式でプラグアンドプレイで、レトリバーやジェネレータを変更する必要はない。
論文 参考訳(メタデータ) (2025-09-17T09:09:28Z) - Faithfulness-Aware Uncertainty Quantification for Fact-Checking the Output of Retrieval Augmented Generation [108.13261761812517]
本稿では,RAG出力における幻覚検出の新しい手法であるFRANQ(Fithfulness-based Retrieval Augmented Uncertainty Quantification)を紹介する。
本稿では,事実性と忠実性の両方に注釈を付したQAデータセットを提案する。
論文 参考訳(メタデータ) (2025-05-27T11:56:59Z) - Corrective Retrieval Augmented Generation [36.04062963574603]
Retrieval-augmented Generation (RAG) は、検索された文書の関連性に大きく依存しており、検索が失敗した場合のモデルがどのように振る舞うかについての懸念を提起する。
生成の堅牢性を改善するために,CRAG(Corrective Retrieval Augmented Generation)を提案する。
CRAGはプラグアンドプレイであり、様々なRAGベースのアプローチとシームレスに結合できる。
論文 参考訳(メタデータ) (2024-01-29T04:36:39Z) - Generation-Augmented Retrieval for Open-domain Question Answering [134.27768711201202]
GAR(Generation-Augmented Retrieval)は、オープンドメインの質問に答える機能である。
クエリーに対して多様なコンテキストを生成することは、結果の融合が常により良い検索精度をもたらすので有益であることを示す。
GARは、抽出読取装置を備えた場合、抽出QA設定の下で、自然質問およびトリビアQAデータセットの最先端性能を達成する。
論文 参考訳(メタデータ) (2020-09-17T23:08:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。