論文の概要: DF-RAG: Query-Aware Diversity for Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2601.17212v1
- Date: Fri, 23 Jan 2026 22:47:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:07.421449
- Title: DF-RAG: Query-Aware Diversity for Retrieval-Augmented Generation
- Title(参考訳): DF-RAG:Retrieval-Augmented Generationのためのクエリ対応の多様性
- Authors: Saadat Hasan Khan, Spencer Hong, Jingyu Wu, Kevin Lybarger, Youbing Yin, Erin Babinsky, Daben Liu,
- Abstract要約: 多様性に焦点をあてた検索生成(DF-RAG)について紹介する。
DF-RAGは、複雑な推論集約型QAベンチマークの性能向上のために、検索ステップに多様性を体系的に組み込む。
DF-RAGは,コサイン類似度を用いて,バニラRAGよりも4~10パーセント,推論集約QAベンチマークのF1性能を向上することを示した。
- 参考スコア(独自算出の注目度): 4.193235647787737
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Retrieval-augmented generation (RAG) is a common technique for grounding language model outputs in domain-specific information. However, RAG is often challenged by reasoning-intensive question-answering (QA), since common retrieval methods like cosine similarity maximize relevance at the cost of introducing redundant content, which can reduce information recall. To address this, we introduce Diversity-Focused Retrieval-Augmented Generation (DF-RAG), which systematically incorporates diversity into the retrieval step to improve performance on complex, reasoning-intensive QA benchmarks. DF-RAG builds upon the Maximal Marginal Relevance framework to select information chunks that are both relevant to the query and maximally dissimilar from each other. A key innovation of DF-RAG is its ability to optimize the level of diversity for each query dynamically at test time without requiring any additional fine-tuning or prior information. We show that DF-RAG improves F1 performance on reasoning-intensive QA benchmarks by 4-10 percent over vanilla RAG using cosine similarity and also outperforms other established baselines. Furthermore, we estimate an Oracle ceiling of up to 18 percent absolute F1 gains over vanilla RAG, of which DF-RAG captures up to 91.3 percent.
- Abstract(参考訳): Retrieval-augmented Generation (RAG) は、言語モデル出力をドメイン固有情報でグラウンド化する一般的な手法である。
しかし、コサイン類似性のような一般的な検索手法は冗長なコンテンツの導入コストにおいて妥当性を最大化し、情報リコールを減らすことができるため、RAGは推論集約型質問応答(QA)によってしばしば挑戦される。
そこで本研究では,複雑な推論集約型QAベンチマークの性能向上のために,多様性を検索ステップに体系的に組み込んだ分散検索生成(DF-RAG)を提案する。
DF-RAG は Maximal Marginal Relevance フレームワーク上に構築されており、クエリに関連する情報チャンクを選択できる。
DF-RAGの重要な革新は、追加の微調整や事前情報を必要とせずに、テスト時に各クエリの多様性レベルを動的に最適化する能力である。
DF-RAGは,コサイン類似度を用いて,バニラRAGよりも4~10パーセント向上し,他の確立されたベースラインよりも優れていた。
さらに、Oracleの天井がバニラRAGよりも最大18%、DF-RAGが最大91.3%と見積もっている。
関連論文リスト
- Accelerating Adaptive Retrieval Augmented Generation via Instruction-Driven Representation Reduction of Retrieval Overlaps [16.84310001807895]
本稿では,A-RAG法に適用可能なモデルに依存しないアプローチを提案する。
具体的には、キャッシュアクセスと並列生成を使用して、それぞれプリフィルとデコードステージを高速化する。
論文 参考訳(メタデータ) (2025-05-19T05:39:38Z) - DO-RAG: A Domain-Specific QA Framework Using Knowledge Graph-Enhanced Retrieval-Augmented Generation [4.113142669523488]
ドメイン固有のQAシステムは、生成頻度を必要とするが、構造化専門家の知識に基づく高い事実精度を必要とする。
本稿では,マルチレベル知識グラフ構築と意味ベクトル検索を統合した,スケーラブルでカスタマイズ可能なハイブリッドQAフレームワークであるDO-RAGを提案する。
論文 参考訳(メタデータ) (2025-05-17T06:40:17Z) - UniversalRAG: Retrieval-Augmented Generation over Corpora of Diverse Modalities and Granularities [53.76854299076118]
UniversalRAGは異種情報源からの知識を多様さと粒度で検索・統合するための新しいRAGフレームワークである。
本稿では,最も適切なモダリティ固有コーパスを動的に識別し,その内部でターゲット検索を行うモダリティ対応ルーティング機構を提案する。
マルチモーダル性にまたがる8つのベンチマークでUniversalRAGを検証する。
論文 参考訳(メタデータ) (2025-04-29T13:18:58Z) - Vendi-RAG: Adaptively Trading-Off Diversity And Quality Significantly Improves Retrieval Augmented Generation With LLMs [2.992602379681373]
Vendi-RAGは、検索の多様性と回答の品質を共同で最適化する反復的なプロセスに基づくフレームワークである。
Veddi-RAGは、フレキシブルな類似性に基づく多様性指標であるVendi Score(VS)を活用して、文書検索における意味的多様性を促進する。
Veddi-RAGは従来のシングルステップとマルチステップのRAGアプローチよりも大幅に精度が向上している。
論文 参考訳(メタデータ) (2025-02-16T18:46:10Z) - SiReRAG: Indexing Similar and Related Information for Multihop Reasoning [96.60045548116584]
SiReRAGは、類似情報と関連する情報の両方を明示的に考慮する新しいRAGインデックス方式である。
SiReRAGは、3つのマルチホップデータセットの最先端インデックス手法を一貫して上回る。
論文 参考訳(メタデータ) (2024-12-09T04:56:43Z) - CRUD-RAG: A Comprehensive Chinese Benchmark for Retrieval-Augmented Generation of Large Language Models [49.16989035566899]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の能力を高める技術である。
本稿では,大規模かつ包括的なベンチマークを構築し,様々なRAGアプリケーションシナリオにおけるRAGシステムのすべてのコンポーネントを評価する。
論文 参考訳(メタデータ) (2024-01-30T14:25:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。