論文の概要: Scaling DPPs for RAG: Density Meets Diversity
- arxiv url: http://arxiv.org/abs/2604.03240v1
- Date: Wed, 04 Feb 2026 07:37:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.346924
- Title: Scaling DPPs for RAG: Density Meets Diversity
- Title(参考訳): RAGのためのスケーリング DPP:密度は多様性と出会う
- Authors: Xun Sun, Baiheng Xie, Li Huang, Qiang Gao,
- Abstract要約: Retrieval-Augmented Generation (RAG) は、外部知識を基盤として、Large Language Models (LLM) を強化する。
標準的なRAGパイプラインは、関連ランキングを使用してコンテキストを構築し、ユーザクエリと各コーパスチャンク間のポイントワイズスコアを実行する。
本稿では,DPP(Determinantal Point Processes)を軽量P-Adapterを通じて組み込んだRAGの多様性を考慮した検索機構であるScalDPPを提案する。
- 参考スコア(独自算出の注目度): 10.57930385564285
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-Augmented Generation (RAG) enhances Large Language Models (LLMs) by grounding generation in external knowledge, yielding relevance responses that are aligned with factual evidence and evolving corpora. Standard RAG pipelines construct context through relevance ranking, performing point-wise scoring between the user query and each corpora chunk. This formulation, however, ignores interactions among retrieved candidates, leading to redundant contexts that dilute density and fail to surface complementary evidence. We argue that effective retrieval should optimize jointly for both density and diversity, ensuring the grounding evidence that is dense in information yet diverse in coverage. In this study, we propose ScalDPP, a diversity-aware retrieval mechanism for RAG that incorporates Determinantal Point Processes (DPPs) through a lightweight P-Adapter, enabling scalable modeling of inter-chunk dependencies and complementary context selection. In addition, we develop a novel set-level objective, Diverse Margin Loss (DML), that enforces ground-truth complementary evidence chains to dominate any equally sized redundant alternatives under DPP geometry. Experimental results demonstrate the superiority of ScalDPP, substantiating our core statement in practice.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) は、外部知識の生成を基盤として、事実証拠に整合した関連応答と進化コーパスを生成することで、Large Language Models (LLMs) を強化する。
標準的なRAGパイプラインは、関連ランキングを使用してコンテキストを構築し、ユーザクエリと各コーパスチャンク間のポイントワイズスコアを実行する。
しかし、この定式化は、抽出された候補間の相互作用を無視し、密度を減らし、補完的な証拠を提示できない冗長な文脈に繋がる。
我々は、効果的な検索は、密度と多様性の両面で共同で最適化されるべきであり、網羅的には多様だが情報に密接な証拠を確実にするべきであると論じている。
本研究では,軽量P-Adapterを用いて決定点プロセス(DPP)を組み込んだRAGの多様性を意識した検索機構であるScalDPPを提案し,チャンク間の依存関係のスケーラブルなモデリングと相補的コンテキスト選択を実現する。
さらに, DPP幾何の下では, 等サイズの冗長な代替品を支配下に置くために, 地中相補的エビデンスチェーンを強制する, 新たなセットレベル目標であるDiverse Margin Loss (DML) を開発した。
ScalDPPの優位性を実証し,本研究のコアステートメントを実証した。
関連論文リスト
- AffectAgent: Collaborative Multi-Agent Reasoning for Retrieval-Augmented Multimodal Emotion Recognition [62.16431420189863]
LLMに基づくマルチモーダル感情認識は静的なパラメトリックメモリに依存しており、ニュアンス化された感情状態の解釈時にしばしば幻覚を与える。
本稿では,感情指向型マルチエージェント検索拡張生成フレームワークであるAffectAgentを紹介する。
AffectAgentは3つの共同最適化されたエージェント、すなわちクエリプランナー、エビデンスフィルタ、感情生成器から構成される。
論文 参考訳(メタデータ) (2026-04-14T13:49:19Z) - Search-R2: Enhancing Search-Integrated Reasoning via Actor-Refiner Collaboration [49.9937230730202]
本稿では,新たなアクター・リファイナ・コラボレーション・フレームワークであるSearch-R2を提案する。
提案手法は,生成過程をアクターに分解し,最初の推論軌道を生成する。
本稿では,検索-R2がモデルスケール全体にわたって強力なRAGとRLベースのベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2026-02-03T15:32:09Z) - DIVERGE: Diversity-Enhanced RAG for Open-Ended Information Seeking [10.970797088560323]
本稿では,新しいリフレクション誘導生成とメモリ拡張反復改善機能を備えたプラグアンドプレイエージェントRAGフレームワークを提案する。
我々は,DIVERGEが競争基準よりも優れた多様性と品質のトレードオフを達成できることを実証した。
論文 参考訳(メタデータ) (2026-01-30T19:03:11Z) - Grounding Long-Context Reasoning with Contextual Normalization for Retrieval-Augmented Generation [57.97548022208733]
キー値抽出における表面的選択が精度と安定性のシフトを引き起こすことを示す。
生成前の文脈表現を適応的に標準化する戦略であるコンテキスト正規化を導入する。
論文 参考訳(メタデータ) (2025-10-15T06:28:25Z) - Domain-Specific Data Generation Framework for RAG Adaptation [58.20906914537952]
Retrieval-Augmented Generation (RAG)は、大規模言語モデルの言語理解と推論能力と外部検索を組み合わせ、ドメイン基底応答を可能にする。
本稿では,様々なRAG適応手法に合わせて,ドメイン基底型質問応答コンテキスト(QAC)トリプルを生成するフレームワークであるRAGenを提案する。
論文 参考訳(メタデータ) (2025-10-13T09:59:49Z) - Improving Consistency in Retrieval-Augmented Systems with Group Similarity Rewards [14.535325886547112]
RAGシステムは、ユーザがセマンティックに等価なクエリ間で出力が一貫性があることを期待する、ハイテイクなドメインにますますデプロイされている。
既存のシステムは、レトリバーとジェネレータの両方のばらつきにより、しばしば重大な矛盾を示す。
本稿では,RAGの一貫性をレトリバーレベル,ジェネレータレベル,エンド・ツー・エンドのコンポーネントに分解する基本的評価フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-05T23:14:13Z) - SIRAG: Towards Stable and Interpretable RAG with A Process-Supervised Multi-Agent Framework [7.37561751991963]
本稿では,レシーバとジェネレータのギャップを埋めるプロセス管理型マルチエージェントフレームワークを提案する。
提案するフレームワークはモジュール式でプラグアンドプレイで、レトリバーやジェネレータを変更する必要はない。
論文 参考訳(メタデータ) (2025-09-17T09:09:28Z) - Pseudo Relevance Feedback is Enough to Close the Gap Between Small and Large Dense Retrieval Models [29.934928091542375]
大規模言語モデル (LLM) のバックボーンに高密度レトリバーを拡張させることは, 検索効率を向上させる主要な戦略である。
本稿では,機能ベースの擬似関連フィードバック(PRF)フレームワークであるPromptPRFを紹介する。
論文 参考訳(メタデータ) (2025-03-19T04:30:20Z) - Pistis-RAG: Enhancing Retrieval-Augmented Generation with Human Feedback [41.88662700261036]
RAGシステムは、セマンティックな関連性だけでは生成品質の向上を保証していない場合に制限に直面している。
我々は、LLMと人間の嗜好をよりよく整合させるために、コンテンツ中心のアプローチで設計された新しいRAGフレームワークであるPristis-RAGを提案する。
論文 参考訳(メタデータ) (2024-06-21T08:52:11Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。