論文の概要: AdaGReS:Adaptive Greedy Context Selection via Redundancy-Aware Scoring for Token-Budgeted RAG
- arxiv url: http://arxiv.org/abs/2512.25052v1
- Date: Wed, 31 Dec 2025 18:48:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.744143
- Title: AdaGReS:Adaptive Greedy Context Selection via Redundancy-Aware Scoring for Token-Budgeted RAG
- Title(参考訳): AdaGReS:Token-Budgeted RAGにおける冗長認識による適応的グレディコンテキスト選択
- Authors: Chao Peng, Bin Wang, Zhilei Long, Jinfang Sheng,
- Abstract要約: 本稿ではトークン予算RAGのための冗長性を考慮したコンテキスト選択フレームワークであるAdaGReSを紹介する。
AdaGReSは、目的から派生した限界ゲインを用いてトークン予算制約の下で欲求選択を行う。
オープンドメイン質問応答(Natural Questions)と高冗長バイオメディカル(ドラッグ)コーパスの実験は、冗長性制御とコンテキスト品質の一貫性を実証している。
- 参考スコア(独自算出の注目度): 4.69377227249912
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-augmented generation (RAG) is highly sensitive to the quality of selected context, yet standard top-k retrieval often returns redundant or near-duplicate chunks that waste token budget and degrade downstream generation. We present AdaGReS, a redundancy-aware context selection framework for token-budgeted RAG that optimizes a set-level objective combining query-chunk relevance and intra-set redundancy penalties. AdaGReS performs greedy selection under a token-budget constraint using marginal gains derived from the objective, and introduces a closed-form, instance-adaptive calibration of the relevance-redundancy trade-off parameter to eliminate manual tuning and adapt to candidate-pool statistics and budget limits. We further provide a theoretical analysis showing that the proposed objective exhibits epsilon-approximate submodularity under practical embedding similarity conditions, yielding near-optimality guarantees for greedy selection. Experiments on open-domain question answering (Natural Questions) and a high-redundancy biomedical (drug) corpus demonstrate consistent improvements in redundancy control and context quality, translating to better end-to-end answer quality and robustness across settings.
- Abstract(参考訳): Retrieval-augmented Generation (RAG) は、選択されたコンテキストの品質に非常に敏感であるが、標準的なトップk検索は、トークンの予算を浪費し、下流生成を劣化させる冗長またはほぼ重複したチャンクを返すことが多い。
本稿では,トークン予算RAGの冗長性を考慮したコンテキスト選択フレームワークであるAdaGReSについて述べる。
AdaGReSは、目標から派生した限界ゲインを用いてトークン予算制約の下でグリーディ選択を行い、手動チューニングを排除し、候補プール統計や予算制限に適応するために、関連冗長トレードオフパラメータのクローズドフォーム、インスタンス適応キャリブレーションを導入する。
さらに,提案手法は, 実際の埋め込み類似性条件下では, エプシロン-近似部分モジュラリティを示し, グリード選択に対してほぼ最適であることを示す理論解析を行った。
オープンドメイン質問応答(Natural Questions)と高冗長バイオメディカル(ドラッグ)コーパスの実験では、冗長性制御とコンテキスト品質が一貫して改善され、エンドツーエンドの回答品質と設定間の堅牢性が向上した。
関連論文リスト
- Improving Few-Shot Change Detection Visual Question Answering via Decision-Ambiguity-guided Reinforcement Fine-Tuning [32.249022698727856]
変化検出視覚質問応答 (CDVQA) は、両時間的リモートセンシング画像における意味的変化を推論することで、テキストクエリに応答する必要がある。
直感的なアプローチは、教師付き微調整(SFT)によって一般的な視覚言語モデルでCDVQAのパフォーマンスを向上させることである。
我々は、まず、SFT訓練された参照ポリシーを用いてDASをマイニングし、次いで、マイニングされたサブセットにグループ相対的なポリシー最適化を適用するDARFT(DarFT-Ambiguity-guided Reinforcement Fine-Tuning)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-31T03:28:17Z) - Additive Distributionally Robust Ranking and Selection [0.8283940114367679]
そこで本研究では,$k + m - 1$の事前仮説クリティカルシナリオのみをサンプリングすることを目的とした,単純な加算割当(AA)手順を提案する。
AAが一貫したものであり、驚くべきことに、最も強い意味で付加性を達成することを証明します。
結果は、DRR&Sの加法構造に対する新しい、そして反直観的な洞察を与える。
論文 参考訳(メタデータ) (2025-09-07T17:36:29Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - Supervised Optimism Correction: Be Confident When LLMs Are Sure [91.7459076316849]
教師付き微調整とオフライン強化学習の間には,新たな理論的関係が確立されている。
広く使われているビームサーチ法は、許容できない過度な最適化に悩まされていることを示す。
本稿では,トークンレベル$Q$-value推定のための簡易かつ効果的な補助的損失を導入したSupervised Optimism Correctionを提案する。
論文 参考訳(メタデータ) (2025-04-10T07:50:03Z) - Self-Routing RAG: Binding Selective Retrieval with Knowledge Verbalization [95.85537087475882]
既存のアプローチは、大規模言語モデル(LLM)の固有の知識を過小評価している。
本稿では,選択検索と知識の言語化を結びつける新しいフレームワークであるSelf-Routing RAGを提案する。
SR-RAGは検索回数を29%削減し、性能は5.1%向上した。
論文 参考訳(メタデータ) (2025-04-01T17:59:30Z) - New Additive OCBA Procedures for Robust Ranking and Selection [0.9558392439655016]
我々は,限られたサンプリング予算下での不正選択の可能性を最小限に抑えるため,新しい固定予算頑健なR&S手法を開発した。
そこで我々は,従来のOCBA法よりも頑健なOCBA法の優越性を検証するため,総合的な数値的研究を行った。
論文 参考訳(メタデータ) (2024-12-08T18:42:07Z) - SMART-RAG: Selection using Determinantal Matrices for Augmented Retrieval [40.17823569905232]
Retrieval-Augmented Generation (RAG) は、大規模言語モデル(LLM)を大幅に改善し、正確で文脈に根ざした応答を生成する。
RAGアプローチは、クエリコンテキストの関連性のみに基づくトップランクのドキュメントを優先し、冗長性と矛盾する情報をしばしば導入する。
本稿では,RAGにおける文脈選択の最適化を目的とした,教師なしおよびトレーニング不要なフレームワークであるRAG(Mathrices for Augmented Retrieval)によるタスク応答のための選択を提案する。
論文 参考訳(メタデータ) (2024-09-21T03:03:09Z) - Self-Evaluation Guided Beam Search for Reasoning [61.523627290397556]
我々は,Large Language Model (LLM) の推論プロセスのガイドと校正を行うための段階的自己評価機構を導入する。
本稿では,ビームサーチによる自己評価ガイダンスを統合した復号アルゴリズムを提案する。
我々のアプローチは、GSM8K、AQuA、StrategyQAにおいて、対応するCodexバックボンドベースラインをわずかに精度6.34%、9.56%、および5.46%で上回る。
論文 参考訳(メタデータ) (2023-05-01T02:37:59Z) - Best Arm Identification for Stochastic Rising Bandits [84.55453174601826]
SRB(Rising Bandits)は、選択される度に選択肢の期待される報酬が増加する、シーケンシャルな意思決定の問題をモデル化する。
本稿では,SRBの固定予算ベストアーム識別(BAI)問題に焦点をあてる。
R-UCBE と R-SR の2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-15T08:01:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。