論文の概要: Tail-Aware Adaptive-k: Query-Adaptive Context Selection for Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2606.11907v1
- Date: Wed, 10 Jun 2026 10:37:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 14:25:15.363634
- Title: Tail-Aware Adaptive-k: Query-Adaptive Context Selection for Retrieval-Augmented Generation
- Title(参考訳): Tail-Aware Adaptive-k:Retrieval-Augmented Generationのためのクエリ適応コンテキスト選択
- Authors: Ziyu Song, Jiaming Fang, Kuangyu Li, Tuo Xia, Chuanpeng Wang,
- Abstract要約: 極値理論(EVT)を局所的検証戦略により運用するトレーニングフリーフレームワークであるTail-Aware Adaptive-k(TAA-k)を提案する。
軽度モノトン確率比の仮定の下では、TAA-kは最初期のノイズ支配位置に対応する安定なクエリ適応カットオフが得られる。
WebQuestions、2WikiMultiHopQA、MuSiQueの実験では、TAA-kが2-3%のオラクルの2-3%の範囲で、大域的なEVT法よりも高い精度で、ニアオラクルに近い検索品質(F1)を達成することを示した。
- 参考スコア(独自算出の注目度): 0.9786690381850356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adaptive context selection is critical for retrieval-augmented generation (RAG) systems, as fixed Top-K retrieval fails under query-dependent and heavy-tailed similarity distributions. While Extreme Value Theory (EVT) offers a principled framework for adaptive truncation, existing approaches apply EVT globally across the entire ranked list, incurring prohibitive computational costs and statistical instability. We propose Tail-Aware Adaptive-k(TAA-k), a training-free framework that operationalizes EVT through a localized validation strategy. The key insight is that ranked similarity curves exhibit a characteristic steep--flat--steep pattern reflecting a transition from relevance-dominated to noise-dominated regimes. TAA-k exploits this geometric structure via knee detection to identify a compact candidate region, then applies EVT-based goodness-of-fit testing within this window to validate the onset of tail behavior. This coarse-to-fine design reduces computational complexity from O(N^2M) to O(sqrt{N\log N}*M) while maintaining statistical rigor. Under mild monotone likelihood ratio assumptions, TAA-k yields a stable, query-adaptive cutoff corresponding to the earliest noise-dominated position. Experiments on WebQuestions, 2WikiMultiHopQA, and MuSiQue demonstrate that TAA-k achieves near-oracle retrieval quality (F1 within 2-3% of oracle) with orders-of-magnitude efficiency gains over global EVT methods, while maintaining robustness across embedding models and compression dimensions.
- Abstract(参考訳): 適応的コンテキスト選択は、クエリ依存および重み付き類似度分布の下でTop-K検索が失敗するため、検索拡張生成(RAG)システムにとって重要である。
エクストリームバリュー理論(EVT)は適応的トランケーションの原則的な枠組みを提供するが、既存の手法はEVTを世界規模で適用し、計算コストの禁止と統計的不安定性をもたらす。
本稿では,EVT を局所的検証戦略により運用するトレーニングフリーフレームワーク Tail-Aware Adaptive-k (TAA-k) を提案する。
重要な洞察は、ランク付けされた類似度曲線は、関係が支配される状態からノイズが支配される状態への遷移を反映する特徴的な急勾配のステップパターンを示すことである。
TAA-kはこの幾何学的構造を利用して膝検出を行い、コンパクトな候補領域を特定し、そのウィンドウ内にEVTベースの適合性テストを適用して尾の挙動の開始を検証する。
この粗い設計は、統計的厳密さを維持しながら計算複雑性をO(N^2M)からO(sqrt{N\log N}*M)に還元する。
軽度モノトン確率比の仮定の下では、TAA-kは最初期のノイズ支配位置に対応する安定なクエリ適応カットオフが得られる。
WebQuestions, 2WikiMultiHopQA, MuSiQue の実験では,TAA-k が地球規模のEVT法よりも精度が高く,組込みモデルと圧縮次元をまたいだ堅牢性を維持しつつ,ほぼオーラルに近い検索品質 (F1 はオラクルの 2-3% の範囲内) を達成することを示した。
関連論文リスト
- Efficient Conditioning Why Pseudo Observation Batch Bayesian Optimization Works When It Does not [0.0]
Constant Liar (CL)、Kriging Believer (KB)、およびファンタジーモデルは並列ベイズ最適化におけるバッチ選択に広く使われている。
データを拡張した場合に,効率的な条件付けをキーサロゲート特性として,クローズドフォームで予測を更新する機能として同定する。
CL, KB, および空想モデルを, 偽値分布のみが異なる単一の条件付け機構のインスタンスとして統一する。
論文 参考訳(メタデータ) (2026-05-12T13:14:24Z) - FACTOR: Counterfactual Training-Free Test-Time Adaptation for Open-Vocabulary Object Detection [63.91351553178842]
FACTORはオープン語彙オブジェクト検出のためのトレーニング不要なテスト時間適応である。
属性依存性の予測を選択的に抑制するために、属性の感度、意味的関連性、予測のバリエーションを定量化する。
PASCAL-C, COCO-C, FoggyCityscapes の実験では、FACTOR が従来の TTA 法より一貫して優れていたことが示されている。
論文 参考訳(メタデータ) (2026-05-05T02:31:18Z) - Variational Rectification Inference for Learning with Noisy Labels [74.85528327499662]
損失関数の適応的補正を定式化するために, 変分補正推論(VRI)を提案する。
VRIは、補正ベクトルを潜在変数として扱うことによって階層ベイズとして構成される。
VRIで変分項を導入することにより、条件付き後部を正確に推定し、ディラックデルタ関数への崩壊を避ける。
論文 参考訳(メタデータ) (2026-03-18T01:25:08Z) - ReHARK: Refined Hybrid Adaptive RBF Kernels for Robust One-Shot Vision-Language Adaptation [3.8707695363745214]
ReHARKは、グローバルな近位正規化を通じて、少数ショット適応を再解釈する、トレーニング不要のフレームワークである。
ワンショット適応のための新しい最先端技術がReHARKによって確立され、平均精度は65.83%である。
論文 参考訳(メタデータ) (2026-03-12T04:59:09Z) - Robust Canonicalization through Bootstrapped Data Re-Alignment [5.437226012505534]
昆虫や鳥の識別などのきめ細かい視覚分類タスクは、微妙な視覚的手がかりに対する感受性を必要とする。
分散を低減してトレーニングサンプルを反復的に調整するブートストラップアルゴリズムを提案する。
本手法は,拡張と同等の性能を保ちながら,同変および正準化ベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2025-10-09T13:05:20Z) - Self-Boost via Optimal Retraining: An Analysis via Approximate Message Passing [58.52119063742121]
独自の予測と潜在的にノイズの多いラベルを使ってモデルをトレーニングすることは、モデルパフォーマンスを改善するためのよく知られた戦略である。
本稿では,モデルの予測と提供ラベルを最適に組み合わせる方法について論じる。
我々の主な貢献は、現在のモデルの予測と与えられたラベルを組み合わせたベイズ最適集約関数の導出である。
論文 参考訳(メタデータ) (2025-05-21T07:16:44Z) - pEBR: A Probabilistic Approach to Embedding Based Retrieval [9.186585413958769]
埋め込みベースの検索は、クエリとアイテムの両方の共有セマンティック表現空間を学習することを目的としている。
我々は,textbfprobabilistic textbfEmbedding-textbfBased textbfRetrieval (textbfpEBR) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-25T07:14:12Z) - ROTI-GCV: Generalized Cross-Validation for right-ROTationally Invariant Data [5.830619388189558]
高次元正規化回帰における2つの重要なタスクは、正確な予測のために正規化強度を調整し、サンプル外リスクを推定することである。
問題のある条件下でクロスバリデーションを確実に行うための新しいフレームワーク ROTI-GCV を導入する。
論文 参考訳(メタデータ) (2024-06-17T15:50:00Z) - Generalized Face Forgery Detection via Adaptive Learning for Pre-trained Vision Transformer [54.32283739486781]
適応学習パラダイムの下で,textbfForgery-aware textbfAdaptive textbfVision textbfTransformer(FA-ViT)を提案する。
FA-ViTは、クロスデータセット評価において、Celeb-DFおよびDFDCデータセット上で93.83%と78.32%のAUCスコアを達成する。
論文 参考訳(メタデータ) (2023-09-20T06:51:11Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Fine-grained Retrieval Prompt Tuning [149.9071858259279]
微粒な検索プロンプトチューニングは, サンプルプロンプトと特徴適応の観点から, きめの細かい検索タスクを実行するために, 凍結した事前学習モデルを操る。
学習可能なパラメータが少ないFRPTは、広く使われている3つの細粒度データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-07-29T04:10:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。