論文の概要: Rethinking the Necessity of Adaptive Retrieval-Augmented Generation through the Lens of Adaptive Listwise Ranking
- arxiv url: http://arxiv.org/abs/2604.15621v1
- Date: Fri, 17 Apr 2026 02:00:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.702746
- Title: Rethinking the Necessity of Adaptive Retrieval-Augmented Generation through the Lens of Adaptive Listwise Ranking
- Title(参考訳): 適応的リストワイドランキングのレンズによる適応的検索拡張生成の必要性の再考
- Authors: Jun Feng, Jiahui Tang, Zhicheng He, Hang Lv, Hongchao Gu, Hao Wang, Xuezhi Yang, Shuai Fang,
- Abstract要約: 大きな言語モデルがノイズに対する堅牢性を高めて進化するにつれて、適応的な検索保証の必要性が再評価される。
本稿では,新しい適応検索フレームワークであるAdaRankLLMを提案する。
AdaRankLLMは、コンテキストオーバーヘッドを大幅に削減したほとんどのシナリオにおいて、常に最適なパフォーマンスを実現していることを示す。
- 参考スコア(独自算出の注目度): 8.616986564824684
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adaptive Retrieval-Augmented Generation aims to mitigate the interference of extraneous noise by dynamically determining the necessity of retrieving supplementary passages. However, as Large Language Models evolve with increasing robustness to noise, the necessity of adaptive retrieval warrants re-evaluation. In this paper, we rethink this necessity and propose AdaRankLLM, a novel adaptive retrieval framework. To effectively verify the necessity of adaptive listwise reranking, we first develop an adaptive ranker employing a zero-shot prompt with a passage dropout mechanism, and compare its generation outcomes against static fixed-depth retrieval strategies. Furthermore, to endow smaller open-source LLMs with this precise listwise ranking and adaptive filtering capability, we introduce a two-stage progressive distillation paradigm enhanced by data sampling and augmentation techniques. Extensive experiments across three datasets and eight LLMs demonstrate that AdaRankLLM consistently achieves optimal performance in most scenarios with significantly reduced context overhead. Crucially, our analysis reveals a role shift in adaptive retrieval: it functions as a critical noise filter for weaker models to overcome their limitations, while serving as a cost-effective efficiency optimizer for stronger reasoning models.
- Abstract(参考訳): Adaptive Retrieval-Augmented Generation は補助通路を回収する必要性を動的に決定することによって外音の干渉を軽減することを目的としている。
しかし、雑音に対するロバスト性を高めて大規模言語モデルが進化するにつれて、適応的な検索保証の必要性が再評価される。
本稿では、この必要性を再考し、新しい適応検索フレームワークであるAdaRankLLMを提案する。
そこで我々はまず,ゼロショットプロンプトとパスドロップアウト機構を用いた適応的なランク付け手法を開発し,その生成結果を静的な固定深度検索戦略と比較する。
さらに,この精度の高いランク付けと適応フィルタリング機能を備えた小型のオープンソースLCMを実現するために,データサンプリングと拡張技術によって強化された2段階のプログレッシブ蒸留パラダイムを導入する。
3つのデータセットと8つのLCMにわたる大規模な実験は、AdaRankLLMがコンテキストオーバーヘッドを大幅に削減したほとんどのシナリオで、一貫して最適なパフォーマンスを実現していることを示している。
より弱いモデルに限界を克服するための臨界ノイズフィルタとして機能し、より強力な推論モデルのためのコスト効率最適化器として機能する。
関連論文リスト
- Synapse: Evolving Job-Person Fit with Explainable Two-phase Retrieval and LLM-guided Genetic Resume Optimization [0.0]
高精度なセマンティックリグレードからハイリコール候補生成を分離するセマンティックリクルードシステムであるSynapseを提案する。
透明性を向上させるために、Synapseには、明確なエビデンスにレコメンデーションを根拠とした検索強化された説明層が組み込まれている。
また、ブラックボックス最適化問題として再試行を取り扱う新しい進化的再試行最適化フレームワークも導入する。
論文 参考訳(メタデータ) (2026-04-02T21:44:23Z) - Optimizing RAG Rerankers with LLM Feedback via Reinforcement Learning [47.963236269307735]
リランカはRetrieval-Augmented Generationの検索結果の精錬において重要な役割を果たす。
現在のリグレードモデルは通常、ダウンストリーム生成プロセスから切り離された静的な人間アノテートされた関連ラベルに独立して最適化される。
本稿では,LLMの生成品質と直接整合する強化学習フレームワークであるReRanking Preference Optimization(RRPO)を紹介する。
論文 参考訳(メタデータ) (2026-04-02T14:19:47Z) - DioR: Adaptive Cognitive Detection and Contextual Retrieval Optimization for Dynamic Retrieval-Augmented Generation [8.763986795098216]
Dynamic Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)における幻覚の緩和に成功している。
本稿では,適応的認識検出と文脈的検索最適化という2つの主要コンポーネントからなる,革新的な動的RAG手法であるDioRを提案する。
論文 参考訳(メタデータ) (2025-04-14T13:02:53Z) - Lightweight and Direct Document Relevance Optimization for Generative Information Retrieval [49.669503570350166]
生成情報検索(GenIR)は、文書識別子(ドシデント)生成タスクとして文書検索を定式化する有望なニューラル検索パラダイムである。
既存のGenIRモデルはトークンレベルのミスアライメントに悩まされており、次のトークンを予測するためにトレーニングされたモデルは、ドキュメントレベルの関連性を効果的にキャプチャできないことが多い。
本稿では,トークンレベルのドシデント生成と文書レベルのドシデンス推定をペアのランク付けによる直接最適化により整合するダイレクトドキュメントレバレンス最適化(DDRO)を提案する。
論文 参考訳(メタデータ) (2025-04-07T15:27:37Z) - Fast or Better? Balancing Accuracy and Cost in Retrieval-Augmented Generation with Flexible User Control [52.405085773954596]
Retrieval-Augmented Generationは、大規模な言語モデル幻覚を緩和するための強力なアプローチとして登場した。
既存のRAGフレームワークは、しばしば無差別に検索を適用し、非効率な再検索につながる。
本稿では,精度・コストのトレードオフを動的に調整できる新しいユーザ制御可能なRAGフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:56:20Z) - ROPO: Robust Preference Optimization for Large Language Models [59.10763211091664]
外部モデルの助けを借りずにノイズ耐性とノイズサンプルのフィルタリングを統合する反復アライメント手法を提案する。
Mistral-7BとLlama-2-7Bで広く使われている3つのデータセットの実験では、ROPOが既存の嗜好アライメント法を大幅に上回っていることが示されている。
論文 参考訳(メタデータ) (2024-04-05T13:58:51Z) - Fine-grained Retrieval Prompt Tuning [149.9071858259279]
微粒な検索プロンプトチューニングは, サンプルプロンプトと特徴適応の観点から, きめの細かい検索タスクを実行するために, 凍結した事前学習モデルを操る。
学習可能なパラメータが少ないFRPTは、広く使われている3つの細粒度データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-07-29T04:10:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。