論文の概要: When More Reformulations Hurt: Avoiding Drift using Ranker Feedback
- arxiv url: http://arxiv.org/abs/2605.00560v1
- Date: Fri, 01 May 2026 10:58:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.930793
- Title: When More Reformulations Hurt: Avoiding Drift using Ranker Feedback
- Title(参考訳): 改革がさらに進むとき - ランサーフィードバックによるドリフト回避
- Authors: V Venktesh, Mandeep Rathee, Avishek Anand,
- Abstract要約: ReformIRは、クエリのリフォームを第一級の機能として扱う、予算対応の検索フレームワークである。
修正予算の下では、代議員は改革と文書の両方を適応的に優先順位付けする。
以上の結果から,リフォームIRは既存の改革戦略を一貫して上回っていることが示唆された。
- 参考スコア(独自算出の注目度): 8.428618801719198
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern retrieval pipelines increasingly rely on query reformulation and neural reranking to improve effectiveness, but this comes at a significant computational cost and introduces a fundamental tradeoff between recall and query drift. Generating many reformulated queries can substantially increase recall, yet naively merging or exhaustively reranking their results is prohibitively expensive. In this work, we argue that the core challenge is not reformulation generation itself, but the adaptive selection of reformulations and their retrieved documents under a strict inference budget. We propose ReformIR, a budget-aware retrieval framework that treats query reformulations as first-class features and performs online relevance estimation using a strong reranker as a teacher. Given multiple reformulated queries, ReformIR constructs a large candidate pool and learns a lightweight surrogate model that estimates document utility from reformulation-specific retrieval signals. Under a fixed reranking budget, the surrogate adaptively prioritizes both reformulations and documents, selectively querying a teacher reranker anchored to the original query. This process increases recall while actively suppressing drift through online feature selection over reformulations. We conduct extensive experiments on the MSMARCO passage corpora and TREC Deep Learning benchmarks (DL19-DL22). Our results show that ReformIR consistently outperforms existing reformulation strategies, particularly as the number of reformulations increases, where prior methods suffer from severe quality degradation due to drift. Our findings also suggest a shift in retrieval system design, rather than using large language models as rerankers, their capacity is more effectively leveraged in the reformulation stage with feedback-driven optimization.
- Abstract(参考訳): 現代の検索パイプラインは、クエリのリフォームとニューラルリグレードにますます依存しているが、これは計算コストが大幅に高く、リコールとクエリドリフトの根本的なトレードオフをもたらす。
多くのリフレッシュされたクエリの生成はリコールを大幅に増加させるが、結果の合併や徹底的な再配置は違法に高価である。
本研究は, 改革生成そのものではなく, 厳格な推論予算の下で, 改定と回収された文書の適応的選択について論じるものである。
本稿では,教師として強力なリランカを用いて,クエリ再構成を第一級の機能として扱い,オンライン関連性評価を行う,予算に配慮した検索フレームワークであるReformIRを提案する。
複数のリフォームされたクエリが与えられた場合、ReformIRは大きな候補プールを構築し、リフォーム固有の検索信号からドキュメントの有用性を推定する軽量なサロゲートモデルを学ぶ。
修正予算の下では、サロゲートは修正と文書の両方を適応的に優先順位付けし、元のクエリに固定された教師のリランカを選択的にクエリする。
このプロセスはリコールを増大させ、オンライン機能選択を通じてリコールを積極的に抑制する。
MSMARCOパスコーパスコーパスとTRECディープラーニングベンチマーク(DL19-DL22)について広範な実験を行った。
以上の結果から,従来手法がドリフトによる品質劣化に悩まされていた改革の件数の増加に伴い,既存の改革戦略を一貫して上回っていることが示唆された。
また,リランカとして大規模言語モデルを使用するよりも,フィードバック駆動型最適化による改良段階において,検索システム設計の転換が効果的であることも示唆した。
関連論文リスト
- A Reproducibility Study of LLM-Based Query Reformulation [21.129945396073264]
大規模言語モデル(LLM)は、情報検索におけるクエリの再構成と拡張に広く用いられている。
統一的かつ厳密に制御された実験枠組みの下で, LLMに基づく10種類のクエリ再構成手法の体系的, 比較検討を行った。
以上の結果から,レキシカル検索による改善はニューラルレトリバーに連続的に移行するものではなく,より大きなLLMが下流性能を均一に向上させるものではないことが示唆された。
論文 参考訳(メタデータ) (2026-04-30T04:51:52Z) - Optimizing RAG Rerankers with LLM Feedback via Reinforcement Learning [47.963236269307735]
リランカはRetrieval-Augmented Generationの検索結果の精錬において重要な役割を果たす。
現在のリグレードモデルは通常、ダウンストリーム生成プロセスから切り離された静的な人間アノテートされた関連ラベルに独立して最適化される。
本稿では,LLMの生成品質と直接整合する強化学習フレームワークであるReRanking Preference Optimization(RRPO)を紹介する。
論文 参考訳(メタデータ) (2026-04-02T14:19:47Z) - ReFormeR: Learning and Applying Explicit Query Reformulation Patterns [20.303421262899214]
ReFormeRは、クエリのリフォームのためのパターン誘導型アプローチである。
初期クエリのペアから短いリフォームパターンを抽出する。
それらを変換可能な変換パターンのコンパクトなライブラリに統合する。
論文 参考訳(メタデータ) (2026-04-01T21:34:11Z) - Scaling Retrieval Augmented Generation with RAG Fusion: Lessons from an Industry Deployment [0.0]
Retrieval-Augmented Generation (RAG) システムは一般にドキュメントリコールを改善するために検索融合技術を採用している。
本研究では,企業知識ベース上で運用される実運用型RAGパイプラインにおける検索融合を評価する。
検索融合は生のリコールを増大させるが、再ランク付けと切り離しにより、これらのゲインはほぼ中和される。
論文 参考訳(メタデータ) (2026-03-02T18:15:09Z) - An Early FIRST Reproduction and Improvements to Single-Token Decoding for Fast Listwise Reranking [50.81324768683995]
FIRSTは、学習からランクへの目的を統合し、最初の生成されたトークンのみのロジットを活用する新しいアプローチである。
我々は、FIRSTの評価をTRECディープラーニングデータセット(DL19-22)に拡張し、様々な領域でその堅牢性を検証する。
我々の実験は、単一トークンの高速リランクは、ドメイン外リランクの品質を損なうものではないことを確認した。
論文 参考訳(メタデータ) (2024-11-08T12:08:17Z) - FIRST: Faster Improved Listwise Reranking with Single Token Decoding [56.727761901751194]
まず、第1生成識別子の出力ロジットを活用して、候補のランク付け順序を直接取得する新しいリストワイズLLMリグレードアプローチであるFIRSTを紹介する。
実験結果から、BEIRベンチマークの利得により、FIRSTはロバストなランキング性能を維持しつつ、推論を50%高速化することが示された。
以上の結果から,LLMリランカーはクロスエンコーダに比べて強い蒸留信号を提供できることが示唆された。
論文 参考訳(メタデータ) (2024-06-21T21:27:50Z) - RaFe: Ranking Feedback Improves Query Rewriting for RAG [83.24385658573198]
アノテーションを使わずにクエリ書き換えモデルをトレーニングするためのフレームワークを提案する。
公開されているリランカを活用することで、フィードバックはリライトの目的とよく一致します。
論文 参考訳(メタデータ) (2024-05-23T11:00:19Z) - LoL: A Comparative Regularization Loss over Query Reformulation Losses
for Pseudo-Relevance Feedback [70.44530794897861]
Pseudo-Relevance feedback (PRF) は、検索精度を向上させるための効果的なクエリ修正手法であることが証明されている。
既存のPRF手法は、同じクエリから派生した修正クエリを個別に扱うが、異なる数のフィードバックドキュメントを使用する。
そこで我々はLos-over-Loss(LoL)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-25T10:42:50Z) - Exploring Fluent Query Reformulations with Text-to-Text Transformers and
Reinforcement Learning [11.205077315939644]
テキストからテキストへの変換器を用いた改質器の訓練により、クエリの改質を生成する方法を検討する。
ポリシーベースの強化学習アルゴリズムを適用し、報酬学習をさらに促進します。
当社のフレームワークはフレキシブルで,異なる下流環境から報奨信号の発信を可能にする。
論文 参考訳(メタデータ) (2020-12-18T03:16:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。