論文の概要: Beyond Sequential Reranking: Reranker-Guided Search Improves Reasoning Intensive Retrieval
- arxiv url: http://arxiv.org/abs/2509.07163v1
- Date: Mon, 08 Sep 2025 19:24:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-10 14:38:27.094918
- Title: Beyond Sequential Reranking: Reranker-Guided Search Improves Reasoning Intensive Retrieval
- Title(参考訳): シークエンシャルリグレードを超えて:Reranker-Guided Searchは集中検索の推論を改善する
- Authors: Haike Xu, Tong Chen,
- Abstract要約: 本稿では,Reranker-Guided-Search(RGS)を提案する。
本手法では, 近似近傍アルゴリズムにより生成した近接グラフのグリーディ探索を用いる。
実験の結果、複数のベンチマークで大幅に性能が向上した。
- 参考スコア(独自算出の注目度): 8.57583804155738
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The widely used retrieve-and-rerank pipeline faces two critical limitations: they are constrained by the initial retrieval quality of the top-k documents, and the growing computational demands of LLM-based rerankers restrict the number of documents that can be effectively processed. We introduce Reranker-Guided-Search (RGS), a novel approach that bypasses these limitations by directly retrieving documents according to reranker preferences rather than following the traditional sequential reranking method. Our method uses a greedy search on proximity graphs generated by approximate nearest neighbor algorithms, strategically prioritizing promising documents for reranking based on document similarity. Experimental results demonstrate substantial performance improvements across multiple benchmarks: 3.5 points on BRIGHT, 2.9 on FollowIR, and 5.1 on M-BEIR, all within a constrained reranker budget of 100 documents. Our analysis suggests that, given a fixed pair of embedding and reranker models, strategically selecting documents to rerank can significantly improve retrieval accuracy under limited reranker budget.
- Abstract(参考訳): 広く使われている検索/参照パイプラインは、トップkドキュメントの初期検索品質に制約されていることと、LLMベースのリランカの増大する計算要求が、効果的に処理できるドキュメントの数を制限している、という2つの重要な制限に直面している。
Reranker-Guided-Search (RGS) は、従来のシーケンシャルリグレード手法に従わず、レランダの好みに応じて文書を直接検索することで、これらの制限を回避できる新しい手法である。
提案手法では, 近接グラフを近似した近接グラフを用いて, 文書類似性に基づいて, 有望な文書の再ランク付けを戦略的に優先順位付けする。
実験の結果、BRIGHTの3.5点、FollowIRの2.9点、M-BEIRの5.1点など、複数のベンチマークで大幅に性能が向上した。
提案手法は,埋込モデルと再ランカモデルが固定された場合,リランカ予算の制限下で,文書を戦略的に選択することで,検索精度を著しく向上させることができることを示唆している。
関連論文リスト
- Improving Document Retrieval Coherence for Semantically Equivalent Queries [63.97649988164166]
同じ文書を検索する際のモデルのコヒーレンスを改善する訓練DRにおける多段階ランク付け損失のバリエーションを提案する。
この損失は、多様だがセマンティックな等価なクエリのために検索されたトップkランクのドキュメント間の不一致を罰する。
論文 参考訳(メタデータ) (2025-08-11T13:34:59Z) - Breaking the Lens of the Telescope: Online Relevance Estimation over Large Retrieval Sets [14.494301139974455]
本稿では,オンライン関連度推定という新たな手法を提案する。
オンライン関連度推定は、ランキングプロセスを通して、クエリの関連度推定を継続的に更新する。
TRECベンチマークの手法をハイブリッド検索と適応検索の2つのシナリオで検証する。
論文 参考訳(メタデータ) (2025-04-12T22:05:50Z) - Learning More Effective Representations for Dense Retrieval through Deliberate Thinking Before Search [65.53881294642451]
ディリベレート思考に基づくDense Retriever (DEBATER)
DEBATERは、ステップバイステップの思考プロセスを通じて、より効果的な文書表現を学習できるようにすることにより、最近の密集型検索機能を強化している。
実験の結果,DEBATERはいくつかのベンチマークで既存手法よりも優れていた。
論文 参考訳(メタデータ) (2025-02-18T15:56:34Z) - Gumbel Reranking: Differentiable End-to-End Reranker Optimization [61.16471123356738]
RAGシステムは関連する文書を識別するためにリランカーに依存している。
注釈付きクエリ-ドキュメントペアが不足しているため、これらのモデルの微調整は依然として難しい。
我々は,トレーニングと推論のギャップを最小限に抑えることを目的とした,リランカーのためのエンドツーエンドのトレーニングフレームワークであるGumbel Re rankを提案する。
論文 参考訳(メタデータ) (2025-02-16T13:23:39Z) - Guiding Retrieval using LLM-based Listwise Rankers [15.3583908068962]
本稿では,リストワイズ設定をサポートする既存適応検索手法の適応性を提案する。
具体的には、提案アルゴリズムは、初期ランキングとフィードバック文書の両方から結果をマージする。
我々は,適応プロセスの最小化によるLLM推論の総数とオーバーヘッドを一定に保ちながら,nDCG@10を最大13.23%改善し,28.02%リコールできることを示した。
論文 参考訳(メタデータ) (2025-01-15T22:23:53Z) - Drowning in Documents: Consequences of Scaling Reranker Inference [35.499018267073964]
本研究は,第1段階検索を再現するだけでなく,完全検索のための再ランカ性能を計測する。
既存の最高のリランカは、徐々に多くのドキュメントをスコアリングするときに、初期的改善を提供します。
論文 参考訳(メタデータ) (2024-11-18T17:46:32Z) - JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking [81.88787401178378]
本稿では,文書関連性を評価する際に,人間の認知過程をエミュレートする新しいエージェント・リランカであるJiceRankを紹介する。
我々は,推論集約型BRIGHTベンチマークを用いて判定Rankを評価し,第1段階の検索手法よりも性能が大幅に向上したことを示す。
さらに、JiceRankは、人気の高いBEIRベンチマークの細調整された最先端リランカと同等に動作し、ゼロショットの一般化能力を検証している。
論文 参考訳(メタデータ) (2024-10-31T18:43:12Z) - Lexically-Accelerated Dense Retrieval [29.327878974130055]
LADR (Lexically-Accelerated Dense Retrieval) は, 既存の高密度検索モデルの効率を向上する, 簡便な手法である。
LADRは、標準ベンチマークでの徹底的な検索と同等の精度とリコールの両方を一貫して達成する。
論文 参考訳(メタデータ) (2023-07-31T15:44:26Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。