論文の概要: Multivector Reranking in the Era of Strong First-Stage Retrievers
- arxiv url: http://arxiv.org/abs/2601.05200v1
- Date: Thu, 08 Jan 2026 18:22:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.332958
- Title: Multivector Reranking in the Era of Strong First-Stage Retrievers
- Title(参考訳): 強1段リトリーバー時代のマルチベクター
- Authors: Silvio Martinico, Franco Maria Nardini, Cosimo Rulli, Rossano Venturini,
- Abstract要約: 2つの公開データセット上で、最先端のマルチベクタ検索手法を再現する。
トークンレベルの集合フェーズを単一ベクトル文書検索器に置き換えることで,より小さく,より意味的に一貫性のある候補セットが生成されることを示す。
我々の2段階のアプローチは、最先端のマルチベクター検索システムに対して24ドル以上のスピードアップを実現し、同等または優れた検索品質を維持しています。
- 参考スコア(独自算出の注目度): 11.098422338598454
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learned multivector representations power modern search systems with strong retrieval effectiveness, but their real-world use is limited by the high cost of exhaustive token-level retrieval. Therefore, most systems adopt a \emph{gather-and-refine} strategy, where a lightweight gather phase selects candidates for full scoring. However, this approach requires expensive searches over large token-level indexes and often misses the documents that would rank highest under full similarity. In this paper, we reproduce several state-of-the-art multivector retrieval methods on two publicly available datasets, providing a clear picture of the current multivector retrieval field and observing the inefficiency of token-level gathering. Building on top of that, we show that replacing the token-level gather phase with a single-vector document retriever -- specifically, a learned sparse retriever (LSR) -- produces a smaller and more semantically coherent candidate set. This recasts the gather-and-refine pipeline into the well-established two-stage retrieval architecture. As retrieval latency decreases, query encoding with two neural encoders becomes the dominant computational bottleneck. To mitigate this, we integrate recent inference-free LSR methods, demonstrating that they preserve the retrieval effectiveness of the dual-encoder pipeline while substantially reducing query encoding time. Finally, we investigate multiple reranking configurations that balance efficiency, memory, and effectiveness, and we introduce two optimization techniques that prune low-quality candidates early. Empirical results show that these techniques improve retrieval efficiency by up to 1.8$\times$ with no loss in quality. Overall, our two-stage approach achieves over $24\times$ speedup over the state-of-the-art multivector retrieval systems, while maintaining comparable or superior retrieval quality.
- Abstract(参考訳): 学習されたマルチベクター表現は、強力な検索効率を持つ現代の検索システムに電力を供給するが、その実世界の利用は、トークンレベルの検索のコストが高いために制限される。
したがって、ほとんどのシステムは 'emph{gather-and-refine} 戦略を採用する。
しかし、このアプローチでは、大きなトークンレベルのインデックスに対する高価な検索が必要であり、多くの場合、完全な類似性の下で最高にランク付けされるドキュメントを見逃してしまう。
本稿では,2つの公開データセット上で,現状のマルチベクタ検索手法を再現し,現在のマルチベクタ検索分野の明確な画像を提供し,トークンレベルの収集の非効率性を観察する。
その上に、トークンレベルの集合フェーズを単一ベクタドキュメントレトリバー(具体的には学習スパースレトリバー(LSR))に置き換えることで、より小さく、より意味的に一貫性のある候補セットが生成されることを示す。
これにより、収集と再定義のパイプラインを、確立された2段階の検索アーキテクチャに再キャストする。
検索遅延が減少するにつれて、2つのニューラルエンコーダによるクエリエンコーディングが主要な計算ボトルネックとなる。
これを軽減するために、近年の推論不要なLSR手法を統合し、クエリエンコーディング時間を大幅に短縮しつつ、二重エンコーダパイプラインの検索効率を維持できることを実証した。
最後に, 効率, メモリ, 効率のバランスをとる複数のリグレード構成について検討し, 低品質候補を早期に適用する2つの最適化手法を提案する。
実験結果から,これらの手法は品質を損なうことなく,最大1.8$\times$の検索効率を向上させることが示された。
全体として、我々の2段階のアプローチは、同等または優れた検索品質を維持しながら、最先端のマルチベクター検索システムよりも24ドル以上のスピードアップを実現しています。
関連論文リスト
- Hybrid-Vector Retrieval for Visually Rich Documents: Combining Single-Vector Efficiency and Multi-Vector Accuracy [36.03315207229038]
HEAVENは、視覚的にリッチな文書検索のための2段階のハイブリッドベクトルフレームワークである。
Visually-Summarized Pages上で、単一のベクターメソッドを使用して、候補ページを効率的に検索する。
クエリトークンを言語的に重要度でフィルタリングし、冗長な計算を減らしながら、マルチベクタ方式で候補をリランクする。
論文 参考訳(メタデータ) (2025-10-25T08:27:37Z) - MUVERA: Multi-Vector Retrieval via Fixed Dimensional Encodings [15.275864151890511]
マルチベクトル探索を単一ベクトル類似性探索に還元する検索機構であるMUVERA(MUlti-VEctor Retrieval Algorithm)を導入する。
MUVERAはBEIR検索データセットの多種多様なセットに対して、一貫して優れたエンドツーエンドのリコールとレイテンシを実現する。
論文 参考訳(メタデータ) (2024-05-29T20:40:20Z) - Multimodal Learned Sparse Retrieval with Probabilistic Expansion Control [66.78146440275093]
学習検索(LSR)は、クエリとドキュメントを疎語彙ベクトルにエンコードするニューラルネットワークのファミリーである。
テキスト画像検索に焦点をあて,マルチモーダル領域へのLSRの適用について検討する。
LexLIPやSTAIRのような現在のアプローチでは、大規模なデータセットで複雑なマルチステップのトレーニングが必要です。
提案手法は, 密度ベクトルを凍結密度モデルからスパース語彙ベクトルへ効率的に変換する。
論文 参考訳(メタデータ) (2024-02-27T14:21:56Z) - HashReID: Dynamic Network with Binary Codes for Efficient Person
Re-identification [3.3372444460738357]
人身認証(ReID)のような生体認証アプリケーションは、しばしばエネルギー制約のあるデバイスにデプロイされる。
近年のReID手法では高い検索性能が優先されているが,計算コストが大きく,探索時間も高いことが多い。
本稿では,複数の出口ブロックを持つ入力適応型ネットワークを提案する。
論文 参考訳(メタデータ) (2023-08-23T04:01:54Z) - Lexically-Accelerated Dense Retrieval [29.327878974130055]
LADR (Lexically-Accelerated Dense Retrieval) は, 既存の高密度検索モデルの効率を向上する, 簡便な手法である。
LADRは、標準ベンチマークでの徹底的な検索と同等の精度とリコールの両方を一貫して達成する。
論文 参考訳(メタデータ) (2023-07-31T15:44:26Z) - ReFIT: Relevance Feedback from a Reranker during Inference [109.33278799999582]
Retrieve-and-Rerankは、ニューラル情報検索の一般的なフレームワークである。
本稿では,リランカを利用してリコールを改善する手法を提案する。
論文 参考訳(メタデータ) (2023-05-19T15:30:33Z) - CITADEL: Conditional Token Interaction via Dynamic Lexical Routing for
Efficient and Effective Multi-Vector Retrieval [72.90850213615427]
マルチベクター検索法はスパース(例えばBM25)と高密度(例えばDPR)レトリバーの利点を組み合わせたものである。
これらの手法は桁違いに遅く、単ベクトルの手法に比べてインデックスを格納するのにはるかに多くのスペースを必要とする。
動的語彙ルーティング(CITADEL)による条件付きトークンの相互作用を,効率的かつ効率的なマルチベクタ検索のために提案する。
論文 参考訳(メタデータ) (2022-11-18T18:27:35Z) - Efficient Nearest Neighbor Search for Cross-Encoder Models using Matrix
Factorization [60.91600465922932]
本稿では,クロスエンコーダのみに頼って,二重エンコーダによる検索を回避する手法を提案する。
我々のアプローチは、現在の広く使われている方法よりも優れたテスト時間リコール-vs計算コストトレードオフを提供する。
論文 参考訳(メタデータ) (2022-10-23T00:32:04Z) - HyP$^2$ Loss: Beyond Hypersphere Metric Space for Multi-label Image
Retrieval [20.53316810731414]
ハイブリッドプロキシペアロス(HyP$2$ロス)を用いた新しいメトリクス学習フレームワークを提案する。
提案されたHyP$2$Losは、学習可能なプロキシによるハイパースフィア空間の最適化と、無関係なペアのデータ-データ相関の探索に焦点を当てている。
論文 参考訳(メタデータ) (2022-08-14T15:06:27Z) - UnifieR: A Unified Retriever for Large-Scale Retrieval [84.61239936314597]
大規模な検索は、クエリを与えられた巨大なコレクションから関連ドキュメントをリコールすることである。
事前学習型言語モデル(PLM)に基づく最近の検索手法は,高密度ベクターあるいはレキシコンに基づくパラダイムに大別することができる。
本論文では,高密度ベクトルとレキシコンに基づく検索を2つの表現能力を持つ1つのモデルで統合する学習フレームワークUnifieRを提案する。
論文 参考訳(メタデータ) (2022-05-23T11:01:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。