論文の概要: Col-Bandit: Zero-Shot Query-Time Pruning for Late-Interaction Retrieval
- arxiv url: http://arxiv.org/abs/2602.02827v1
- Date: Mon, 02 Feb 2026 21:27:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.095715
- Title: Col-Bandit: Zero-Shot Query-Time Pruning for Late-Interaction Retrieval
- Title(参考訳): Col-Bandit: 遅延インタラクション検索のためのゼロショットクエリタイムプルーニング
- Authors: Roi Pony, Adi Raz, Oshri Naparstek, Idan Friedman, Udi Barzelay,
- Abstract要約: Col-Banditは、Pop-K$識別問題として再ランク付けすることで、この計算負担を軽減するクエリ時プルーニングアルゴリズムである。
ドキュメント全体やトークンをオフラインにプルークする粗い粒度のアプローチとは異なり、Col-Banditはオンザフライで相互作用行列をスペーサーする。
実験の結果、Col-Bandit は MaxSim FLOPs を最大 5$times$ まで下げながらランキングの忠実さを保っていることがわかった。
- 参考スコア(独自算出の注目度): 2.159285655678094
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-vector late-interaction retrievers such as ColBERT achieve state-of-the-art retrieval quality, but their query-time cost is dominated by exhaustively computing token-level MaxSim interactions for every candidate document. While approximating late interaction with single-vector representations reduces cost, it often incurs substantial accuracy loss. We introduce Col-Bandit, a query-time pruning algorithm that reduces this computational burden by casting reranking as a finite-population Top-$K$ identification problem. Col-Bandit maintains uncertainty-aware bounds over partially observed document scores and adaptively reveals only the (document, query token) MaxSim entries needed to determine the top results under statistical decision bounds with a tunable relaxation. Unlike coarse-grained approaches that prune entire documents or tokens offline, Col-Bandit sparsifies the interaction matrix on the fly. It operates as a zero-shot, drop-in layer over standard multi-vector systems, requiring no index modifications, offline preprocessing, or model retraining. Experiments on textual (BEIR) and multimodal (REAL-MM-RAG) benchmarks show that Col-Bandit preserves ranking fidelity while reducing MaxSim FLOPs by up to 5$\times$, indicating that dense late-interaction scoring contains substantial redundancy that can be identified and pruned efficiently at query time.
- Abstract(参考訳): ColBERTのようなマルチベクタ遅延処理レトリバーは、最先端の検索品質を実現するが、クエリ時間コストは、すべての候補文書に対するトークンレベルのMaxSimインタラクションを徹底的に計算することによって支配される。
単一ベクトル表現との遅延相互作用の近似はコストを低減させるが、しばしばかなりの精度の損失を引き起こす。
我々は、この計算負担を軽減するためのクエリ時プルーニングアルゴリズムであるCol-Banditを紹介し、Top-K$識別問題として再ランク付けを行うことにより、この計算負担を軽減する。
Col-Banditは、部分的に観察された文書スコアに対する不確実性を認識し、調整可能な緩和を伴う統計的決定境界の下で上位結果を決定するのに必要な(ドキュメント、クエリトークン)MaxSimエントリのみを適応的に明らかにする。
ドキュメント全体やトークンをオフラインにプルークする粗い粒度のアプローチとは異なり、Col-Banditはオンザフライで相互作用行列をスペーサーする。
標準のマルチベクトルシステム上でゼロショット、ドロップイン層として動作し、インデックス変更、オフライン前処理、モデル再トレーニングを必要としない。
テキスト (BEIR) とマルチモーダル (REAL-MM-RAG) ベンチマークの実験では、Col-Bandit は MaxSim FLOPs を最大 5$\times$ まで下げつつ、ランクの忠実さを保っている。
関連論文リスト
- Quantifying Memory Use in Reinforcement Learning with Temporal Range [51.98491034847041]
時間的範囲(Temporal Range)は、時間的影響プロファイルとして、時間的ウィンドウから入力シーケンスへの複数のベクトル出力の1次感度を扱うモデルに依存しない計量である。
また、タスクレベルメモリのプロキシ読み出しとして、タスク上で訓練されたコンパクトなLong Expressive Memory(LEM)ポリシーについて、テンポラルレンジを報告する。
論文 参考訳(メタデータ) (2025-12-05T22:58:09Z) - DQS: A Low-Budget Query Strategy for Enhancing Unsupervised Data-driven Anomaly Detection Approaches [3.3482093430607267]
本研究は,既存の教師なし異常検出手法とアクティブラーニングを統合した。
我々は、DQS(dissimilarity-based query strategy)と呼ばれる新しいクエリ戦略を導入する。
論文 参考訳(メタデータ) (2025-09-06T09:50:10Z) - Fast Controlled Generation from Language Models with Adaptive Weighted Rejection Sampling [90.86991492288487]
トークンの制約を評価するのは 違法にコストがかかる
LCDは文字列上のグローバル分布を歪め、ローカル情報のみに基づいてトークンをサンプリングすることができる。
我々のアプローチは最先端のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2025-04-07T18:30:18Z) - Gumbel Reranking: Differentiable End-to-End Reranker Optimization [61.16471123356738]
RAGシステムは関連する文書を識別するためにリランカーに依存している。
注釈付きクエリ-ドキュメントペアが不足しているため、これらのモデルの微調整は依然として難しい。
我々は,トレーニングと推論のギャップを最小限に抑えることを目的とした,リランカーのためのエンドツーエンドのトレーニングフレームワークであるGumbel Re rankを提案する。
論文 参考訳(メタデータ) (2025-02-16T13:23:39Z) - A Reproducibility Study of PLAID [25.86500025007641]
我々はPLAIDと論文から欠落した重要なベースラインを比較した。
ColBERTv2 を BM25 の初期プール上に再ランカとして適用することにより,低レイテンシ環境での効率効率・効率性トレードオフが向上することがわかった。
この制限を克服するために、最近提案された上位文書の隣人を引き出すように、再ランク付けする修正が提案されていることが分かりました。
論文 参考訳(メタデータ) (2024-04-23T12:46:53Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - ColBERT: Efficient and Effective Passage Search via Contextualized Late
Interaction over BERT [24.288824715337483]
ColBERTは、ディープLMを効率的な検索に適応させる新しいランキングモデルである。
我々は最近の2つの経路探索データセットを用いてColBERTを広範囲に評価した。
論文 参考訳(メタデータ) (2020-04-27T14:21:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。