Fugu-MT 論文翻訳(概要): Reducing the Footprint of Multi-Vector Retrieval with Minimal Performance Impact via Token Pooling

論文の概要: Reducing the Footprint of Multi-Vector Retrieval with Minimal Performance Impact via Token Pooling

arxiv url: http://arxiv.org/abs/2409.14683v1
Date: Mon, 23 Sep 2024 03:12:43 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-06 21:23:54.449533
Title: Reducing the Footprint of Multi-Vector Retrieval with Minimal Performance Impact via Token Pooling
Title（参考訳）: トーケンプーリングによる最小性能による多ベクトル検索のフットプリント削減
Authors: Benjamin Clavié, Antoine Chaffin, Griffin Adams,
Abstract要約: ColBERTによって先導されたマルチベクター検索手法は、ニューラルIRに対するアプローチとしてますます人気が高まっている。しかし、大量のベクトルを格納するために必要なストレージとメモリの要求は、依然として重要な欠点である。簡単なクラスタリングベースのトークンプーリング手法を導入し、保存が必要なベクトルの数を積極的に削減する。
参考スコア（独自算出の注目度）: 5.232135930253723
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Over the last few years, multi-vector retrieval methods, spearheaded by ColBERT, have become an increasingly popular approach to Neural IR. By storing representations at the token level rather than at the document level, these methods have demonstrated very strong retrieval performance, especially in out-of-domain settings. However, the storage and memory requirements necessary to store the large number of associated vectors remain an important drawback, hindering practical adoption. In this paper, we introduce a simple clustering-based token pooling approach to aggressively reduce the number of vectors that need to be stored. This method can reduce the space & memory footprint of ColBERT indexes by 50% with virtually no retrieval performance degradation. This method also allows for further reductions, reducing the vector count by 66%-to-75% , with degradation remaining below 5% on a vast majority of datasets. Importantly, this approach requires no architectural change nor query-time processing, and can be used as a simple drop-in during indexation with any ColBERT-like model.
Abstract（参考訳）: ここ数年、ColBERTによって先導されたマルチベクター検索法は、ニューラルIRに対するアプローチとして人気が高まっている。文書レベルではなくトークンレベルに表現を格納することで、特にドメイン外設定において、これらの手法は非常に強力な検索性能を示した。しかし、大量のベクトルを格納するために必要なストレージとメモリの要求は依然として重要な欠点であり、実際的な採用を妨げる。本稿では,記憶すべきベクトルの数を積極的に削減する,単純なクラスタリングベースのトークンプーリング手法を提案する。この手法は,検索性能をほぼ低下させることなく,ColBERTインデックスの空間とメモリフットプリントを50%削減することができる。この方法はまた、さらなる削減を可能にし、ほとんどのデータセットで5%未満の劣化が残っているため、ベクトル数を66%から75%削減する。重要なことは、このアプローチはアーキテクチャの変更やクエリ時間処理は必要とせず、ColBERTのようなモデルでインデックス化する際に単純なドロップインとして使用することができる。

関連論文リスト

Multi-Vector Index Compression in Any Modality [73.7330345057813]
後期の相互作用は、テキスト、画像、ビジュアルドキュメント、ビデオにおける情報検索の主要なパラダイムとして現れてきた。インデックス圧縮には,シーケンスリサイズ,メモリトークン,階層プール,新しいアテンション誘導クラスタリング(AGC)の4つのアプローチを導入する。 AGCは、ドキュメントの最もセマンティックな領域をクラスタセントロイドとして識別し、トークンの集合を重み付けするために注意誘導機構を使用する。
論文参考訳（メタデータ） (2026-02-24T18:57:33Z)
SimpleMatch: A Simple and Strong Baseline for Semantic Correspondence [1.0039285760896914]
我々は,低解像度でも高い性能を実現する意味対応フレームワークであるSimpleMatchを紹介する。現在のSOTA法よりも252x252 (3.3倍小さい)の解像度で、SimpleMatchはSPair-71kベンチマークで84.1%のPCK@0.1で優れた性能を達成した。
論文参考訳（メタデータ） (2026-01-18T11:31:46Z)
Efficient Constant-Space Multi-Vector Retrieval [25.834026445124874]
入力トークンに縛られる必要がなくなったベクトルに対して,文書を一定数のベクトルに符号化する手法を提案する。経路は、元の有効性を保ちながら、効果的に一定数のベクトルに符号化できることがわかった。
論文参考訳（メタデータ） (2025-04-02T15:22:23Z)
Static Pruning in Dense Retrieval using Matrix Decomposition [12.899105656025018]
密集検索の時代には、文書のインデックス化と検索は主に、文書を埋め込みに変換するエンコーディングモデルに基づいている。近年の研究では, 組込みサイズを減らし, 回収効率を向上できる可能性が示唆されている。そこで本研究では,主成分分析による埋込み寸法の低減のための新しい静的プルーニング手法を提案する。
論文参考訳（メタデータ） (2024-12-13T09:09:20Z)
ESPN: Memory-Efficient Multi-Vector Information Retrieval [0.36832029288386137]
マルチベクトルモデルは、検索インデックスのメモリとストレージの要求を桁違いに増幅する。ストレージパイプラインネットワーク(ESPN)からEmbeddingを導入し、再ランクの埋め込みテーブル全体をオフロードして、メモリ要求を5～16倍削減します。我々は、ヒット率90%を超えるソフトウェアプレフィッシャーを設計し、SSDベースの検索を6.4倍に改善し、大規模なクエリバッチサイズであっても、ほぼメモリレベルのクエリレイテンシを維持できることを実証した。
論文参考訳（メタデータ） (2023-12-09T00:19:42Z)
Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文参考訳（メタデータ） (2023-07-26T16:19:19Z)
SPRINT: A Unified Toolkit for Evaluating and Demystifying Zero-shot Neural Sparse Retrieval [92.27387459751309]
ニューラルスパース検索を評価するための統一PythonツールキットであるSPRINTを提供する。我々は、よく認識されているベンチマークBEIRにおいて、強く再現可能なゼロショットスパース検索ベースラインを確立する。 SPLADEv2は、元のクエリとドキュメントの外で、ほとんどのトークンでスパース表現を生成する。
論文参考訳（メタデータ） (2023-07-19T22:48:02Z)
EcoTTA: Memory-Efficient Continual Test-time Adaptation via Self-distilled Regularization [71.70414291057332]
TTAは主にメモリ制限のあるエッジデバイス上で実行される。長期的な適応は、しばしば破滅的な忘れとエラーの蓄積につながる。本稿では,凍結したオリジナルネットワークを対象ドメインに適応させる軽量なメタネットワークを提案する。
論文参考訳（メタデータ） (2023-03-03T13:05:30Z)
Integral Continual Learning Along the Tangent Vector Field of Tasks [112.02761912526734]
本稿では,特殊データセットからの情報を段階的に組み込んだ軽量連続学習手法を提案する。ソースデータセットの0.4%まで小さく、小さな固定サイズのメモリバッファを保持しており、単純な再サンプリングによって更新される。提案手法は,異なるデータセットに対して,様々なバッファサイズで高い性能を実現する。
論文参考訳（メタデータ） (2022-11-23T16:49:26Z)
CITADEL: Conditional Token Interaction via Dynamic Lexical Routing for Efficient and Effective Multi-Vector Retrieval [72.90850213615427]
マルチベクター検索法はスパース(例えばBM25)と高密度(例えばDPR)レトリバーの利点を組み合わせたものである。これらの手法は桁違いに遅く、単ベクトルの手法に比べてインデックスを格納するのにはるかに多くのスペースを必要とする。動的語彙ルーティング(CITADEL)による条件付きトークンの相互作用を,効率的かつ効率的なマルチベクタ検索のために提案する。
論文参考訳（メタデータ） (2022-11-18T18:27:35Z)
Introducing Neural Bag of Whole-Words with ColBERTer: Contextualized Late Interactions using Enhanced Reduction [10.749746283569847]
ColBERTerは、文脈化された遅延相互作用(ColBERT)と強化されたリダクションを用いたニューラル検索モデルである。マルチベクタコンポーネントのために、ColBERTerは、各ドキュメントの用語に対するユニークな全ワード表現を学習することで、ドキュメントごとの格納数を減らす。 MS MARCOとTREC-DLのコレクションの結果から、ColBERTerは最大2.5倍のストレージフットプリントを削減できるが、有効性は維持できる。
論文参考訳（メタデータ） (2022-03-24T14:28:07Z)
Incremental Learning of Structured Memory via Closed-Loop Transcription [20.255633973040183]
本研究は、インクリメンタルな設定で複数のオブジェクトクラスの構造化記憶を学習するための最小限の計算モデルを提案する。本手法は,従来のインクリメンタルラーニング手法よりもシンプルで,モデルサイズ,ストレージ,計算の面でより効率的である。実験結果から,本手法は破滅的忘れを効果的に軽減し,生成的リプレイよりも高い性能を達成できることが示唆された。
論文参考訳（メタデータ） (2022-02-11T02:20:43Z)
Rethinking Space-Time Networks with Improved Memory Coverage for Efficient Video Object Segmentation [68.45737688496654]
各オブジェクトのマスク特徴を再エンコードすることなく,フレーム間の直接対応性を確立する。対応によって、現在のクエリフレーム内の全てのノードは、過去の特徴を連想的に集約することによって推測される。すべてのメモリノードにコントリビュートする機会があることを検証し、そのような多彩な投票がメモリ効率と推論精度の両方に有益であることを示した。
論文参考訳（メタデータ） (2021-06-09T16:50:57Z)
CNN with large memory layers [2.368995563245609]
この作業は、最近提案された製品キーメモリ構造であるcitelarge_Memoryを中心に、多くのコンピュータビジョンアプリケーションに実装されている。メモリ構造は、ほぼすべてのニューラルネットワークアーキテクチャに拡張されるのに適した単純な計算プリミティブと見なすことができる。
論文参考訳（メタデータ） (2021-01-27T20:58:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。