論文の概要: Dynamic Superblock Pruning for Fast Learned Sparse Retrieval
- arxiv url: http://arxiv.org/abs/2504.17045v1
- Date: Wed, 23 Apr 2025 18:46:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.142135
- Title: Dynamic Superblock Pruning for Fast Learned Sparse Retrieval
- Title(参考訳): 高速学習スパース検索のための動的スーパーブロックプルーニング
- Authors: Parker Carlson, Wentai Xie, Shanxiu He, Tao Yang,
- Abstract要約: 学習されたスパース表現のためのトップkオンライン文書検索において,スーパーブロックプルーニング(SP)を提案する。
SPは以前のフラットブロックやクラスタベースのプルーニングを一般化する。
実験の結果,提案方式はシングルスレッドCPU上でのMS MARCOパスにおける最先端のベースラインを著しく上回ることがわかった。
- 参考スコア(独自算出の注目度): 4.5098598532214655
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes superblock pruning (SP) during top-k online document retrieval for learned sparse representations. SP structures the sparse index as a set of superblocks on a sequence of document blocks and conducts a superblock-level selection to decide if some superblocks can be pruned before visiting their child blocks. SP generalizes the previous flat block or cluster-based pruning, allowing the early detection of groups of documents that cannot or are less likely to appear in the final top-k list. SP can accelerate sparse retrieval in a rank-safe or approximate manner under a high-relevance competitiveness constraint. Our experiments show that the proposed scheme significantly outperforms state-of-the-art baselines on MS MARCO passages on a single-threaded CPU.
- Abstract(参考訳): 本稿では,学習されたスパース表現のためのトップkオンライン文書検索におけるスーパーブロックプルーニング(SP)を提案する。
SPは、スパースインデックスをドキュメントブロックのシーケンス上のスーパーブロックのセットとして構成し、超ブロックレベルの選択を行い、いくつかのスーパーブロックが子ブロックを訪問する前にプルーニングできるかどうかを決定する。
SPは、以前のフラットブロックやクラスタベースのプルーニングを一般化し、最終トップkリストに表示できないか、そうでないドキュメントのグループを早期に検出する。
SPは、高関連競争性制約の下で、ランクセーフまたは近似方法でスパース検索を高速化することができる。
実験の結果,提案方式はシングルスレッドCPU上でのMS MARCOパスにおける最先端のベースラインを著しく上回ることがわかった。
関連論文リスト
- Pairing Clustered Inverted Indexes with kNN Graphs for Fast Approximate Retrieval over Learned Sparse Representations [8.796275989527054]
本稿では,高精度な近似探索アルゴリズムである地震探査について述べる。
地震は、最先端の逆インデックスベースのソリューションよりも1~2桁高速である。
まず、任意にではなく、重要な順にブロックを横断する。
我々の拡張は、地震波と呼ばれ、ほぼ正確に、地震の2.2倍の速さで到達することができる。
論文 参考訳(メタデータ) (2024-08-08T13:14:39Z) - Faster Learned Sparse Retrieval with Block-Max Pruning [11.080810272211906]
本稿では,学習されたスパース検索環境に出現するインデックスに適した,革新的な動的プルーニング戦略であるBlock-Max Pruning(BMP)を紹介する。
BMPは既存の動的プルーニング戦略を大幅に上回り、安全な検索コンテキストにおいて非並列効率を提供する。
論文 参考訳(メタデータ) (2024-05-02T09:26:30Z) - Sort & Slice: A Simple and Superior Alternative to Hash-Based Folding for Extended-Connectivity Fingerprints [0.873811641236639]
構造指紋のベクトル化のための一般的な数学的枠組みを,サブストラクチャープーリング(substructure pooling)と呼ばれる形式的操作により導入する。
Sort & Sliceは、ECFPサブ構造のプーリングのためのハッシュベースの折り畳みの、実装が容易でビットフリーな代替品である。
論文 参考訳(メタデータ) (2024-03-10T16:49:04Z) - Temporal-aware Hierarchical Mask Classification for Video Semantic
Segmentation [62.275143240798236]
ビデオセマンティックセグメンテーションデータセットは、ビデオ毎のカテゴリが限られている。
VSSトレーニング中に意味のある勾配更新を受けるために、クエリの10%未満がマッチする可能性がある。
提案手法は,最新のVSSベンチマークVSPWにおいてベルやホイッスルを使わずに,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-09-14T20:31:06Z) - An Efficient Coarse-to-Fine Facet-Aware Unsupervised Summarization
Framework based on Semantic Blocks [27.895044398724664]
教師なし長文要約のためのC2F-FAR(Coarse-to-Fine Facet-Aware Ranking)フレームワークを提案する。
粗いレベルでは、文書をファセット対応のセマンティックブロックに分割し、無意味なブロックをフィルタリングする新しいセグメントアルゴリズムを提案する。
詳細な段階において,各ブロックで有能な文を選択し,選択した文から最終要約を抽出する。
論文 参考訳(メタデータ) (2022-08-17T12:18:36Z) - Multi-View Document Representation Learning for Open-Domain Dense
Retrieval [87.11836738011007]
本稿では,多視点文書表現学習フレームワークを提案する。
ドキュメントを表現し、異なるクエリに合わせるように強制するために、マルチビューの埋め込みを作成することを目的としている。
実験により,本手法は最近の成果より優れ,最先端の結果が得られた。
論文 参考訳(メタデータ) (2022-03-16T03:36:38Z) - Temporal Perceiver: A General Architecture for Arbitrary Boundary
Detection [48.33132632418303]
ジェネリック境界検出(GBD)は、動画をセマンティック・コヒーレントと分類なしの単位に分割する一般的な境界を特定することを目的としている。
従来の研究では、単純なCNNからLSTMまでの複雑なディープネットワークの設計で、これらの異なるレベルの汎用境界を別々に扱っていた。
本稿では,Transformer を用いた汎用アーキテクチャである Temporal Perceiver について述べる。
論文 参考訳(メタデータ) (2022-03-01T09:31:30Z) - BlockCopy: High-Resolution Video Processing with Block-Sparse Feature
Propagation and Online Policies [57.62315799929681]
BlockCopyは、事前訓練されたフレームベースのCNNを高速化して、より効率的にビデオを処理するスキームである。
軽量ポリシーネットワークは、画像内の重要領域を決定し、選択された領域のみに操作を適用する。
非選択領域の特徴は、単に前のフレームからコピーされ、計算数とレイテンシーが減少する。
論文 参考訳(メタデータ) (2021-08-20T21:16:01Z) - Revisiting Deep Local Descriptor for Improved Few-Shot Classification [56.74552164206737]
textbfDense textbfClassification と textbfAttentive textbfPooling を利用して埋め込みの質を向上させる方法を示す。
広範に使われているグローバル平均プール (GAP) の代わりに, 注意深いプールを施し, 特徴マップをプールすることを提案する。
論文 参考訳(メタデータ) (2021-03-30T00:48:28Z) - Progressively Pretrained Dense Corpus Index for Open-Domain Question
Answering [87.32442219333046]
本稿では,段落エンコーダを事前学習するための簡易かつ資源効率の高い手法を提案する。
本手法は,事前学習に7倍の計算資源を使用する既存の高密度検索法より優れている。
論文 参考訳(メタデータ) (2020-04-30T18:09:50Z) - Qd-tree: Learning Data Layouts for Big Data Analytics [33.07610112749939]
本稿では、クエリデータルーティングツリー(qd-tree)と呼ばれる新しいフレームワークを提案し、この問題に対処する。
実験により、qd木は現在のブロッキング方式と比較して1桁以上の物理的スピードアップを提供できることが示された。
論文 参考訳(メタデータ) (2020-04-22T23:42:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。