Fugu-MT 論文翻訳(概要): SOAR: Improved Indexing for Approximate Nearest Neighbor Search

論文の概要: SOAR: Improved Indexing for Approximate Nearest Neighbor Search

arxiv url: http://arxiv.org/abs/2404.00774v1
Date: Sun, 31 Mar 2024 19:09:09 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-04 01:51:24.314605
Title: SOAR: Improved Indexing for Approximate Nearest Neighbor Search
Title（参考訳）: SOAR: 近似近傍検索のためのインデックス化の改善
Authors: Philip Sun, David Simcha, Dave Dopson, Ruiqi Guo, Sanjiv Kumar,
Abstract要約: Orthogonality-Amplified Residuals (SOAR) によるスパイリングは、近接した近傍(ANN)探索のための新しいデータインデックス化手法である。
参考スコア（独自算出の注目度）: 30.752720306189342
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper introduces SOAR: Spilling with Orthogonality-Amplified Residuals, a novel data indexing technique for approximate nearest neighbor (ANN) search. SOAR extends upon previous approaches to ANN search, such as spill trees, that utilize multiple redundant representations while partitioning the data to reduce the probability of missing a nearest neighbor during search. Rather than training and computing these redundant representations independently, however, SOAR uses an orthogonality-amplified residual loss, which optimizes each representation to compensate for cases where other representations perform poorly. This drastically improves the overall index quality, resulting in state-of-the-art ANN benchmark performance while maintaining fast indexing times and low memory consumption.
Abstract（参考訳）: 本稿では, 近似近傍探索(ANN)のための新しいデータインデックス手法である, オルソゴン性増幅残差によるスパイリングについて紹介する。 SOARは、複数の冗長表現を使用しながらデータをパーティショニングすることで、検索中に最も近い隣人を見逃す可能性を減らす、ANN検索に対する以前のアプローチを拡張している。しかし、これらの冗長表現を個別に訓練し、計算するのではなく、SOARは直交増幅された残留損失を使用し、他の表現が不十分な場合に補償するために各表現を最適化する。これにより、インデックスの全体的な品質が大幅に向上し、最新のANNベンチマークのパフォーマンスが向上し、インデックスの高速化とメモリ消費の削減が図られる。

関連論文リスト

Forward Index Compression for Learned Sparse Retrieval [15.629655228398567]
我々は、全てのアルゴリズム的なフレーバーに共通するデータ構造のサイズに焦点を合わせ、インデックス全体のサイズであるフォワードインデックスのかなりの部分を構成する。特に,検索品質や内部積計算のレイテンシを損なうことなく,フォワードインデックスのストレージフットプリントを削減する圧縮手法を提案する。
論文参考訳（メタデータ） (2026-02-05T08:35:17Z)
Graph-based Nearest Neighbors with Dynamic Updates via Random Walks [14.905912653448686]
ランダムウォークに基づくグラフベース近似近傍探索(ANN)のための新しい理論的枠組みを提案する。次に、このフレームワークを用いて、点を削除する前に、グラフと比較してヒット時間統計を保存するランダム化された削除アプローチを分析する。大規模な実験を通じて、クエリ待ち時間、リコール、削除時間、メモリ使用量とのトレードオフを改善できることが示されています。
論文参考訳（メタデータ） (2025-12-19T21:00:07Z)
Efficient Sketching and Nearest Neighbor Search Algorithms for Sparse Vector Sets [16.768212375976546]
スパースANNSのための新しいデータ構造とアルゴリズム手法を提案する。我々の貢献は、スパースベクトルに対する理論的に基底化されたスケッチアルゴリズムから、それらの有効次元を減少させるものまで様々である。我々の最終アルゴリズムは耐震性と呼ばれ、大規模ベンチマークデータセット上で高精度でミリ秒以下のレイテンシに達する。
論文参考訳（メタデータ） (2025-09-29T14:02:45Z)
In-Place Updates of a Graph Index for Streaming Approximate Nearest Neighbor Search [12.092920351505036]
IP-DiskANNは,挿入処理と削除処理を効率よく行うことにより,バッチ統合を回避する最初のアルゴリズムである。ハイリコールとローリコールの両方で、様々な長い更新パターンに対して安定したリコールを行う。
論文参考訳（メタデータ） (2025-02-19T15:41:08Z)
Optimizing Tensor Computation Graphs with Equality Saturation and Monte Carlo Tree Search [0.0]
モンテカルロ木探索を用いて優れた表現を構築するテンソルグラフ書き換え手法を提案する。提案手法は,既存の手法と比較して,ニューラルネットワークの推論速度を最大11%向上させる。
論文参考訳（メタデータ） (2024-10-07T22:22:02Z)
Operational Advice for Dense and Sparse Retrievers: HNSW, Flat, or Inverted Indexes? [62.57689536630933]
本稿では,オープンソースのLucene検索ライブラリを用いたBEIRデータセットの実験結果について述べる。本研究は,高密度かつ疎密なレトリバーの設計空間を理解するための,今日の検索実践者へのガイダンスを提供する。
論文参考訳（メタデータ） (2024-09-10T12:46:23Z)
Early Exit Strategies for Approximate k-NN Search in Dense Retrieval [10.48678957367324]
アーリーエグジットのための最先端のA-kNNを構築し,忍耐の概念に基づく教師なし手法を提案する。我々は,A-kNNの効率を最大5倍の高速化で向上すると同時に,無視可能な効率損失を達成できることを示す。
論文参考訳（メタデータ） (2024-08-09T10:17:07Z)
Semi-Parametric Retrieval via Binary Bag-of-Tokens Index [71.78109794895065]
SemI-parametric Disentangled Retrieval (SiDR)は、ニューラルパラメータから検索インデックスを分離するバイエンコーダ検索フレームワークである。 SiDRは、検索のための非パラメトリックトークン化インデックスをサポートし、BM25のようなインデックス化の複雑さを著しく改善した。
論文参考訳（メタデータ） (2024-05-03T08:34:13Z)
Efficient k-NN Search with Cross-Encoders using Adaptive Multi-Round CUR Decomposition [77.4863142882136]
クロスエンコーダモデルは、直接k-nearest neighbor(k-NN)サーチには不当に高価である。本稿では,現実的に重要なトップk近傍の近似誤差を適応的に,反復的に,効率的に最小化するADACURを提案する。
論文参考訳（メタデータ） (2023-05-04T17:01:17Z)
A Theoretical Analysis Of Nearest Neighbor Search On Approximate Near Neighbor Graph [51.880164098926166]
グラフベースのアルゴリズムは、近隣探索(NN-Search)問題において最先端の性能を示す。グラフベースのNN-Searchアルゴリズムには実践と理論のギャップがある。低次元および高密度ベクトルに対する ANN-Graph 上の欲求探索による NN-Search の解法を理論的に保証する。
論文参考訳（メタデータ） (2023-03-10T21:18:34Z)
Improving Out-of-Distribution Generalization of Neural Rerankers with Contextualized Late Interaction [52.63663547523033]
マルチベクトルの最も単純な形式である後期相互作用は、[]ベクトルのみを使用して類似度スコアを計算する神経リランカにも役立ちます。異なるモデルサイズと多様な性質の第一段階のレトリバーに一貫性があることが示される。
論文参考訳（メタデータ） (2023-02-13T18:42:17Z)
Mathematical Models for Local Sensing Hashes [7.400475825464313]
近似インデックス構造は,クラスタリングと外乱検出の近傍探索を高速化する好機であることを示す。局所センシングハッシュの特性を数学的にモデル化する方向を示す。
論文参考訳（メタデータ） (2021-11-16T10:40:55Z)
Improving Novelty Detection using the Reconstructions of Nearest Neighbours [0.0]
自動エンコーダ (AE) の潜伏空間に近接する近傍での使用は, 半教師付きノベルティ検出の性能を著しく向上させることを示した。提案手法は, 近接する近傍の復元と, 入力の潜時表現の潜時距離の組合せを利用する。
論文参考訳（メタデータ） (2021-11-11T11:09:44Z)
Towards a Model for LSH [7.400475825464313]
クラスタリングと外れ値検出アルゴリズムは、ますます時間がかかりつつある。近似インデックス構造がクラスタリングと外乱検出の近傍探索を加速する好機であることを示す。
論文参考訳（メタデータ） (2021-05-11T15:39:55Z)
IRLI: Iterative Re-partitioning for Learning to Index [104.72641345738425]
分散環境でのロードバランスとスケーラビリティを維持しながら、高い精度を得る方法とのトレードオフが必要だ。クエリ項目関連データから直接バケットを学習することで、アイテムを反復的に分割するIRLIと呼ばれる新しいアプローチを提案する。我々は,irliが極めて自然な仮定の下で高い確率で正しい項目を検索し,優れた負荷分散を実現することを数学的に示す。
論文参考訳（メタデータ） (2021-03-17T23:13:25Z)
Learning to Accelerate Heuristic Searching for Large-Scale Maximum Weighted b-Matching Problems in Online Advertising [51.97494906131859]
バイパルタイトbマッチングはアルゴリズム設計の基本であり、経済市場や労働市場などに広く適用されている。既存の正確で近似的なアルゴリズムは、通常そのような設定で失敗する。我々は、以前の事例から学んだ知識を活用して、新しい問題インスタンスを解決するtextttNeuSearcherを提案する。
論文参考訳（メタデータ） (2020-05-09T02:48:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。