論文の概要: Adaptive Prefiltering for High-Dimensional Similarity Search: A Frequency-Aware Approach
- arxiv url: http://arxiv.org/abs/2602.22214v1
- Date: Wed, 03 Dec 2025 10:11:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 07:21:25.673872
- Title: Adaptive Prefiltering for High-Dimensional Similarity Search: A Frequency-Aware Approach
- Title(参考訳): 高次元類似度探索のための適応型事前フィルタ:周波数認識アプローチ
- Authors: Teodor-Ioan Calin,
- Abstract要約: 本稿では,Zipfian分布に従ってクエリ空間を周波数層に分割する適応型事前フィルタフレームワークを提案する。
CLIP埋め込みを用いたImageNet-1kの実験は、周波数対応の予算配分が20.4%の距離計算で等価なリコールを達成することを示した。
このフレームワークは、軽量な周波数トラッキングを通じて最小限のオーバーヘッドを導入し、コヒーレンスベースのフォールバックポリシを通じて、目に見えないクエリを優雅に分解する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-dimensional similarity search underpins modern retrieval systems, yet uniform search strategies fail to exploit the heterogeneous nature of real-world query distributions. We present an adaptive prefiltering framework that leverages query frequency patterns and cluster coherence metrics to dynamically allocate computational budgets. Our approach partitions the query space into frequency tiers following Zipfian distributions and assigns differentiated search policies based on historical access patterns and local density characteristics. Experiments on ImageNet-1k using CLIP embeddings demonstrate that frequency-aware budget allocation achieves equivalent recall with 20.4% fewer distance computations compared to static nprobe selection, while maintaining sub-millisecond latency on GPU-accelerated FAISS indices. The framework introduces minimal overhead through lightweight frequency tracking and provides graceful degradation for unseen queries through coherence-based fallback policies.
- Abstract(参考訳): 高次元類似性探索は現代の検索システムを支えるが、一様探索戦略は実世界の問合せ分布の不均一性を利用することができない。
本稿では、クエリ頻度パターンとクラスタコヒーレンスメトリクスを利用して計算予算を動的に割り当てる適応型事前フィルタリングフレームワークを提案する。
提案手法では,クエリ空間をZipfian分布に従って周波数層に分割し,履歴アクセスパターンと局所密度特性に基づいて識別された検索ポリシーを割り当てる。
CLIP埋め込みを用いたImageNet-1kの実験では、周波数対応の予算配分が、静的nprobe選択よりも20.4%少ない距離計算で等価なリコールを達成する一方で、GPUアクセラレーションされたFAISSインデックスではミリ秒以下のレイテンシが維持されている。
このフレームワークは、軽量な周波数トラッキングを通じて最小限のオーバーヘッドを導入し、コヒーレンスベースのフォールバックポリシを通じて、目に見えないクエリを優雅に分解する。
関連論文リスト
- Filtered Approximate Nearest Neighbor Search in Vector Databases: System Design and Performance Analysis [0.5249805590164902]
Filtered Approximate Nearest Neighbor Search (FANNS) は、セマンティック検索とメタデータの制約を組み合わせるために用いられる。
本研究では,フィルタリング戦略の分類を体系化し,それらのベクトルへの統合性を評価する。
実験の結果,エンジン内のアルゴリズム適応がしばしば生のインデックス性能を上回ることがわかった。
論文 参考訳(メタデータ) (2026-02-11T23:40:26Z) - Learning to Guide Local Search for MPE Inference in Probabilistic Graphical Models [7.287294240824019]
確率的グラフィカルモデル(PGM)におけるほとんどの確率的説明(MPE)推論は、根本的なが計算的に難しい問題である。
本稿では、繰り返しクエリー方式における局所探索を改善するためのニューラルネットワークのアモート化フレームワークを提案する。
理論的な直観リンクによる距離低減移動選択を行い, 隣り合う選択時の約束を改良する。
論文 参考訳(メタデータ) (2026-02-01T22:43:28Z) - Prompt-aware of Frame Sampling for Efficient Text-Video Retrieval [21.65508603851204]
ProCLIPは、最先端の精度を実現し、効率を大幅に改善したユーザ中心のフレームワークである。
テキストプロンプトを用いて軽量特徴抽出器を動的に誘導し,意味のあるフレームを選択するプロンプト対応フレームサンプリング戦略を設計する。
軽量モジュールによる高速粗いフィルタリングとCLIPを用いた微粒化再構成を併用し,精度を保ちながら検索効率を向上する2段階のプルーニング戦略を採用する。
論文 参考訳(メタデータ) (2025-07-21T10:46:49Z) - vCache: Verified Semantic Prompt Caching [95.16654660556975]
本稿では,ユーザ定義エラー率保証を備えた最初の検証済みセマンティックキャッシュであるvCacheを提案する。
オンライン学習アルゴリズムを使用して、キャッシュされたプロンプト毎に最適な閾値を推定し、追加のトレーニングなしで信頼性の高いキャッシュ応答を可能にする。
我々の実験によると、vCacheは特定のエラー境界を一貫して満たし、最先端の静的な閾値と微調整された埋め込みベースラインより優れています。
論文 参考訳(メタデータ) (2025-02-06T04:16:20Z) - Billion-scale Similarity Search Using a Hybrid Indexing Approach with Advanced Filtering [49.1574468325115]
本稿では,CPU推論に最適化された数十億規模のデータセット上での複雑なフィルタリング機能を備えた類似度探索のための新しい手法を提案する。
提案手法は,従来のIVF-Flatインデックス構造を拡張し,多次元フィルタを統合する。
提案アルゴリズムは,高次元空間での高速な探索を可能にするため,高密度埋め込みと離散フィルタ特性を組み合わせる。
論文 参考訳(メタデータ) (2025-01-23T07:47:00Z) - pEBR: A Probabilistic Approach to Embedding Based Retrieval [9.186585413958769]
埋め込みベースの検索は、クエリとアイテムの両方の共有セマンティック表現空間を学習することを目的としている。
我々は,textbfprobabilistic textbfEmbedding-textbfBased textbfRetrieval (textbfpEBR) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-25T07:14:12Z) - Temporal-aware Hierarchical Mask Classification for Video Semantic
Segmentation [62.275143240798236]
ビデオセマンティックセグメンテーションデータセットは、ビデオ毎のカテゴリが限られている。
VSSトレーニング中に意味のある勾配更新を受けるために、クエリの10%未満がマッチする可能性がある。
提案手法は,最新のVSSベンチマークVSPWにおいてベルやホイッスルを使わずに,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-09-14T20:31:06Z) - Efficient Joint-Dimensional Search with Solution Space Regularization
for Real-Time Semantic Segmentation [27.94898516315886]
この問題に対して,リアルタイムに実行可能な最適ネットワーク構造を探索する。
新たな解空間規則化(SSR)損失は、スーパーネットが離散的に収束することを効果的に促すために最初に提案される。
より高効率な探索を実現するために,新しい階層的・プログレッシブ・ソリューション・スペース・スライキング法を提案する。
論文 参考訳(メタデータ) (2022-08-10T11:07:33Z) - Toward A Formalized Approach for Spike Sorting Algorithms and Hardware
Evaluation [2.0738462952016232]
スパイクソートアルゴリズムは、神経細胞の細胞外記録を単ユニットスパイク活動に分離するために用いられる。
我々は、標準化された基準のセットと、SSOER(Synthetic Simulations of Extracellular Recordings)と題する、公開可能な合成データセットを定式化する。
このシステムは、約10.72mWを消費し、22nm FDSOI補体金属-酸化物-半導体(CMOS)プロセスにおいて、0.66mm$2$の面積を占める。
論文 参考訳(メタデータ) (2022-05-13T08:42:18Z) - Accelerating Deep Learning Classification with Error-controlled
Approximate-key Caching [72.50506500576746]
我々は、近似キーキャッシングと名付けた新しいキャッシングパラダイムを提案する。
近似キャッシュはDL推論の負荷を軽減し、システムのスループットを向上するが、近似誤差を導入する。
我々は古典的なLRUと理想的なキャッシュのキャッシュシステム性能を解析的にモデル化し、期待される性能のトレース駆動評価を行い、提案手法の利点を最先端の類似キャッシュと比較した。
論文 参考訳(メタデータ) (2021-12-13T13:49:11Z) - Adaptive Sampling for Heterogeneous Rank Aggregation from Noisy Pairwise
Comparisons [85.5955376526419]
ランキングアグリゲーション問題では、各項目を比較する際に、様々な精度レベルが示される。
本稿では,ノイズのあるペアワイズ比較によってアイテムのランクを推定する,除去に基づくアクティブサンプリング戦略を提案する。
提案アルゴリズムは,商品の真のランキングを高い確率で返却できることを示す。
論文 参考訳(メタデータ) (2021-10-08T13:51:55Z) - IRLI: Iterative Re-partitioning for Learning to Index [104.72641345738425]
分散環境でのロードバランスとスケーラビリティを維持しながら、高い精度を得る方法とのトレードオフが必要だ。
クエリ項目関連データから直接バケットを学習することで、アイテムを反復的に分割するIRLIと呼ばれる新しいアプローチを提案する。
我々は,irliが極めて自然な仮定の下で高い確率で正しい項目を検索し,優れた負荷分散を実現することを数学的に示す。
論文 参考訳(メタデータ) (2021-03-17T23:13:25Z) - Learning to Accelerate Heuristic Searching for Large-Scale Maximum
Weighted b-Matching Problems in Online Advertising [51.97494906131859]
バイパルタイトbマッチングはアルゴリズム設計の基本であり、経済市場や労働市場などに広く適用されている。
既存の正確で近似的なアルゴリズムは、通常そのような設定で失敗する。
我々は、以前の事例から学んだ知識を活用して、新しい問題インスタンスを解決するtextttNeuSearcherを提案する。
論文 参考訳(メタデータ) (2020-05-09T02:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。