論文の概要: FAVOR: Efficient Filter-Agnostic Vector ANNS Based on Selectivity-Aware Exclusion Distances
- arxiv url: http://arxiv.org/abs/2605.07770v1
- Date: Fri, 08 May 2026 14:11:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.101116
- Title: FAVOR: Efficient Filter-Agnostic Vector ANNS Based on Selectivity-Aware Exclusion Distances
- Title(参考訳): FAVOR:選択性を考慮した効率的なフィルタ非依存ベクトルANNS
- Authors: Junjie Song, Yu Liu, Guoyu Hu, Zhongle Xie, Ming Yang, Beng Chin Ooi, Ke Zhou,
- Abstract要約: FAVORは効率的なフィルタに依存しないベクトルANNSであり、任意のフィルタ条件をサポートしながら、様々な選択性レベルの安定した性能を維持している。
実世界のデータセットでの実験では、FAVORが1.3-5$times$ $Recall@10 = 95%$でより高いQPSを達成した。
- 参考スコア(独自算出の注目度): 17.58209161125891
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern retrieval systems increasingly require integrating approximate nearest neighbor search (ANNS) with complex attribute filtering to handle hybrid queries in applications such as recommendation systems and retrieval-augmented generation (RAG). While HNSW-based inline-filtering methods show promise, existing approaches struggle to deliver high throughput under low-selectivity scenarios while balancing search efficiency, filtering generality, and index connectivity. To address these challenges, we propose FAVOR, an efficient filter-agnostic vector ANNS that supports arbitrary filtering conditions while maintaining stable performance across varying selectivity levels. FAVOR introduces three novel features: (1) an integrated architecture that unifies selectivity estimation and filtered ANNS execution, providing a cohesive solution for hybrid vector-attribute queries; (2) a HNSW-based inline-filtering algorithm that introduces an exclusion distance mechanism to dynamically reshape the vector distance distribution, pushing non-target vectors away from the query while promoting valid candidates toward the query, thus improving search efficiency without compromising generality or graph connectivity; and (3) a selectivity-driven search selector that estimates query selectivity and dynamically routes queries between a pre-filtering brute-force algorithm for low-selectivity cases and an optimized HNSW-based search algorithm for other scenarios, ensuring consistent performance. Extensive experiments on real-world datasets demonstrate that FAVOR achieves a 1.3-5$\times$ higher QPS at $Recall@10 = 95\%$ compared to state-of-the-art methods for arbitrary filtering conditions, while maintaining competitive performance even against tailored solutions in some filtering conditions.
- Abstract(参考訳): 現代の検索システムは、レコメンデーションシステムや検索拡張生成(RAG)のようなアプリケーションにおけるハイブリッドクエリを処理するために、近距離探索(ANNS)と複雑な属性フィルタリングを統合することを必要としている。
HNSWベースのインラインフィルタリング手法は将来性を示すが、既存の手法は探索効率、フィルタリング一般性、インデックス接続性のバランスを保ちながら、低選択性シナリオ下で高いスループットを実現するのに苦労している。
これらの課題に対処するために, 任意のフィルタ条件をサポートしながら, 様々な選択性レベルの安定した性能を維持しつつ, 効率的なフィルタ非依存ベクトルANNSであるFAVORを提案する。
FAVORは,(1)選択性推定とフィルタリングANNS実行を統一し,ハイブリッドベクトル属性クエリの凝集解を提供する統合アーキテクチャ,(2)ベクトル距離分布を動的に生成する排他的距離機構を導入するHNSWベースのインラインフィルタリングアルゴリズム,(2)クエリに対して有効な候補を推し進めながらクエリから非ターゲットベクトルを抽出し,汎用性やグラフ接続性を損なうことなく探索効率を向上させること,(3)クエリ選択性を推定し,クエリを動的にルーティングする選択性駆動検索セレクタ,(3)低選択性ケースに対する事前フィルタリングブルテフォースアルゴリズム間のクエリを動的にルーティングするHNSWベースの探索アルゴリズム,という,3つの新しい特徴を導入している。
実世界のデータセットに関する大規模な実験によると、FAVORは、任意のフィルタリング条件に対する最先端の手法と比較して、$Recall@10 = 95\%$で1.3-5$\times$高いQPSを達成する一方で、一部のフィルタリング条件において、調整されたソリューションに対してさえ競争性能を維持する。
関連論文リスト
- Filtered Approximate Nearest Neighbor Search in Vector Databases: System Design and Performance Analysis [0.5249805590164902]
Filtered Approximate Nearest Neighbor Search (FANNS) は、セマンティック検索とメタデータの制約を組み合わせるために用いられる。
本研究では,フィルタリング戦略の分類を体系化し,それらのベクトルへの統合性を評価する。
実験の結果,エンジン内のアルゴリズム適応がしばしば生のインデックス性能を上回ることがわかった。
論文 参考訳(メタデータ) (2026-02-11T23:40:26Z) - JAG: Joint Attribute Graphs for Filtered Nearest Neighbor Search [8.398505388767248]
JAG(Joint Attribute Graphs)は、グラフベースのアルゴリズムで、選択スペクトル全体にわたって堅牢なパフォーマンスを実現する。
実験の結果,JAGはスループットとリコールロバスト性の両方において,既存の最先端のベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2026-02-10T20:00:51Z) - Adaptive Prefiltering for High-Dimensional Similarity Search: A Frequency-Aware Approach [0.0]
本稿では,Zipfian分布に従ってクエリ空間を周波数層に分割する適応型事前フィルタフレームワークを提案する。
CLIP埋め込みを用いたImageNet-1kの実験は、周波数対応の予算配分が20.4%の距離計算で等価なリコールを達成することを示した。
このフレームワークは、軽量な周波数トラッキングを通じて最小限のオーバーヘッドを導入し、コヒーレンスベースのフォールバックポリシを通じて、目に見えないクエリを優雅に分解する。
論文 参考訳(メタデータ) (2025-12-03T10:11:35Z) - Representation Quantization for Collaborative Filtering Augmentation [49.14087936092634]
本稿では,新しい2段階協調推薦アルゴリズムDQRecを提案する。
相互作用配列と属性から共同で振舞い特性を抽出することで特徴と均一な結合を増強する。
これらのセマンティックIDパターンを機能拡張とリンク拡張を通じてレコメンデーションプロセスに統合することにより、システムは潜伏したユーザと明示的なアイテムの両方の機能を強化します。
論文 参考訳(メタデータ) (2025-08-15T04:00:50Z) - Billion-scale Similarity Search Using a Hybrid Indexing Approach with Advanced Filtering [49.1574468325115]
本稿では,CPU推論に最適化された数十億規模のデータセット上での複雑なフィルタリング機能を備えた類似度探索のための新しい手法を提案する。
提案手法は,従来のIVF-Flatインデックス構造を拡張し,多次元フィルタを統合する。
提案アルゴリズムは,高次元空間での高速な探索を可能にするため,高密度埋め込みと離散フィルタ特性を組み合わせる。
論文 参考訳(メタデータ) (2025-01-23T07:47:00Z) - Training Greedy Policy for Proposal Batch Selection in Expensive Multi-Objective Combinatorial Optimization [52.80408805368928]
本稿では,バッチ取得のための新しいグリーディ型サブセット選択アルゴリズムを提案する。
赤蛍光タンパク質に関する実験により,提案手法は1.69倍少ないクエリでベースライン性能を達成できることが判明した。
論文 参考訳(メタデータ) (2024-06-21T05:57:08Z) - Salience DETR: Enhancing Detection Transformer with Hierarchical Salience Filtering Refinement [19.277560848076984]
2段階の選択戦略は、選択したクエリとオブジェクトのミスマッチによるスケールバイアスと冗長性をもたらす。
本稿では,フィルタされた識別クエリのみにトランスフォーマーを符号化する階層型サリエンスフィルタリング精細化を提案する。
提案されたSalience DETRは、課題固有の3つのデータセットに対して、+4.0% AP、+0.2% AP、+4.4% APを大幅に改善する。
論文 参考訳(メタデータ) (2024-03-24T13:01:57Z) - Sub-network Multi-objective Evolutionary Algorithm for Filter Pruning [5.998027804346945]
ディープニューラルネットワーク(DNN)におけるモデル圧縮とアクセラレーションを実現するため,フィルタプルーニングは一般的な方法である
本稿では,フィルタプルーニングのためのサブネットワーク多目的進化アルゴリズム(SMOEA)を提案する。
CIFAR-10のVGG-14モデル実験により,提案したSMOEAの有効性が検証された。
論文 参考訳(メタデータ) (2022-10-22T13:34:14Z) - Globally Convergent Policy Search over Dynamic Filters for Output
Estimation [64.90951294952094]
我々は,大域的に最適な$textitdynamic$ filterに収束する最初の直接ポリシー探索アルゴリズム凸を導入する。
我々は、情報化が前述の優越性を克服していることを示す。
論文 参考訳(メタデータ) (2022-02-23T18:06:20Z) - Dependency Aware Filter Pruning [74.69495455411987]
重要でないフィルタを割ることは、推論コストを軽減するための効率的な方法である。
以前の作業は、その重み基準やそれに対応するバッチノームスケーリング要因に従ってフィルタをプルークする。
所望の空間性を達成するために,空間性誘導正規化を動的に制御する機構を提案する。
論文 参考訳(メタデータ) (2020-05-06T07:41:22Z) - Rethinking Differentiable Search for Mixed-Precision Neural Networks [83.55785779504868]
低ビット幅に量子化された重みとアクティベーションを持つ低精度ネットワークは、エッジデバイスでの推論を加速するために広く利用されている。
現在の解は均一であり、全てのフィルタに同じビット幅を使用する。
これは異なるフィルタの異なる感度を考慮せず、最適以下である。
混合精度ネットワークは、ビット幅を個々のフィルタ要求に調整することでこの問題に対処する。
論文 参考訳(メタデータ) (2020-04-13T07:02:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。