論文の概要: Query-aware Routing for Filtered Approximate Nearest Neighbors Search
- arxiv url: http://arxiv.org/abs/2606.19898v1
- Date: Thu, 18 Jun 2026 07:54:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.715169
- Title: Query-aware Routing for Filtered Approximate Nearest Neighbors Search
- Title(参考訳): フィルタ近似近傍探索のための問合せ対応ルーティング
- Authors: Qianqian Xiong, Mengxuan Zhang,
- Abstract要約: フィルタされたANN探索は、現代のベクトルデータベースと検索拡張生成におけるコアプリミティブである。
我々は3つの述語の下で複数のデータセットにまたがる主要な分類的ANN手法の全てをベンチマークする。
軽量MLモデルは、クエリ上で各候補メソッドのリコールを予測する。
我々のルータは,5つの検証データセットのすべてに対して,最先端のリコールとQPSバランスを実現していることを示す。
- 参考スコア(独自算出の注目度): 2.121524887011041
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Filtered ANN search, which combines vector similarity with attribute predicates, is a core primitive in modern vector databases and retrieval-augmented generation. We benchmark all major categorical filtered ANN methods across multiple datasets under three predicates and find that no single method dominates. Moreover, even within a single dataset and predicate type, the best method for a query can vary. Therefore, we propose a query-aware routing framework. A lightweight ML model predicts each candidate method's recall on the query, and the router consults an offline benchmark table that maps every method and parameter setting to its measured recall and QPS, then selects the method with the best recall--QPS trade-off. Our ablation study narrows 22 candidate features to a minimal set of three and we adopt regression rather than classification as the prediction target to sharpen accuracy. Our model is trained on six real-world datasets and applied to five unseen validation datasets. The final result shows that our router achieves state-of-the-art recall and QPS balance across all five validation datasets compared to existing filtered ANN baselines, while incurring negligible latency overhead.
- Abstract(参考訳): ベクトル類似性を属性述語と組み合わせたフィルタANN探索は、現代のベクトルデータベースと検索拡張生成におけるコアプリミティブである。
我々は、3つの述語の下で複数のデータセットにまたがる主要な分類的フィルタANN手法をベンチマークし、どの手法も支配的でないことを発見した。
さらに、単一のデータセットと述語型内であっても、クエリに最適なメソッドは様々である。
そこで本研究では,クエリ対応のルーティングフレームワークを提案する。
軽量MLモデルは、クエリ上で各候補メソッドのリコールを予測し、ルータは、すべてのメソッドとパラメータ設定を測定されたリコールとQPSにマッピングするオフラインベンチマークテーブルを参照し、そのメソッドを最良のリコール-QPSトレードオフで選択する。
本研究は,22の候補特徴を3つの最小セットに絞り込み,精度を高めるために,予測対象として分類よりも回帰を取り入れた。
我々のモデルは6つの実世界のデータセットで訓練され、5つの未知の検証データセットに適用されます。
最終結果は,既存のフィルタされたANNベースラインと比較して,5つのバリデーションデータセットのすべてに対して,最新のリコールとQPSバランスを実現すると同時に,無視可能な遅延オーバーヘッドを発生させることを示す。
関連論文リスト
- EEVEE: Towards Test-time Prompt Learning in the Real World for Self-Improving Agents [64.96332056338923]
EEVEEは、LLMエージェントのための最初のマルチデータセットテスト時プロンプト学習フレームワークである。
実世界のタスクストリーム下でテスト時のプロンプト学習を可能にする。
EEVEEはQwen3-4B-InstructとDeepSeek-V3.2で平均マルチベンチマークスコアを10.38点、24.32点改善している。
論文 参考訳(メタデータ) (2026-06-09T17:57:16Z) - Retriever Portfolios: A Principled Approach to Adaptive RAG [30.668406304237404]
そこで本研究では,対象クエリ分布の異なる領域をカバーするために,候補の大規模プールから,少数の多種多様なサブセットを自動的に選択する手法を提案する。
複数のQAベンチマークを通じて、学習したポートフォリオとルータパイプラインは、一貫してシングルリレーバとナイーブなマルチリレーバベースラインを上回っています。
論文 参考訳(メタデータ) (2026-05-29T11:43:05Z) - Filtered Approximate Nearest Neighbor Search in Vector Databases: System Design and Performance Analysis [0.5249805590164902]
Filtered Approximate Nearest Neighbor Search (FANNS) は、セマンティック検索とメタデータの制約を組み合わせるために用いられる。
本研究では,フィルタリング戦略の分類を体系化し,それらのベクトルへの統合性を評価する。
実験の結果,エンジン内のアルゴリズム適応がしばしば生のインデックス性能を上回ることがわかった。
論文 参考訳(メタデータ) (2026-02-11T23:40:26Z) - Routing with Generated Data: Annotation-Free LLM Skill Estimation and Expert Selection [70.73201284835498]
RGDは、ルータが生成されたクエリと回答のみに基づいてトレーニングされる、困難な設定である。
クエリ・アンサー・ルータ(クエリとラベルの両方を用いて)とクエリのみのルータを4つのベンチマークと12のモデルで評価する。
コンセンサス投票によってモデルの正しさを推定し,階層クラスタリングによるモデル固有のスキルニッチを識別する新しいクエリ専用ルータであるCASCALを提案する。
論文 参考訳(メタデータ) (2026-01-14T18:43:32Z) - Benchmarking Filtered Approximate Nearest Neighbor Search Algorithms on Transformer-based Embedding Vectors [18.796661826646616]
Filtered Approximate Nearest Neighbor Search (FANNS) は、フィルタされた近似Nearest Neighbor Search (FANNS) と呼ばれる問題である。
本稿では, FANNS手法の総合的な調査と分類について紹介し, それらが文献でどのようにベンチマークされているか分析する。
本稿では、arXivリポジトリから270万以上の研究論文を要約したベクトルを埋め込んだ新しいデータセットについて紹介する。
論文 参考訳(メタデータ) (2025-07-29T16:39:54Z) - Causal LLM Routing: End-to-End Regret Minimization from Observational Data [3.3580884064577616]
LLMルーティングは、クエリ毎に最も適切なモデルを選択することを目的としている。
従来のアプローチでは、メトリクスを最初に予測し、モデルがこれらの見積に基づいて選択される、分離された戦略が一般的だった。
観測データから意思決定の後悔を最小化してルーティングポリシーを学習する因果的エンドツーエンドフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-21T21:34:18Z) - Salience DETR: Enhancing Detection Transformer with Hierarchical Salience Filtering Refinement [19.277560848076984]
2段階の選択戦略は、選択したクエリとオブジェクトのミスマッチによるスケールバイアスと冗長性をもたらす。
本稿では,フィルタされた識別クエリのみにトランスフォーマーを符号化する階層型サリエンスフィルタリング精細化を提案する。
提案されたSalience DETRは、課題固有の3つのデータセットに対して、+4.0% AP、+0.2% AP、+4.4% APを大幅に改善する。
論文 参考訳(メタデータ) (2024-03-24T13:01:57Z) - DST-Det: Simple Dynamic Self-Training for Open-Vocabulary Object Detection [72.25697820290502]
この研究は、ゼロショット分類によって潜在的に新しいクラスを特定するための単純かつ効率的な戦略を導入する。
このアプローチは、アノテーションやデータセット、再学習を必要とせずに、新しいクラスのリコールと精度を高めるセルフトレーニング戦略として言及する。
LVIS、V3Det、COCOを含む3つのデータセットに対する実証的な評価は、ベースラインのパフォーマンスを大幅に改善したことを示している。
論文 参考訳(メタデータ) (2023-10-02T17:52:24Z) - Zero-Shot Listwise Document Reranking with a Large Language Model [58.64141622176841]
本稿では,タスク固有の学習データを用いることなく,言語モデル(LRL)を用いたリスワイズ・リランカを提案する。
3つのTRECウェブサーチデータセットの実験により、LRLは第1段検索結果の再ランク付け時にゼロショットポイントワイズ法より優れるだけでなく、最終段再ランカとしても機能することが示された。
論文 参考訳(メタデータ) (2023-05-03T14:45:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。