論文の概要: Breaking the Curse of Dimensionality: On the Stability of Modern Vector Retrieval
- arxiv url: http://arxiv.org/abs/2512.12458v1
- Date: Sat, 13 Dec 2025 21:05:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.267746
- Title: Breaking the Curse of Dimensionality: On the Stability of Modern Vector Retrieval
- Title(参考訳): 次元の曲線を破る:現代ベクトル検索の安定性について
- Authors: Vihan Lakshman, Blaise Munyampirwa, Julian Shun, Benjamin Coleman,
- Abstract要約: 現代のベクトルデータベースは、高次元のニューラル埋め込みによる効率的な検索を可能にする。
古典理論では、そのようなタスクは次元の呪いに苦しむべきであり、そこではポイント間の距離はほとんど区別できない。
我々は、このパラドックスを安定性のレンズを通して再検討し、クエリに対する小さな摂動が、隣り合う隣人を根本的に変更しないという特性について述べる。
- 参考スコア(独自算出の注目度): 11.107654260722692
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern vector databases enable efficient retrieval over high-dimensional neural embeddings, powering applications from web search to retrieval-augmented generation. However, classical theory predicts such tasks should suffer from the curse of dimensionality, where distances between points become nearly indistinguishable, thereby crippling efficient nearest-neighbor search. We revisit this paradox through the lens of stability, the property that small perturbations to a query do not radically alter its nearest neighbors. Building on foundational results, we extend stability theory to three key retrieval settings widely used in practice: (i) multi-vector search, where we prove that the popular Chamfer distance metric preserves single-vector stability, while average pooling aggregation may destroy it; (ii) filtered vector search, where we show that sufficiently large penalties for mismatched filters can induce stability even when the underlying search is unstable; and (iii) sparse vector search, where we formalize and prove novel sufficient stability conditions. Across synthetic and real datasets, our experimental results match our theoretical predictions, offering concrete guidance for model and system design to avoid the curse of dimensionality.
- Abstract(参考訳): 現代のベクトルデータベースは、Web検索から検索拡張生成まで、高次元のニューラルネットワークによる効率的な検索を可能にする。
しかし古典理論では、そのようなタスクは次元の呪いに苦しむべきであり、そこでは点間の距離はほぼ区別不能になり、それによってより効率的な近接探索が妨げられる。
我々は、このパラドックスを安定性のレンズを通して再検討し、クエリに対する小さな摂動が、隣り合う隣人を根本的に変更しないという特性について述べる。
基礎的な結果に基づいて、我々は安定性理論を3つの重要な検索設定にまで拡張する。
(i) 一般的なチャンファー距離メートル法が単一ベクトル安定性を保ち、平均プールアグリゲーションがそれを破壊することを証明するマルチベクトル探索。
(II)フィルタベクターサーチでは,不一致フィルタに対する十分に大きな罰則が,基礎となる探索が不安定な場合でも安定性を誘導できることを示す。
(三)スパースベクトル探索(英語版)では、新しい十分な安定性条件を定式化し、証明する。
合成データと実データを含む実験結果は,我々の理論的予測と一致し,次元の呪いを避けるために,モデルとシステム設計の具体的なガイダンスを提供する。
関連論文リスト
- Robust Least-Squares Optimization for Data-Driven Predictive Control: A Geometric Approach [5.2456503500395275]
この幾何学的関係の不確実性はグラスマン多様体上の球としてモデル化される。
内部は閉形式解を認め、透明な幾何学的解釈を持つ効率的なアルゴリズムを可能にする。
論文 参考訳(メタデータ) (2025-11-12T12:02:14Z) - Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z) - Infinity Search: Approximate Vector Search with Projections on q-Metric Spaces [94.12116458306916]
我々は、$q$の測度空間において、計量木は三角形の不等式のより強いバージョンを活用でき、正確な探索の比較を減らすことができることを示した。
任意の異方性測度を持つデータセットを$q$-metric空間に埋め込む新しい射影法を提案する。
論文 参考訳(メタデータ) (2025-06-06T22:09:44Z) - OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - Efficient and Robust Point Cloud Registration via Heuristics-guided Parameter Search [44.774302677330105]
配置された3次元対応セットに基づいて6自由度で剛性変換を推定することは、点雲登録において決定的な手順である。
本稿では,高ロバスト性を維持しつつ,探索を高速化するパラメータ探索戦略を提案する。
我々の戦略は検索スペースを大幅に減らし、少数のインサイレントサンプルで精度を保証できる。
論文 参考訳(メタデータ) (2024-04-09T09:28:05Z) - MASSIVE: Tractable and Robust Bayesian Learning of Many-Dimensional
Instrumental Variable Models [8.271859911016719]
モデル不確実性を考慮した汎用的かつ効率的な因果推論アルゴリズムを提案する。
いくつかの候補が(近い)有効である限り、どの候補が先験的かを知ることなく、それらの集団が目標との相互作用に十分な制限を課し、信頼できる因果効果の推定を得る。
論文 参考訳(メタデータ) (2020-12-18T10:06:55Z) - ROME: Robustifying Memory-Efficient NAS via Topology Disentanglement and
Gradient Accumulation [106.04777600352743]
微分可能なアーキテクチャサーチ(DARTS)は、スーパーネット全体がメモリに格納されているため、メモリコストが大幅に低下する。
シングルパスのDARTSが登場し、各ステップでシングルパスのサブモデルのみを選択する。
メモリフレンドリーだが、計算コストも低い。
RObustifying Memory-Efficient NAS (ROME) と呼ばれる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-23T06:34:07Z) - High-Dimensional Robust Mean Estimation via Gradient Descent [73.61354272612752]
一定対向分数の存在下でのロバスト平均推定の問題は勾配降下によって解けることを示す。
我々の研究は、近辺の非補題推定とロバスト統計の間の興味深い関係を確立する。
論文 参考訳(メタデータ) (2020-05-04T10:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。