論文の概要: Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach
- arxiv url: http://arxiv.org/abs/2603.06660v1
- Date: Sun, 01 Mar 2026 21:57:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:12.604099
- Title: Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach
- Title(参考訳): 最新のAIのための近似近傍探索 : 投影拡張グラフアプローチ
- Authors: Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan Xiao,
- Abstract要約: Projection-Augmented Graph (PAG)は、プロジェクションテクニックをグラフインデックスに統合する新しいANNSフレームワークである。
3つのキーコンポーネントは、インデックスと検索を最適化するために、グラフインデックスに設計され、統合されている。
6つの現代的なデータセットの実験により、PAGは、常にQPS(QPS)-リコールパフォーマンスの優れたクエリを達成している。
- 参考スコア(独自算出の注目度): 6.012018272072795
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Approximate Nearest Neighbor Search (ANNS) is fundamental to modern AI applications. Most existing solutions optimize query efficiency but fail to align with the practical requirements of modern workloads. In this paper, we outline six critical demands of modern AI applications: high query efficiency, fast indexing, low memory footprint, scalability to high dimensionality, robustness across varying retrieval sizes, and support for online insertions. To satisfy all these demands, we introduce Projection-Augmented Graph (PAG), a new ANNS framework that integrates projection techniques into a graph index. PAG reduces unnecessary exact distance computations through asymmetric comparisons between exact and approximate distances as guided by projection-based statistical tests. Three key components are designed and unified to the graph index to optimize indexing and searching. Experiments on six modern datasets demonstrate that PAG consistently achieves superior query per second (QPS)-recall performance -- up to 5x faster than HNSW -- while offering fast indexing speed and moderate memory footprint. PAG remains robust as dimensionality and retrieval size increase and naturally supports online insertions.
- Abstract(参考訳): Approximate Nearest Neighbor Search (ANNS)は、現代のAIアプリケーションの基本である。
既存のソリューションのほとんどはクエリ効率を最適化するが、現代的なワークロードの実践的な要件に適合しない。
本稿では、クエリ効率の向上、高速インデックス化、メモリフットプリントの削減、高次元化へのスケーラビリティ、検索サイズの変化による堅牢性、オンライン挿入のサポートなど、現代のAIアプリケーションにおける6つの重要な要件を概説する。
これらの要求をすべて満たすため、投影手法をグラフインデックスに統合する新しいANNSフレームワークであるProjection-Augmented Graph (PAG)を導入する。
PAGはプロジェクションベースの統計テストによって導かれるように、正確距離と近似距離の非対称比較によって不要な正確な距離計算を減らす。
3つのキーコンポーネントは、インデックスと検索を最適化するために、グラフインデックスに設計され、統合されている。
6つの現代的なデータセットの実験によると、PAGは、高速インデックス化速度と適度なメモリフットプリントを提供しながら、常に優れたクエリ/秒(QPS)リコールパフォーマンス(HNSWの最大5倍高速)を達成する。
PAGは、次元と検索サイズが増大するにつれて頑健であり、オンライン挿入を自然にサポートする。
関連論文リスト
- FastLane: Efficient Routed Systems for Late-Interaction Retrieval [58.060096779432094]
FastLaneは、クエリを最も情報的な表現に動的にルーティングする新しい検索フレームワークである。
Approximate Nearest Neighbor Search (ANNS)で遅延処理モデルをブリッジすることで、FastLaneはスケーラブルで低レイテンシな検索を可能にする。
論文 参考訳(メタデータ) (2026-01-10T02:22:01Z) - From HNSW to Information-Theoretic Binarization: Rethinking the Architecture of Scalable Vector Search [0.7804710977378487]
本稿では,支配的な"HNSW + float32 + cosine similarity"スタックのアーキテクチャ的制約を分析する。
最大情報二項化(MIB)に基づく代替情報理論アーキテクチャの導入と実証評価を行った。
その結果,完全精度のシステムに匹敵する検索品質を示すとともに,レイテンシを大幅に低減し,高い要求レートで一定のスループットを維持することができた。
論文 参考訳(メタデータ) (2025-12-16T23:24:37Z) - Panorama: Fast-Track Nearest Neighbors [22.201421121801218]
本稿では,機械学習によるアプローチであるPANORAMAを提案する。
PANORAMAは、2-30$times$ end-to-end speedupをリコールロスなしで利用できることを示す。
論文 参考訳(メタデータ) (2025-10-01T06:38:45Z) - Empowering Graph-based Approximate Nearest Neighbor Search with Adaptive Awareness Capabilities [19.352675865525395]
本稿では,Adaptive Topology とQuery AwarEness を用いた GATE, High-tier Near Graph を提案する。
Gateは、最先端のグラフベースのインデックスと比較して、クエリパフォーマンスの1.2-2.0倍の高速化を実現している。
論文 参考訳(メタデータ) (2025-06-19T03:07:12Z) - Efficient Architecture Search via Bi-level Data Pruning [70.29970746807882]
この研究は、DARTSの双方向最適化におけるデータセット特性の重要な役割を探求する先駆者となった。
我々は、スーパーネット予測力学を計量として活用する新しいプログレッシブデータプルーニング戦略を導入する。
NAS-Bench-201サーチスペース、DARTSサーチスペース、MobileNetのようなサーチスペースに関する総合的な評価は、BDPがサーチコストを50%以上削減することを検証する。
論文 参考訳(メタデータ) (2023-12-21T02:48:44Z) - Flexible Channel Dimensions for Differentiable Architecture Search [50.33956216274694]
本稿では,効率的な動的チャネル割当アルゴリズムを用いた新しい微分可能なニューラルアーキテクチャ探索法を提案する。
提案するフレームワークは,タスク精度と推論遅延において,従来の手法と等価なDNNアーキテクチャを見つけることができることを示す。
論文 参考訳(メタデータ) (2023-06-13T15:21:38Z) - Pruning-as-Search: Efficient Neural Architecture Search via Channel
Pruning and Structural Reparameterization [50.50023451369742]
プルーニング・アズ・サーチ(Pruning-as-Search、PaS)は、必要なサブネットワークを自動的に効率的に検索するエンドツーエンドのプルーニング手法である。
提案したアーキテクチャは,ImageNet-1000分類タスクにおいて,1.0%$ Top-1精度で先行技術より優れていた。
論文 参考訳(メタデータ) (2022-06-02T17:58:54Z) - ViPNAS: Efficient Video Pose Estimation via Neural Architecture Search [94.90294600817215]
高速なオンラインビデオポーズ推定のための空間的・時間的ネットワークに対する新しいニューラルネットワーク探索(NAS)手法(ViPNAS)を提案する。
空間レベルでは,ネットワーク深さ,幅,カーネルサイズ,グループ数,注目度などの5つの異なる次元の探索空間を慎重に設計する。
時間レベルでは、一連の時間的特徴融合から検索し、複数のビデオフレームの合計精度と速度を最適化する。
論文 参考訳(メタデータ) (2021-05-21T06:36:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。