論文の概要: MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search
- arxiv url: http://arxiv.org/abs/2601.01930v1
- Date: Mon, 05 Jan 2026 09:23:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.94004
- Title: MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search
- Title(参考訳): MCGI:数十億ドル規模のディスクレジデントベクトル探索のためのマニフォールド一貫性グラフインデックス
- Authors: Dongfang Zhao,
- Abstract要約: MCGIは、探索戦略をデータ固有の幾何学に適応させる幾何学的・ディスクレジデントインデックス法である。
MCGIは5.8$times$高スループットを高次元GIST1Mでの95%リコールで達成し、最先端のDiskANNと比較した。
数十億ドル規模のSIFT1Bデータセット上では、MCGIは、標準の低次元データセットにおけるパフォーマンスの同等性を保ちながら、ハイリコールクエリレイテンシを3$times$に削減することで、そのスケーラビリティをさらに検証する。
- 参考スコア(独自算出の注目度): 0.9179857807576733
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Graph-based Approximate Nearest Neighbor (ANN) search often suffers from performance degradation in high-dimensional spaces due to the ``Euclidean-Geodesic mismatch,'' where greedy routing diverges from the underlying data manifold. To address this, we propose Manifold-Consistent Graph Indexing (MCGI), a geometry-aware and disk-resident indexing method that leverages Local Intrinsic Dimensionality (LID) to dynamically adapt search strategies to the data's intrinsic geometry. Unlike standard algorithms that treat dimensions uniformly, MCGI modulates its beam search budget based on in situ geometric analysis, eliminating dependency on static hyperparameters. Theoretical analysis confirms that MCGI enables improved approximation guarantees by preserving manifold-consistent topological connectivity. Empirically, MCGI achieves 5.8$\times$ higher throughput at 95\% recall on high-dimensional GIST1M compared to state-of-the-art DiskANN. On the billion-scale SIFT1B dataset, MCGI further validates its scalability by reducing high-recall query latency by 3$\times$, while maintaining performance parity on standard lower-dimensional datasets.
- Abstract(参考訳): グラフベースの近似ニアネバー (ANN) 探索は、下層のデータ多様体からグリージールーティングが分岐する 'ユークリッド-ジオデシックミスマッチ'' によって、高次元空間のパフォーマンス劣化に悩まされることが多い。
そこで本研究では,局所固有次元(LID)を利用してデータ固有の幾何に探索戦略を動的に適用する,幾何学的・ディスクレジデントインデックス手法であるManifold-Consistent Graph Indexing (MCGI)を提案する。
次元を均一に扱う標準的なアルゴリズムとは異なり、MCGIは位置幾何学的解析に基づいてビーム探索予算を変調し、静的ハイパーパラメータへの依存を排除している。
理論解析により、MCGIは、多様体に一貫性のあるトポロジカル接続を保ち、近似保証を改善することができることを確認した。
実証的に、MCGIは5.8$\times$高スループットを高次元のGIST1Mで95%のリコールで達成し、最先端のDiskANNと比較した。
数十億ドル規模のSIFT1Bデータセット上で、MCGIは、標準の低次元データセットにおけるパフォーマンスの同等性を保ちながら、ハイリコールクエリレイテンシを3$\times$に削減することで、そのスケーラビリティをさらに検証する。
関連論文リスト
- Lighter-X: An Efficient and Plug-and-play Strategy for Graph-based Recommendation through Decoupled Propagation [49.865020394064096]
我々は,既存のGNNベースのレコメンデータアーキテクチャとシームレスに統合可能な,効率的かつモジュール化されたフレームワークである textbfLighter-X を提案する。
提案手法は,基本モデルの理論的保証と経験的性能を保ちながら,パラメータサイズと計算複雑性を大幅に低減する。
実験の結果、Lighter-Xはパラメータが大幅に少ないベースラインモデルに匹敵するパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-10-11T08:33:08Z) - Empowering Graph-based Approximate Nearest Neighbor Search with Adaptive Awareness Capabilities [19.352675865525395]
本稿では,Adaptive Topology とQuery AwarEness を用いた GATE, High-tier Near Graph を提案する。
Gateは、最先端のグラフベースのインデックスと比較して、クエリパフォーマンスの1.2-2.0倍の高速化を実現している。
論文 参考訳(メタデータ) (2025-06-19T03:07:12Z) - Stitching Inner Product and Euclidean Metrics for Topology-aware Maximum Inner Product Search [21.295432955733197]
我々は、Metric-Amphibious Graph(MAG)と呼ばれる新しいグラフベースのインデックスと、それに対応する検索アルゴリズムAdaptive Navigation with Metric Switch(ANMS)を導入する。
これらの知見に基づいて,Metric-Amphibious Graph (MAG) とそれに対応する検索アルゴリズムAdaptive Navigation with Metric Switch (ANMS) を導入した。
論文 参考訳(メタデータ) (2025-04-21T05:01:58Z) - A Mapper Algorithm with implicit intervals and its optimization [0.3683202928838613]
Mapperアルゴリズムは、トポロジデータ解析において複雑な高次元データを可視化するための重要なツールである。
手動のパラメータチューニングと固定間隔、および固定オーバーラップ比の必要性は、標準的なMapperアルゴリズムの性能を損なう可能性がある。
隠れた代入行列を通して暗黙的に間隔を表す新しいフレームワークを導入する。
論文 参考訳(メタデータ) (2024-12-16T10:16:54Z) - Communication-Efficient Adam-Type Algorithms for Distributed Data Mining [93.50424502011626]
我々はスケッチを利用した新しい分散Adam型アルゴリズムのクラス(例:SketchedAMSGrad)を提案する。
我々の新しいアルゴリズムは、反復毎に$O(frac1sqrtnT + frac1(k/d)2 T)$の高速収束率を$O(k log(d))$の通信コストで達成する。
論文 参考訳(メタデータ) (2022-10-14T01:42:05Z) - ZARTS: On Zero-order Optimization for Neural Architecture Search [94.41017048659664]
微分可能なアーキテクチャサーチ (DARTS) は、NASの高効率性のため、一般的なワンショットパラダイムである。
この作業はゼロオーダーの最適化に変わり、上記の近似を強制せずに探索するための新しいNASスキームであるZARTSを提案する。
特に、12ベンチマークの結果は、DARTSの性能が低下するZARTSの顕著な堅牢性を検証する。
論文 参考訳(メタデータ) (2021-10-10T09:35:15Z) - Robust Training in High Dimensions via Block Coordinate Geometric Median
Descent [69.47594803719333]
幾何学的中央値 (textGm) は、未破損データのロバストな推定を達成するための統計学における古典的な方法である。
本稿では,テキストscGmを一度に選択した座標ブロックにのみ適用することにより,スムーズな非テキスト問題に対して0.5の分解点を保持することができることを示す。
論文 参考訳(メタデータ) (2021-06-16T15:55:50Z) - Spatial-Spectral Clustering with Anchor Graph for Hyperspectral Image [88.60285937702304]
本稿では、HSIデータクラスタリングのための空間スペクトルクラスタリングとアンカーグラフ(SSCAG)という新しい非監視アプローチを提案する。
提案されたSSCAGは最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-04-24T08:09:27Z) - Mix Dimension in Poincar\'{e} Geometry for 3D Skeleton-based Action
Recognition [57.98278794950759]
グラフ畳み込みネットワーク(GCN)はすでに、不規則なデータをモデル化する強力な能力を実証している。
本稿では,ポアンカー幾何学を用いて定義した空間時空間GCNアーキテクチャを提案する。
提案手法を,現在最大規模の2つの3次元データセット上で評価する。
論文 参考訳(メタデータ) (2020-07-30T18:23:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。