Fugu-MT 論文翻訳(概要): AlayaLaser: Efficient Index Layout and Search Strategy for Large-scale High-dimensional Vector Similarity Search

論文の概要: AlayaLaser: Efficient Index Layout and Search Strategy for Large-scale High-dimensional Vector Similarity Search

arxiv url: http://arxiv.org/abs/2602.23342v1
Date: Thu, 26 Feb 2026 18:48:29 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-27 18:41:22.857128
Title: AlayaLaser: Efficient Index Layout and Search Strategy for Large-scale High-dimensional Vector Similarity Search
Title（参考訳）: AlayaLaser:大規模高次元ベクトル類似性探索のための効率的なインデックスレイアウトと探索戦略
Authors: Weijian Chen, Haotian Liu, Yangshen Deng, Long Xiang, Liang Huang, Gezi Li, Bo Tang,
Abstract要約: AlayaLaserは、大規模高次元ベクトル類似性探索のための効率的なオンディスクグラフベースのインデックスシステムである。 AlayaLaserは、既存のオンディスクグラフベースのインデックスシステムを上回るだけでなく、インメモリインデックスシステムのパフォーマンスにもマッチする。
参考スコア（独自算出の注目度）: 23.738568440013584
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: On-disk graph-based approximate nearest neighbor search (ANNS) is essential for large-scale, high-dimensional vector retrieval, yet its performance is widely recognized to be limited by the prohibitive I/O costs. Interestingly, we observed that the performance of on-disk graph-based index systems is compute-bound, not I/O-bound, with the rising of the vector data dimensionality (e.g., hundreds or thousands). This insight uncovers a significant optimization opportunity: existing on-disk graph-based index systems universally target I/O reduction and largely overlook computational overhead, which leaves a substantial performance improvement space. In this work, we propose AlayaLaser, an efficient on-disk graph-based index system for large-scale high-dimensional vector similarity search. In particular, we first conduct performance analysis on existing on-disk graph-based index systems via the adapted roofline model, then we devise a novel on-disk data layout in AlayaLaser to effectively alleviate the compute-bound, which is revealed by the above roofline model analysis, by exploiting SIMD instructions on modern CPUs. We next design a suite of optimization techniques (e.g., degree-based node cache, cluster-based entry point selection, and early dispatch strategy) to further improve the performance of AlayaLaser. We last conduct extensive experimental studies on a wide range of large-scale high-dimensional vector datasets to verify the superiority of AlayaLaser. Specifically, AlayaLaser not only surpasses existing on-disk graph-based index systems but also matches or even exceeds the performance of in-memory index systems.
Abstract（参考訳）: On-disk graph-based Near Near Near Search (ANNS) は大規模で高次元のベクトル探索に不可欠であるが、その性能は禁止的なI/Oコストによって制限されていると広く認識されている。興味深いことに、オンディスクグラフベースのインデックスシステムの性能は、I/Oバウンドではなく計算バウンドであり、ベクトルデータ次元の上昇(例えば、数百、数千)が観察された。既存のオンディスクグラフベースのインデックスシステムは、I/O削減を普遍的に目標とし、計算オーバーヘッドをほとんど見落としているため、かなりのパフォーマンス改善スペースを残している。本研究では,大規模高次元ベクトル類似性探索のための効率的なオンディスクグラフベースインデックスシステムであるAlayaLaserを提案する。特に,本研究では,適応型ルーフラインモデルを用いて既存のオンディスクグラフベースインデックスシステムの性能解析を行い,最新のCPU上でSIMD命令を利用することで,上述のルーフラインモデル解析によって明らかにされた計算バウンドを効果的に緩和する,新しいオンディスクデータレイアウトをアラヤラザーで考案する。次に、AlayaLaserの性能をさらに向上させる最適化手法(次は学位ベースのノードキャッシュ、クラスタベースのエントリポイント選択、早期ディスパッチ戦略など)を設計する。最後に,AlayaLaserの優位性を検証するため,大規模高次元ベクトルデータセットの広範な実験を行った。具体的には、AlayaLaserは既存のオンディスクグラフベースのインデックスシステムを超えるだけでなく、インメモリインデックスシステムのパフォーマンスにマッチする。

関連論文リスト

GPU-Accelerated Algorithms for Graph Vector Search: Taxonomy, Empirical Study, and Research Directions [54.570944939061555]
本稿では,GPU加速グラフに基づくベクトル探索アルゴリズムについて包括的に研究する。我々は、GPU最適化戦略の詳細な分類を確立し、アルゴリズムタスクとハードウェア実行ユニット間のマッピングを明確にする。我々の発見は、スケーラブルで堅牢なGPUベースの近接検索システムを設計するための明確なガイドラインを提供する。
論文参考訳（メタデータ） (2026-02-10T16:18:04Z)
Text Anomaly Detection with Simplified Isolation Kernel [58.13924648777626]
2段階のアプローチでは、事前訓練された大きな言語モデル埋め込みと異常検出を組み合わせている。大規模言語モデルによって抽出された高次元密度埋め込みは、かなりのメモリ要件と高い計算時間のために課題を提起する。本稿では,高次元密度埋め込みを低次元スパース表現にマッピングする簡易分離カーネル(SIK)を提案する。
論文参考訳（メタデータ） (2025-10-15T06:35:54Z)
Scalable Disk-Based Approximate Nearest Neighbor Search with Page-Aligned Graph [3.994346326254537]
本稿では,ディスクベースの近接探索(ANNS)フレームワークであるPageANNを提案する。その結果、PageANNは最先端(SOTA)ディスクベースのANNS法を著しく上回り、1.85x-10.83倍のスループット、51.7%-91.9%のレイテンシを異なるデータセットとメモリ予算で達成した。
論文参考訳（メタデータ） (2025-09-29T20:44:13Z)
LODGE: Level-of-Detail Large-Scale Gaussian Splatting with Efficient Rendering [75.67501939005119]
メモリ制約デバイス上での3次元ガウススプラッティングのための新しいレベル・オブ・ディーテール(LOD)法を提案する。カメラ距離に基づいてガウスの最適部分集合を反復的に選択する。本手法は,屋外(階層型3DGS)と屋内(Zip-NeRF)の両方で最先端の性能を実現する。
論文参考訳（メタデータ） (2025-05-29T06:50:57Z)
Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文参考訳（メタデータ） (2025-05-20T06:44:34Z)
HAKES: Scalable Vector Database for Embedding Search Service [16.034584281180006]
我々は,並列な読み書きワークロード下で高いスループットと高いリコールを実現するベクトルデータベースを構築した。我々のインデックスは、高リコール領域と同時読み書きワークロード下でインデックスベースラインより優れています。 nameysはスケーラブルで、ベースラインよりも最大16タイムで高いスループットを実現します。
論文参考訳（メタデータ） (2025-05-18T19:26:29Z)
VectorLiteRAG: Latency-Aware and Fine-Grained Resource Partitioning for Efficient RAG [2.0929459605817193]
Retrieval-Augmented Generation (RAG) システムは、ベクトル類似性探索と大言語モデル(LLM)を組み合わせてコンテキスト対応の応答を提供する。本稿では,VectorLiteRAGを提案する。VectorLiteRAGは,追加のハードウェアリソースを必要とせず,遅延に順応する推論を実現する。
論文参考訳（メタデータ） (2025-04-11T19:18:41Z)
RetrievalAttention: Accelerating Long-Context LLM Inference via Vector Retrieval [24.472784635757016]
RetrievalAttentionは、注意計算を高速化し、GPUメモリ消費を減らすためのトレーニング不要のアプローチである。 RetrievalAttentionは1-3%のデータのみを必要としながら、ほぼ全注意精度を達成できることを示す。
論文参考訳（メタデータ） (2024-09-16T17:59:52Z)
Similarity search in the blink of an eye with compressed indices [3.39271933237479]
グラフベースのインデックスは現在、数十億の類似性検索において、最高のパフォーマンス技術である。より高速でより小さなグラフベースのインデックスを作成するための新しい手法とシステムを提案する。
論文参考訳（メタデータ） (2023-04-07T23:10:39Z)
Benchmarking Node Outlier Detection on Graphs [90.29966986023403]
グラフの外れ値検出は、多くのアプリケーションにおいて、新しいが重要な機械学習タスクである。 UNODと呼ばれるグラフに対して、最初の包括的教師なしノード外乱検出ベンチマークを示す。
論文参考訳（メタデータ） (2022-06-21T01:46:38Z)
ZARTS: On Zero-order Optimization for Neural Architecture Search [94.41017048659664]
微分可能なアーキテクチャサーチ (DARTS) は、NASの高効率性のため、一般的なワンショットパラダイムである。この作業はゼロオーダーの最適化に変わり、上記の近似を強制せずに探索するための新しいNASスキームであるZARTSを提案する。特に、12ベンチマークの結果は、DARTSの性能が低下するZARTSの顕著な堅牢性を検証する。
論文参考訳（メタデータ） (2021-10-10T09:35:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。