論文の概要: Mycelium-Index: A Streaming Approximate Nearest Neighbor Index with Myelial Edge Decay, Traffic-Driven Reinforcement, and Adaptive Living Hierarchy
- arxiv url: http://arxiv.org/abs/2604.11274v1
- Date: Mon, 13 Apr 2026 10:30:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.473198
- Title: Mycelium-Index: A Streaming Approximate Nearest Neighbor Index with Myelial Edge Decay, Traffic-Driven Reinforcement, and Adaptive Living Hierarchy
- Title(参考訳): Mycelium-Index: Myelial Edge Decay, Traffic-Driven Reinforcement, Adaptive Living Hierarchyを備えたストリーミング近似Nearest Neighbor Index
- Authors: Anton Pakhunov,
- Abstract要約: 我々は,高次元ベクトル空間に対するANN指数であるMycelium-indexを提示する。
システムはそのトポロジーを、ミエラルエッジ崩壊と強化、交通駆動型生活階層、ハイブリッド削除を通じて適応する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present mycelium-index, a streaming approximate nearest neighbor (ANN) index for high-dimensional vector spaces, inspired by the adaptive growth patterns of biological mycelium. The system continuously adapts its topology through myelial edge decay and reinforcement, a traffic-driven living hierarchy, and hybrid deletion combining O(1) bypass for cold nodes with O(k) beam-search repair for hub nodes. Experimental evaluation on SIFT-1M demonstrates that mycelium achieves 0.927 +/- 0.028 recall@5 under FreshDiskANN's 100%-turnover benchmark protocol -- within the measurement confidence interval of FreshDiskANN's ~0.95 -- while using 5.7x less RAM (88 MB vs. >500 MB) and achieving 4.7x higher QPS (2,795 vs. ~600). On the static index, at ef=192, mycelium matches HNSW M=16 recall (0.962 vs. 0.965) at 5.2x less RAM (163 MB vs. 854 MB). Performance optimizations including NEON SIMD distance computation, Vec-backed node storage, and bitset visited tracking yield a cumulative 2.7x QPS improvement. A systematic study of ten streaming repair mechanisms finds that geometric heuristics universally fail in high dimensions, while topological mechanisms succeed -- a principle we term the topological repair invariance of high-dimensional ANN graphs.
- Abstract(参考訳): 我々は, 生物菌の適応的成長パターンに着想を得た, 高次元ベクトル空間に対するANN(stream near Near Near Near Near Near(英語版))指標である菌糸体インデックスを提示する。
このシステムは, 寒冷ノードのO(1)バイパスとハブノードのO(k)ビーム探索修復を組み合わせた, トラフィック駆動型生活階層, ハイブリッド削除により, そのトポロジーを連続的に適応させる。
SIFT-1Mの実験的評価では、マイセリウムはフレッシュディスクANNの100%ターンオーバーベンチマークプロトコルで0.927 +/- 0.028リコール@5を、フレッシュディスクANNの0.95の計測信頼区間内で達成し、5.7倍のRAM(88MB vs >500MB)を使用し、4.7倍のQPS(2,795 vs. ~600)を達成した。
静的インデックスでは、ef=192で、ミセリウムはHNSW M=16リコール(0.962 vs. 0.965)と5.2倍のRAM(163 MB vs. 854 MB)と一致する。
NEON SIMD距離計算、Vecバックアップノードストレージ、ビットセット訪問追跡などの性能最適化は累積2.7倍QPSの改善をもたらす。
10個のストリーミング修復機構の体系的研究は、幾何学的ヒューリスティックが高次元で普遍的に失敗するのに対して、位相的機構は成功し、この原理は高次元のANNグラフのトポロジ的修復不変性(topological repair invariance)と呼ぶ。
関連論文リスト
- Resource-Efficient Iterative LLM-Based NAS with Feedback Memory [49.44875022114861]
ニューラルアーキテクチャサーチ(NAS)はネットワーク設計を自動化するが、従来の手法ではかなりの計算資源を必要とする。
本稿では,大規模言語モデル(LLM)を活用して,畳み込みニューラルネットワークアーキテクチャを反復的に生成し,評価し,洗練するクローズドループパイプラインを提案する。
論文 参考訳(メタデータ) (2026-03-12T16:00:22Z) - ECHO: Encoding Communities via High-order Operators [8.970269049715933]
トポロジ的アルゴリズムは意味的特徴を無視し、グラフニューラルネットワーク(GNN)は壊滅的な計算ボトルネックに直面している。
コミュニティ検出を適応的でマルチスケールの拡散プロセスとして再構成する,スケーラブルで自己管理型のアーキテクチャであるECHOを紹介する。
ECHOは、グローバル勾配の数学的精度を犠牲にすることなく、従来のO(N2)メモリボトルネックを完全にバイパスする。
論文 参考訳(メタデータ) (2026-02-25T22:14:29Z) - Reranker Optimization via Geodesic Distances on k-NN Manifolds [0.0]
我々は,k-アネレスト近傍(k-NN)方程式上の測地距離を計算する幾何学的階乗法であるManiscopeを提案する。
Maniscopeは、最も難しい3つのデータセットにおいて、HNSWグラフベースのベースラインを上回っている。
クロスエンコーダのリランカと比較して、Maniscopeは10~45倍のレイテンシで2%の精度で実現している。
論文 参考訳(メタデータ) (2026-01-26T07:55:08Z) - Warp-Cortex: An Asynchronous, Memory-Efficient Architecture for Million-Agent Cognitive Scaling on Consumer Hardware [0.0]
Warp Cortexは、理論的には百万単位の認知スケーリングを可能にする非同期アーキテクチャである。
計算遅延がボトルネックになる前に、100個の並行エージェントを2.2GBの全VRAMで実証し、理論的能力は1,000個を超えることを示した。
さらに,非侵入的KV-cache更新機構であるReferential Injectionを導入する。
論文 参考訳(メタデータ) (2026-01-03T23:11:21Z) - Geminet: Learning the Duality-based Iterative Process for Lightweight Traffic Engineering in Changing Topologies [53.38648279089736]
Geminetは軽量でスケーラブルなMLベースのTEフレームワークで、トポロジの変更を処理できる。
そのニューラルネットワークサイズは、既存のスキームの0.04%から7%に過ぎない。
大規模なトポロジでトレーニングすると、Geminetは10ギB未満のメモリを消費し、HARPが要求する80ギBの8倍以下である。
論文 参考訳(メタデータ) (2025-06-30T09:09:50Z) - A Topological Perspective on Demystifying GNN-Based Link Prediction
Performance [72.06314265776683]
トポロジカル濃度 (TC) は、各ノードの局所部分グラフと隣人の部分グラフの交点に基づいている。
また,TCLは,次数や部分グラフ密度などの他のノードレベルのトポロジ指標よりもLP性能と高い相関性を示した。
我々は, 近似トポロジカル濃度 (ATC) を提案し, 理論的・経験的にTC近似の有効性を正当化し, 複雑さを低減させる。
論文 参考訳(メタデータ) (2023-10-06T22:07:49Z) - Dink-Net: Neural Clustering on Large Graphs [59.10189693120368]
ディープグラフクラスタリング法 (Dink-Net) は, 拡張と縮小という概念を用いて提案される。
ノードを識別することにより、拡張によって劣化しても、表現は自己教師された方法で学習される。
クラスタリング分布は、提案したクラスタ拡張損失とクラスタ縮小損失を最小化することにより最適化される。
ランナアップと比較して、Dink-Net 9.62%は1100万ノードと16億エッジを持つogbn-papers100MデータセットでNMIの改善を実現している。
論文 参考訳(メタデータ) (2023-05-28T15:33:24Z) - Improving Dual-Encoder Training through Dynamic Indexes for Negative
Mining [61.09807522366773]
本稿では,ソフトマックスを証明可能な境界で近似し,木を動的に維持するアルゴリズムを提案する。
我々は,2000万以上のターゲットを持つデータセットについて検討し,オラクル・ブルート力負の鉱業に関して,誤差を半分に削減した。
論文 参考訳(メタデータ) (2023-03-27T15:18:32Z) - Scaling Up 3D Kernels with Bayesian Frequency Re-parameterization for
Medical Image Segmentation [25.62587471067468]
RepUX-Netは、単純な大きなカーネルブロック設計を持つ純粋なCNNアーキテクチャである。
人間の視覚系における空間周波数にインスパイアされ、カーネル収束を要素的設定に変化させるよう拡張する。
論文 参考訳(メタデータ) (2023-03-10T08:38:34Z) - Efficient Cluster-Based k-Nearest-Neighbor Machine Translation [65.69742565855395]
k-Nearest-Neighbor Machine Translation (kNN-MT)は、最近、ニューラルネットワーク翻訳(NMT)におけるドメイン適応のための非パラメトリックソリューションとして提案されている。
論文 参考訳(メタデータ) (2022-04-13T05:46:31Z) - Res-GCNN: A Lightweight Residual Graph Convolutional Neural Networks for
Human Trajectory Forecasting [0.0]
ペデストリアンの対話的挙動をモデル化した残差グラフ畳み込みニューラルネットワーク(Res-GCNN)を提案する。
その結果、最終変位誤差(FDE)が0.65mに達すると、アートの状態を13.3%改善することが示された。
コードはGitHubで公開されている。
論文 参考訳(メタデータ) (2020-11-18T11:18:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。