論文の概要: IVF-TQ: Streaming-Robust Approximate Nearest Neighbor Search via a Codebook-Free Residual Layer
- arxiv url: http://arxiv.org/abs/2605.17415v1
- Date: Sun, 17 May 2026 12:22:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.007212
- Title: IVF-TQ: Streaming-Robust Approximate Nearest Neighbor Search via a Codebook-Free Residual Layer
- Title(参考訳): IVF-TQ:Codebook-Free Residual Layerによるストリーミングロバスト近似近傍探索
- Authors: Tarun Sharma,
- Abstract要約: コードブックのない残留層を持つIVF指数:固定ランダム回転に続いて、予備計算されたロイド-マックススカラー量子化。
IVF-TQはトレーニング済みのANNインデックス(PQ、OPQ、ScaNN)のキー障害モードを大幅に削減する。
- 参考スコア(独自算出の注目度): 3.0458514384586404
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose IVF-TQ, an IVF index with a codebook-free residual layer: a fixed random rotation followed by precomputed Lloyd-Max scalar quantization depending only on (b, d). Only the IVF coarse partition is trained. Building on TurboQuant (Zandieh et al., 2025), the design substantially reduces a key failure mode of trained-codebook ANN indexes (PQ, OPQ, ScaNN): staleness under streaming ingestion.Empirical (3 seeds): Per-batch PQ retraining does not recover the streaming gap at any tested bit budget (paired-t p > 0.28 everywhere). On streaming Deep-10M, IVF-TQ holds at 87.4% -> 86.6% (Delta = -0.80 +/- 0.10pp) while IVF-PQ degrades -3.23pp. A shuffled-i.i.d. control on SIFT-1M shows IVF-PQ losing -3.9pp without distribution shift. At higher PQ bit budgets (~1.5x IVF-TQ memory), absolute recall favors PQ as expected from rate-distortion (+6.1pp Deep-10M; +2.0pp SIFT-10M); the durable IVF-TQ benefit is operational (no codebook to retrain), robust across memory regimes.Prior art: IVF around a codebook-free residual quantizer is architecturally not new -- IVF-RaBitQ ships in Milvus, cuVS, LanceDB, Weaviate; Shi et al. (2026) is concurrent GPU work. TurboQuant itself tests only flat-rotation ANN.Contributions: (i) A multi-seed streaming-operational story for codebook-free IVF: 10M-scale evidence across PQ memory budgets. (ii) A uniform-over-sphere IP-error bound for the TQ residual quantizer with one fixed rotation (proof sketch in v1; rigorous in v2). (iii) Adaptive IVF-TQ: a partition-only refresh recovering 67% -> 97.8% under worst-case rotation shift with re-ranking (90.3% without).Code, data: https://github.com/tarun-ks/turboquant_search
- Abstract(参考訳): コードブックのない残留層を持つIVF指数IVF-TQを提案する。
IVFの粗いパーティションのみが訓練される。
TurboQuant (Zandieh et al , 2025) 上に構築されたこの設計は、トレーニング済みコードブック ANN インデックス (PQ, OPQ, ScaNN) の重要な障害モードを大幅に削減する。
ストリーミングのDeep-10Mでは、IVF-TQは87.4%から86.6%(Delta = -0.80 +/- 0.10pp)、IVF-PQは-3.23ppである。
SIFT-1MのシャッフルI.d.制御は、分布シフトなしでIVF-PQが-3.9pp低下していることを示している。
高いPQビット予算(~1.5x IVF-TQメモリ)では、絶対リコールは、レート歪み(+6.1pp Deep-10M; +2.0pp SIFT-10M)から期待されるPQを好んでおり、耐久性のあるIVF-TQの利点は動作し(リトレーニングのためのコードブックなし)、メモリレシシ間で堅牢である。
TurboQuant 自身はフラットローテーション ANN のみをテストしている。
(i)PQメモリ予算にまたがる10万件の証拠を,コードブックフリーなIVFのためのマルチシリーズストリーミング運用ストーリー。
(II)1つの固定回転を持つTQ残差量子化器(v1 では防御スケッチ、v2 では厳密なスケッチ)に対する一様超球IPエラー。
三 適応IVF-TQ 分割のみリフレッシュ 67% ->97.8% 最悪の回転シフトで再ランク(90.3% なし)。
コード、データ:https://github.com/tarun-ks/turboquant_search
関連論文リスト
- Continuous First, Discrete Later: VQ-VAEs Without Dimensional Collapse [63.31488859236551]
我々は、次元の崩壊が様々なコードブック改善技術が上回らないようなハードロスの低い境界を生じることを理論的かつ実証的に示す。
本稿では,VQを導入する前に,不適切な自動エンコーダとしてモデルを訓練する「ウォームアップフェーズ」を提案する。
合成実験と大規模画像 (VQGAN) とオーディオ (WavTokenizer) VQ-VAEs の両方において, AE Warm-Up が表現次元の復元に成功したことを示す。
論文 参考訳(メタデータ) (2026-05-07T19:13:20Z) - Quantum Kernel Advantage over Classical Collapse in Medical Foundation Model Embeddings [5.903606299014097]
MIMIC-C胸部X線写真における2次保険分類におけるノイズレスシミュレーションによる量子優位性の証拠を提供する。
両分類器が同一の機能を持つ2層公正比較フレームワークを提案する。
固有解析により、量子核有効ランクは q = 11 で 69.80 に達する。
論文 参考訳(メタデータ) (2026-04-27T15:21:53Z) - Differentiable Vector Quantization for Rate-Distortion Optimization of Generative Image Compression [53.041405703471895]
低ビットレート画像圧縮のためのエンドツーエンドRD最適化を実現する統一フレームワークRDVQを提案する。
我々は,正確なエントロピーモデリングとテスト時間率制御をサポートする自己回帰エントロピーモデルを開発した。
RD2K-valと比較すると、RDVQは DisTSで75.71%、DIV2K-valでLPIPSで37.63%減少する。
論文 参考訳(メタデータ) (2026-04-12T09:25:24Z) - Detecting Neurovascular Instability from Multimodal Physiological Signals Using Wearable-Compatible Edge AI: A Responsible Computational Framework [0.0]
ウェアラブル互換の生理信号から神経血管不安定性(NVI)を検出するためのマルチモーダルMLフレームワークであるMeraguardを提案する。
毎年1220万回のインシデントストロークで、連続したマルチモーダルな生理的モニタリングは、コミュニティスケールのスクリーニングへの実践的なパスを提供する。
論文 参考訳(メタデータ) (2026-03-20T19:17:46Z) - POVQA: Preference-Optimized Video Question Answering with Rationales for Data Efficiency [3.4998703934432682]
近年,VQAタスクには1500以上のフレームのコンテキストウィンドウが設けられている。
データ効率のよいパイプラインであるPOVQAを導入し、ビデオの各秒を1つの時間プール画像に圧縮する。
論文 参考訳(メタデータ) (2025-10-01T15:15:36Z) - Generalizable Diabetes Risk Stratification via Hybrid Machine Learning Models [0.0]
糖尿病は世界中で5億3700万人を超え、2045年までに7億8300万人に達すると予測されている。
2つのハイブリッド分類器を比較し、外部コホート上での一般化性を評価する。
論文 参考訳(メタデータ) (2025-09-24T21:18:52Z) - Scalable Training for Vector-Quantized Networks with 100% Codebook Utilization [60.294965457786844]
ベクトル量子化(VQ)は、画像生成のための離散トークン化器において重要な要素である。
VQBridgeは、地図関数法に基づく堅牢でスケーラブルで効率的なプロジェクタである。
FVQは262kのコードブックでも100%のコードブック利用が可能である。
論文 参考訳(メタデータ) (2025-09-12T11:08:21Z) - Quantize-then-Rectify: Efficient VQ-VAE Training [71.92014859992263]
この研究は、VAEの許容しきい値内の量子化ノイズによって、事前訓練されたVAEをVQ-VAEに効率的に変換できることを実証する。
我々は、事前学習されたVAEを利用して、最小計算オーバーヘッドで高速なVQ-VAEトレーニングを可能にするフレームワークである textbfQuantize-then-Rectify (ReVQ) を提案する。
論文 参考訳(メタデータ) (2025-07-14T17:59:41Z) - FIMA-Q: Post-Training Quantization for Vision Transformers by Fisher Information Matrix Approximation [55.12070409045766]
ポストトレーニング量子化(PTQ)は近年,費用対効果と有望なモデル圧縮パラダイムとして注目されている。
ビジョン変換器(ViT)の現在のPTQ法は、特に低ビット量子化において、精度が著しく低下している。
論文 参考訳(メタデータ) (2025-06-13T07:57:38Z) - Future frame prediction in chest cine MR imaging using the PCA respiratory motion model and dynamically trained recurrent neural networks [0.0]
肺放射線治療システムは、推定腫瘍位置の不確実性や健康な組織の高照射を引き起こす遅延を受ける。
この研究は、オンライン学習アルゴリズムで訓練されたRNNを用いて、胸部ダイナミックMRIシーケンスの将来のフレーム予測に対処し、その遅延を補償する。
論文 参考訳(メタデータ) (2024-10-08T10:21:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。