論文の概要: IVF-TQ: Calibration-Free Streaming Vector Search via a Codebook-Free Residual Layer
- arxiv url: http://arxiv.org/abs/2605.17415v2
- Date: Fri, 22 May 2026 14:31:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:19.985494
- Title: IVF-TQ: Calibration-Free Streaming Vector Search via a Codebook-Free Residual Layer
- Title(参考訳): IVF-TQ: Codebook-Free Residual Layer によるキャリブレーションフリーなストリームベクトル探索
- Authors: Tarun Sharma,
- Abstract要約: IVF-TQは、残差圧縮層がデータに依存しない逆ファイルインデックスである。
球面内積誤差は (b, d, delta) にのみ依存し、学習コードブック法が許容しない構造的保証を与える。
- 参考スコア(独自算出の注目度): 3.0458514384586404
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Approximate nearest neighbor (ANN) indexes deployed against streaming corpora silently lose recall over weeks. The standard diagnosis is distribution shift, but under shuffled-i.i.d. ingestion -- no shift at all -- product quantization still degrades -3.8pp at sub-matched bit budgets. The dominant production compression methods (PQ, OPQ, ScaNN) all fit a codebook to an initial sample and reuse it as the database grows by orders of magnitude. This paper presents IVF-TQ, an inverted-file index whose residual compression layer is data-independent: a fixed random rotation followed by a precomputed Lloyd-Max scalar quantizer parameterised only by the bit width b and dimension d. Only the IVF coarse k-means partition is trained. A uniform-over-sphere inner-product error bound depending only on (b, d, delta) provides a structural guarantee no learned-codebook method admits. The same codebook-free design enables an IVF-amplification effect that closes the gap to Extended RaBitQ to within statistical noise (+17.7pp over flat TQ at matched bit budget), and an Adaptive variant that refreshes the partition without touching the compression layer. Across nine controlled cells (three 10M datasets, three PQ memory regimes, three seeds), per-batch PQ codebook retraining never recovers the streaming gap; IVF-PQ streaming stability requires per-dataset bit-budget tuning, while IVF-TQ holds at one fixed (b, d) configuration on all three datasets with Delta in [-0.80, +0.56]pp. The contribution is operational: no codebook to train, no per-dataset bit-budget tuning, no retraining cycle that ever closes the gap.
- Abstract(参考訳): ストリーミングコーパスに対してデプロイされた近似近傍インデックス(ANN)は、数週間にわたって静かにリコールを失う。
標準的な診断は、分布シフトであるが、シャッフル(すなわち、全くシフトしない)の摂取の下では、製品量子化は、サブマッチングビット予算でまだ-3.8pp が低下している。
主な生産圧縮手法(PQ、OPQ、ScaNN)は、コードブックを初期サンプルに適合させ、データベースが桁違いに大きくなるにつれて再利用する。
本稿では,残差圧縮層がデータ非依存である逆ファイル指数IVF-TQについて述べる。
IVFの粗いk平均分割のみが訓練される。
球面内積誤差は (b, d, delta) にのみ依存し、学習コードブック法が許容しない構造的保証を与える。
同じコードブックフリーな設計では、拡張RaBitQとのギャップを統計的ノイズ(一致したビット予算でフラットTQに+17.7pp)で埋めるIVF増幅効果と、圧縮層に触れることなくパーティションを更新するAdaptive variantが可能である。
9つの制御されたセル(3つの10Mデータセット、3つのPQメモリレジーム、3つのシード)、バッチごとのPQコードブックの再トレーニングはストリーミングギャップを回復しない。
トレーニングするコードブックも、データセットごとのビット予算チューニングも、ギャップを埋めるリトレーニングサイクルも、ありません。
関連論文リスト
- Continuous First, Discrete Later: VQ-VAEs Without Dimensional Collapse [63.31488859236551]
我々は、次元の崩壊が様々なコードブック改善技術が上回らないようなハードロスの低い境界を生じることを理論的かつ実証的に示す。
本稿では,VQを導入する前に,不適切な自動エンコーダとしてモデルを訓練する「ウォームアップフェーズ」を提案する。
合成実験と大規模画像 (VQGAN) とオーディオ (WavTokenizer) VQ-VAEs の両方において, AE Warm-Up が表現次元の復元に成功したことを示す。
論文 参考訳(メタデータ) (2026-05-07T19:13:20Z) - Quantum Kernel Advantage over Classical Collapse in Medical Foundation Model Embeddings [5.903606299014097]
MIMIC-C胸部X線写真における2次保険分類におけるノイズレスシミュレーションによる量子優位性の証拠を提供する。
両分類器が同一の機能を持つ2層公正比較フレームワークを提案する。
固有解析により、量子核有効ランクは q = 11 で 69.80 に達する。
論文 参考訳(メタデータ) (2026-04-27T15:21:53Z) - Differentiable Vector Quantization for Rate-Distortion Optimization of Generative Image Compression [53.041405703471895]
低ビットレート画像圧縮のためのエンドツーエンドRD最適化を実現する統一フレームワークRDVQを提案する。
我々は,正確なエントロピーモデリングとテスト時間率制御をサポートする自己回帰エントロピーモデルを開発した。
RD2K-valと比較すると、RDVQは DisTSで75.71%、DIV2K-valでLPIPSで37.63%減少する。
論文 参考訳(メタデータ) (2026-04-12T09:25:24Z) - Detecting Neurovascular Instability from Multimodal Physiological Signals Using Wearable-Compatible Edge AI: A Responsible Computational Framework [0.0]
ウェアラブル互換の生理信号から神経血管不安定性(NVI)を検出するためのマルチモーダルMLフレームワークであるMeraguardを提案する。
毎年1220万回のインシデントストロークで、連続したマルチモーダルな生理的モニタリングは、コミュニティスケールのスクリーニングへの実践的なパスを提供する。
論文 参考訳(メタデータ) (2026-03-20T19:17:46Z) - POVQA: Preference-Optimized Video Question Answering with Rationales for Data Efficiency [3.4998703934432682]
近年,VQAタスクには1500以上のフレームのコンテキストウィンドウが設けられている。
データ効率のよいパイプラインであるPOVQAを導入し、ビデオの各秒を1つの時間プール画像に圧縮する。
論文 参考訳(メタデータ) (2025-10-01T15:15:36Z) - Generalizable Diabetes Risk Stratification via Hybrid Machine Learning Models [0.0]
糖尿病は世界中で5億3700万人を超え、2045年までに7億8300万人に達すると予測されている。
2つのハイブリッド分類器を比較し、外部コホート上での一般化性を評価する。
論文 参考訳(メタデータ) (2025-09-24T21:18:52Z) - Scalable Training for Vector-Quantized Networks with 100% Codebook Utilization [60.294965457786844]
ベクトル量子化(VQ)は、画像生成のための離散トークン化器において重要な要素である。
VQBridgeは、地図関数法に基づく堅牢でスケーラブルで効率的なプロジェクタである。
FVQは262kのコードブックでも100%のコードブック利用が可能である。
論文 参考訳(メタデータ) (2025-09-12T11:08:21Z) - Quantize-then-Rectify: Efficient VQ-VAE Training [71.92014859992263]
この研究は、VAEの許容しきい値内の量子化ノイズによって、事前訓練されたVAEをVQ-VAEに効率的に変換できることを実証する。
我々は、事前学習されたVAEを利用して、最小計算オーバーヘッドで高速なVQ-VAEトレーニングを可能にするフレームワークである textbfQuantize-then-Rectify (ReVQ) を提案する。
論文 参考訳(メタデータ) (2025-07-14T17:59:41Z) - FIMA-Q: Post-Training Quantization for Vision Transformers by Fisher Information Matrix Approximation [55.12070409045766]
ポストトレーニング量子化(PTQ)は近年,費用対効果と有望なモデル圧縮パラダイムとして注目されている。
ビジョン変換器(ViT)の現在のPTQ法は、特に低ビット量子化において、精度が著しく低下している。
論文 参考訳(メタデータ) (2025-06-13T07:57:38Z) - Future frame prediction in chest cine MR imaging using the PCA respiratory motion model and dynamically trained recurrent neural networks [0.0]
肺放射線治療システムは、推定腫瘍位置の不確実性や健康な組織の高照射を引き起こす遅延を受ける。
この研究は、オンライン学習アルゴリズムで訓練されたRNNを用いて、胸部ダイナミックMRIシーケンスの将来のフレーム予測に対処し、その遅延を補償する。
論文 参考訳(メタデータ) (2024-10-08T10:21:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。