論文の概要: On Low-Bit Quantization Errors in Speaker Verification: Diagnostic and Mitigation
- arxiv url: http://arxiv.org/abs/2606.08078v1
- Date: Sat, 06 Jun 2026 09:55:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.763677
- Title: On Low-Bit Quantization Errors in Speaker Verification: Diagnostic and Mitigation
- Title(参考訳): 話者検証における低ビット量子化誤差について:診断と緩和
- Authors: Hugo Leguillier, Driss Matrouf, Guillaume Lechien, Mickael Rouvier,
- Abstract要約: ResNet-36とResNet-200の低ビット量子化学習について検討した。
我々は,FP32閾値付近に集中するスコアドリフトと有害な決定フリップを有する2ビットの明確な膝点を同定した。
2ビットでほとんどの試行を解消し、曖昧なケースのみをエスカレートする校正多重精度カスケードを提案する。
- 参考スコア(独自算出の注目度): 6.8167913328808405
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although low-bit quantization provides practical means to deploy speaker verification on resource-constrained devices, its effects on speaker verification performance remain poorly understood. In this paper, we study uniform K-means quantization-aware training of ResNet-36 and ResNet-200 through joint layer-wise and score-level analyses. Our layer-wise analysis highlights fragile components and shows that score degradation is not fully explained by weight distortion alone. We identify a clear knee point at 2 bits, with larger score drift and harmful decision flips concentrated near the FP32 threshold. Our score-level analysis reveals where and how score errors emerge under extreme quantization. Building on these findings, we propose a calibrated multi-precision cascade that resolves most trials at 2 bits and escalates only ambiguous cases, achieving performance close to FP32 while preserving the efficiency benefits of low-bit inference with substantially lower compute and memory costs.
- Abstract(参考訳): 低ビット量子化は、リソース制約のあるデバイスに話者検証をデプロイする実用的な手段を提供するが、その話者検証性能への影響はよく分かっていない。
本稿では,ResNet-36とResNet-200のK平均量子化学習について,ジョイント層とスコアレベル解析を用いて検討する。
筆者らの層別分析では, 脆性成分が強調され, 重量歪みだけでは, スコア劣化が完全に説明できないことが示された。
我々は,FP32閾値付近にスコアドリフトと有害な決定フリップが集中した2ビットの明確な膝点を同定した。
我々のスコアレベル分析は、極端量子化の下でスコアエラーが出現する場所と方法を明らかにする。
これらの結果に基づいて,2ビットでほとんどの試行を解消し,不明瞭なケースのみをエスカレートし,FP32に近い性能を実現し,計算コストとメモリコストを大幅に低減した低ビット推論の効率性を維持した校正マルチ精度カスケードを提案する。
関連論文リスト
- Pushing the Limits of Low-Bit Optimizers: A Focus on EMA Dynamics [64.62231094774211]
ステートフル(例えばアダム)は、最適収束を達成するために、モデルサイズを2倍も補助情報を維持する。
SOLOにより、アダムスタイルは3ビットまたは2ビットの精度で量子化された状態を維持することができる。
したがって、SOLOはAdamスタイルにシームレスに適用でき、精度の低下を最小限に抑えることができる。
論文 参考訳(メタデータ) (2025-05-01T06:47:45Z) - Benchmarking the quality of multiplexed qubit readout beyond assignment fidelity [0.0]
我々は検出器トモグラフィーを用いて超伝導トランスモン量子ビットのマルチキュービット読み出しを完全に特徴付ける。
異なる読み出しパラメータが情報抽出率に与える影響について検討した。
代入忠実度検証ツールとして不確定性収束率を提案する。
論文 参考訳(メタデータ) (2025-02-12T17:21:38Z) - Quantization Meets Reasoning: Exploring LLM Low-Bit Quantization Degradation for Mathematical Reasoning [29.687113675756127]
大規模言語モデルは、MATHのような複雑な数学的推論ベンチマークにおいて大きな進歩を遂げた。
モデル量子化は、低い精度とビット幅の表現を用いることで、メモリ使用量と計算コストを削減する効果的な戦略として登場した。
論文 参考訳(メタデータ) (2025-01-06T14:23:02Z) - DB-LLM: Accurate Dual-Binarization for Efficient LLMs [83.70686728471547]
大規模言語モデル(LLM)は自然言語処理の分野を著しく進歩させてきた。
既存の超低ビット量子化は、常に深刻な精度低下を引き起こす。
本稿では,LLM,すなわちDB-LLMのための新しいデュアルバイナライズ手法を提案する。
論文 参考訳(メタデータ) (2024-02-19T09:04:30Z) - QuEST: Low-bit Diffusion Model Quantization via Efficient Selective Finetuning [52.157939524815866]
本稿では,不均衡な活性化分布を量子化困難の原因として同定する。
我々は,これらの分布を,より量子化しやすいように微調整することで調整することを提案する。
本手法は3つの高解像度画像生成タスクに対して有効性を示す。
論文 参考訳(メタデータ) (2024-02-06T03:39:44Z) - Neural Networks with Quantization Constraints [111.42313650830248]
量子化学習における制約付き学習手法を提案する。
結果の問題は強い双対であり、勾配推定は不要であることを示す。
提案手法は画像分類タスクにおける競合性能を示す。
論文 参考訳(メタデータ) (2022-10-27T17:12:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。