Fugu-MT 論文翻訳(概要): Float8@2bits: Entropy Coding Enables Data-Free Model Compression

論文の概要: Float8@2bits: Entropy Coding Enables Data-Free Model Compression

arxiv url: http://arxiv.org/abs/2601.22787v1
Date: Fri, 30 Jan 2026 10:08:15 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-02 18:28:15.375484
Title: Float8@2bits: Entropy Coding Enables Data-Free Model Compression
Title（参考訳）: Float8@2bits: エントロピー符号化によりデータフリーモデル圧縮が可能に
Authors: Patrick Putzky, Martin Genzel, Mattes Mollenhauer, Sebastian Schulze, Thomas Wollmann, Stefan Dietzel,
Abstract要約: EntQuantは、トレーニング後のさまざまな圧縮方式の利点を統一する最初のフレームワークです。本手法は,70Bパラメータモデルを30分以内で圧縮し,エントロピー符号化によりストレージコストから数値精度を分離する。我々は、EntQuantが標準評価セットやモデルで最先端の結果を得るだけでなく、より複雑なベンチマークで機能性能を維持することを実証した。
参考スコア（独自算出の注目度）: 4.775539058503235
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Post-training compression is currently divided into two contrasting regimes. On the one hand, fast, data-free, and model-agnostic methods (e.g., NF4 or HQQ) offer maximum accessibility but suffer from functional collapse at extreme bit-rates below 4 bits. On the other hand, techniques leveraging calibration data or extensive recovery training achieve superior fidelity but impose high computational constraints and face uncertain robustness under data distribution shifts. We introduce EntQuant, the first framework to unite the advantages of these distinct paradigms. By matching the performance of data-dependent methods with the speed and universality of data-free techniques, EntQuant enables practical utility in the extreme compression regime. Our method decouples numerical precision from storage cost via entropy coding, compressing a 70B parameter model in less than 30 minutes. We demonstrate that EntQuant does not only achieve state-of-the-art results on standard evaluation sets and models, but also retains functional performance on more complex benchmarks with instruction-tuned models, all at modest inference overhead.
Abstract（参考訳）: 現在、訓練後の圧縮は2つのコントラストのレギュレーションに分けられている。一方、高速でデータフリーでモデルに依存しない手法(例えば、NF4やHQQ)は、最大アクセシビリティを提供するが、4ビット以下の極端なビットレートで機能崩壊する。一方,キャリブレーションデータを活用する手法や広範囲なリカバリトレーニングは優れた忠実性を実現するが,高い計算制約を課し,データ分散シフトの下では不確実なロバスト性に直面する。これらの異なるパラダイムの利点を統一する最初のフレームワークであるEntQuantを紹介します。データに依存しない手法の性能とデータフリー手法の速度と普遍性とを一致させることで、EntQuantは極端な圧縮方式で実用性を実現する。本手法は,70Bパラメータモデルを30分以内で圧縮し,エントロピー符号化によりストレージコストから数値精度を分離する。我々は,EntQuantが標準評価セットやモデルに対して最先端の結果を得るだけでなく,命令調整されたモデルを用いたより複雑なベンチマークにおいて,すべて控えめな推論オーバーヘッドで機能性能を維持することを実証した。

論文の概要: Float8@2bits: Entropy Coding Enables Data-Free Model Compression

関連論文リスト