Fugu-MT 論文翻訳(概要): Towards Accurate Post-training Quantization for Diffusion Models

論文の概要: Towards Accurate Post-training Quantization for Diffusion Models

arxiv url: http://arxiv.org/abs/2305.18723v4
Date: Tue, 30 Apr 2024 08:53:45 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-01 20:07:22.764037
Title: Towards Accurate Post-training Quantization for Diffusion Models
Title（参考訳）: 拡散モデルにおける学習後量子化の高精度化に向けて
Authors: Changyuan Wang, Ziwei Wang, Xiuwei Xu, Yansong Tang, Jie Zhou, Jiwen Lu,
Abstract要約: 本稿では,効率的な画像生成のための拡散モデル(ADP-DM)の高精度なデータフリーポストトレーニング量子化フレームワークを提案する。提案手法は, 拡散モデルの学習後の量子化を, 同様の計算コストで, 非常に大きなマージンで高速化する。
参考スコア（独自算出の注目度）: 73.19871905102545
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we propose an accurate data-free post-training quantization framework of diffusion models (ADP-DM) for efficient image generation. Conventional data-free quantization methods learn shared quantization functions for tensor discretization regardless of the generation timesteps, while the activation distribution differs significantly across various timesteps. The calibration images are acquired in random timesteps which fail to provide sufficient information for generalizable quantization function learning. Both issues cause sizable quantization errors with obvious image generation performance degradation. On the contrary, we design group-wise quantization functions for activation discretization in different timesteps and sample the optimal timestep for informative calibration image generation, so that our quantized diffusion model can reduce the discretization errors with negligible computational overhead. Specifically, we partition the timesteps according to the importance weights of quantization functions in different groups, which are optimized by differentiable search algorithms. We also select the optimal timestep for calibration image generation by structural risk minimizing principle in order to enhance the generalization ability in the deployment of quantized diffusion model. Extensive experimental results show that our method outperforms the state-of-the-art post-training quantization of diffusion model by a sizable margin with similar computational cost.
Abstract（参考訳）: 本稿では,効率的な画像生成のための拡散モデル(ADP-DM)の高精度なデータ自由後量子化フレームワークを提案する。従来のデータ自由量子化法は、生成時間によらずテンソル離散化のための共有量子化関数を学習するが、活性化分布は様々な時間ステップで大きく異なる。キャリブレーション画像は、一般化可能な量子化関数学習のための十分な情報を提供できないランダムな時間ステップで取得される。どちらの問題も大きな量子化誤差を引き起こし、画像生成性能は明らかに低下する。それとは対照的に、異なる時間ステップにおけるアクティベーション離散化のためのグループワイド量子化関数を設計し、情報キャリブレーション画像生成のための最適な時間ステップをサンプリングすることにより、量子化拡散モデルにより、計算オーバーヘッドの無視による離散化誤差を低減することができる。具体的には、異なるグループにおける量子化関数の重み付けにより、時間ステップを分割する。また、量子化拡散モデルの展開における一般化能力を高めるために、構造的リスク最小化原理によるキャリブレーション画像生成のための最適な時間ステップを選択する。実験結果から,提案手法は拡散モデルの最先端の学習後量子化に類似した計算コストで大きなマージンで優れることを示した。

関連論文リスト

Inference-Time Scaling of Diffusion Language Models with Particle Gibbs Sampling [62.640128548633946]
離散拡散モデルに対する粒子ギブズサンプリングに基づく新しい推論時間スケーリング手法を提案する。提案手法は,報酬誘導テキスト生成タスクにおける事前推定時間戦略を常に上回る。
論文参考訳（メタデータ） (2025-07-11T08:00:47Z)
TR-DQ: Time-Rotation Diffusion Quantization [23.706266893272467]
時間-回転拡散量子化(TR-DQ)は、時間ステップと回転に基づく最適化を取り入れた新しい量子化法である。 TR-DQは既存の量子化法と比較して1.38-1.89xの高速化と1.97-2.58xのメモリ削減を実現している。
論文参考訳（メタデータ） (2025-03-09T11:37:11Z)
PQD: Post-training Quantization for Efficient Diffusion Models [4.809939957401427]
拡散モデル(PQD)のための新しい学習後量子化法を提案する。提案手法は,完全精度拡散モデルを直接8ビット,4ビットモデルに量子化することができる。
論文参考訳（メタデータ） (2024-12-30T19:55:59Z)
TCAQ-DM: Timestep-Channel Adaptive Quantization for Diffusion Models [49.65286242048452]
拡散モデル(TCAQ-DM)のためのタイムステップ・チャネル適応量子化法を提案する。提案手法は,ほとんどの場合,最先端の手法よりも優れている。
論文参考訳（メタデータ） (2024-12-21T16:57:54Z)
Efficiency Meets Fidelity: A Novel Quantization Framework for Stable Diffusion [9.402892455344677]
安定拡散モデル(SDM)のための効率的な量子化フレームワークを提案する。我々のフレームワークはトレーニングと推論の一貫性を同時に維持し、最適化の安定性を確保する。本手法は,訓練時間を短縮した最先端手法よりも優れた性能を示す。
論文参考訳（メタデータ） (2024-12-09T17:00:20Z)
Timestep-Aware Correction for Quantized Diffusion Models [28.265582848911574]
本稿では,量子化誤差を動的に補正する量子化拡散モデルの時間ステップ対応補正法を提案する。提案手法を低精度拡散モデルに応用することにより,出力品質の大幅な向上が期待できる。
論文参考訳（メタデータ） (2024-07-04T13:22:31Z)
TMPQ-DM: Joint Timestep Reduction and Quantization Precision Selection for Efficient Diffusion Models [40.5153344875351]
我々はTMPQ-DMを導入し、タイムステップの削減と量子化を共同で最適化し、優れた性能・効率のトレードオフを実現する。時間段階の削減のために、デノナイジング過程の非一様性に合わせた非一様グルーピングスキームを考案する。量子化の観点では、最終的な生成性能に対するそれぞれの貢献に基づいて、異なる層に異なるビット幅を割り当てる、きめ細かいレイヤーワイズアプローチを採用する。
論文参考訳（メタデータ） (2024-04-15T07:51:40Z)
QuEST: Low-bit Diffusion Model Quantization via Efficient Selective Finetuning [52.157939524815866]
本稿では,現行手法の有効性を損なう量子拡散モデルの3つの特性を実証的に明らかにする。重要な時間的情報を保持する層と、ビット幅の低減に敏感な層という、2つの重要なタイプの量子化層を同定する。提案手法は,3つの高分解能画像生成タスクに対して評価し,様々なビット幅設定で最先端の性能を実現する。
論文参考訳（メタデータ） (2024-02-06T03:39:44Z)
Post-training Quantization for Text-to-Image Diffusion Models with Progressive Calibration and Activation Relaxing [49.800746112114375]
本稿では,テキスト・画像拡散モデルのための学習後量子化手法(プログレッシブ・アンド・リラクシング)を提案する。我々は,安定拡散XLの量子化を初めて達成し,その性能を維持した。
論文参考訳（メタデータ） (2023-11-10T09:10:09Z)
Temporal Dynamic Quantization for Diffusion Models [18.184163233551292]
本稿では,時間ステップ情報に基づいて量子化間隔を動的に調整する新しい量子化手法を提案する。従来の動的量子化手法とは異なり、本手法は推論時に計算オーバーヘッドを伴わない。実験により,様々なデータセットにまたがる量子拡散モデルにより,出力品質が大幅に向上したことを示す。
論文参考訳（メタデータ） (2023-06-04T09:49:43Z)
Regularized Vector Quantization for Tokenized Image Synthesis [126.96880843754066]
画像の離散表現への量子化は、統合生成モデリングにおける根本的な問題である。決定論的量子化は、厳しいコードブックの崩壊と推論段階の誤調整に悩まされ、一方、量子化は、コードブックの利用率の低下と再構築の目的に悩まされる。本稿では、2つの視点から正規化を適用することにより、上記の問題を効果的に緩和できる正規化ベクトル量子化フレームワークを提案する。
論文参考訳（メタデータ） (2023-03-11T15:20:54Z)
Q-Diffusion: Quantizing Diffusion Models [52.978047249670276]
ポストトレーニング量子化(PTQ)は、他のタスクに対するゴーツー圧縮法であると考えられている。本稿では,一意なマルチステップパイプラインとモデルアーキテクチャに適した新しいPTQ手法を提案する。提案手法は,完全精度の非条件拡散モデルを同等の性能を維持しつつ4ビットに定量化できることを示す。
論文参考訳（メタデータ） (2023-02-08T19:38:59Z)
Moment evolution equations and moment matching for stochastic image EPDiff [68.97335984455059]
画像変形モデルにより、画像領域を変形させることにより、時間連続的な画像変換の研究が可能になる。応用例としては、人口傾向とランダムな被写体特定変異の両方を用いた医療画像分析がある。パラメータフルモデルにおける統計的推測のための推定器を構築するために、対応する伊藤拡散のモーメント近似を用いる。
論文参考訳（メタデータ） (2021-10-07T11:08:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。