論文の概要: Diffusion Probabilistic Model Made Slim
- arxiv url: http://arxiv.org/abs/2211.17106v1
- Date: Sun, 27 Nov 2022 16:27:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 17:59:26.795905
- Title: Diffusion Probabilistic Model Made Slim
- Title(参考訳): 拡散確率モデルによるスリム化
- Authors: Xingyi Yang, Daquan Zhou, Jiashi Feng, Xinchao Wang
- Abstract要約: 軽量画像合成のためのスリム拡散確率モデル(DPM)のカスタマイズ設計を提案する。
一連の条件および非条件画像生成タスクにおける遅延拡散モデルと比較して,計算複雑性を8-18倍に削減する。
- 参考スコア(独自算出の注目度): 128.2227518929644
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the recent visually-pleasing results achieved, the massive
computational cost has been a long-standing flaw for diffusion probabilistic
models (DPMs), which, in turn, greatly limits their applications on
resource-limited platforms. Prior methods towards efficient DPM, however, have
largely focused on accelerating the testing yet overlooked their huge
complexity and sizes. In this paper, we make a dedicated attempt to lighten DPM
while striving to preserve its favourable performance. We start by training a
small-sized latent diffusion model (LDM) from scratch, but observe a
significant fidelity drop in the synthetic images. Through a thorough
assessment, we find that DPM is intrinsically biased against high-frequency
generation, and learns to recover different frequency components at different
time-steps. These properties make compact networks unable to represent
frequency dynamics with accurate high-frequency estimation. Towards this end,
we introduce a customized design for slim DPM, which we term as Spectral
Diffusion (SD), for light-weight image synthesis. SD incorporates wavelet
gating in its architecture to enable frequency dynamic feature extraction at
every reverse steps, and conducts spectrum-aware distillation to promote
high-frequency recovery by inverse weighting the objective based on spectrum
magni tudes. Experimental results demonstrate that, SD achieves 8-18x
computational complexity reduction as compared to the latent diffusion models
on a series of conditional and unconditional image generation tasks while
retaining competitive image fidelity.
- Abstract(参考訳): 最近の視覚的に満足する結果にもかかわらず、膨大な計算コストは拡散確率モデル(dpms)にとって長年の欠陥であり、リソース制限されたプラットフォーム上での応用を大幅に制限している。
しかし、効率的なDPMに向けた以前の手法は、テストの高速化に重点を置いていたが、その膨大な複雑さとサイズを見落としていた。
本稿では,DPMの軽量化を図り,良好な性能を保とうとする試みを行う。
まず、スクラッチから小型潜伏拡散モデル(LDM)を訓練することから始めるが、合成画像における顕著な忠実度低下を観察する。
徹底的な評価により、DPMは本質的に高周波発生に偏りがあり、異なるタイミングで異なる周波数成分を回復することを学ぶ。
これらの特性により、コンパクトネットワークは正確な高周波推定で周波数ダイナミクスを表現できない。
この目的のために、我々は、軽量画像合成のためのスペクトル拡散(SD)と呼ばれるスリムDPMのカスタマイズ設計を導入する。
SDはウェーブレットゲーティングをアーキテクチャに組み込んで、逆ステップ毎に周波数動的特徴抽出を可能にするとともに、スペクトルマグニチュードに基づいて目的を逆重み付けすることで高周波回復を促進するためにスペクトル認識蒸留を行う。
実験の結果,sdは,競合画像の忠実性を維持しつつ,一連の条件付きおよび無条件画像生成タスクにおける潜在拡散モデルと比較して,8-18倍の計算複雑性低減を達成した。
関連論文リスト
- Memory-Efficient Fine-Tuning for Quantized Diffusion Model [12.875837358532422]
本稿では,量子化拡散モデルのためのメモリ効率の良い微調整手法であるTuneQDMを紹介する。
提案手法は, 単目的/多目的の両方の世代において, ベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2024-01-09T03:42:08Z) - Speeding up Photoacoustic Imaging using Diffusion Models [0.0]
光音響顕微鏡(PAM)は、光学的および音響的イメージングを統合し、組織内の光学吸収成分を検出するための浸透深度を向上させる。
レーザーパルス繰り返し速度による速度制限により、計算手法の潜在的な役割は、PAMイメージングの加速において強調される。
PAM画像の高速化に拡散モデルを用いた,新しい高適応DiffPamアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-14T11:34:27Z) - Fast Diffusion Model [122.36693015093041]
拡散モデル(DM)は、複雑なデータ分布を捉える能力を持つ様々な分野に採用されている。
本稿では,DM最適化の観点から,高速拡散モデル (FDM) を提案する。
論文 参考訳(メタデータ) (2023-06-12T09:38:04Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - WaveDM: Wavelet-Based Diffusion Models for Image Restoration [43.254438752311714]
Wavelet-based Diffusion Model (WaveDM) は、ウェーブレット変換後の劣化画像のウェーブレットスペクトルに条件付きウェーブレット領域におけるクリーン画像の分布を学習する。
WaveDMは、従来のワンパス手法に匹敵する効率で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-05-23T08:41:04Z) - Q-Diffusion: Quantizing Diffusion Models [52.978047249670276]
ポストトレーニング量子化(PTQ)は、他のタスクに対するゴーツー圧縮法であると考えられている。
本稿では,一意なマルチステップパイプラインとモデルアーキテクチャに適した新しいPTQ手法を提案する。
提案手法は,完全精度の非条件拡散モデルを同等の性能を維持しつつ4ビットに定量化できることを示す。
論文 参考訳(メタデータ) (2023-02-08T19:38:59Z) - Accelerating Score-based Generative Models with Preconditioned Diffusion
Sampling [36.02321871608158]
本稿では,行列プレコンディショニングを利用して問題を緩和するPDS法を提案する。
PDSは、合成品質を維持しながら、棚外のSGMを継続的に加速する。
特に、PSDはより難しい高解像度(1024x1024)の画像生成で最大29倍加速することができる。
論文 参考訳(メタデータ) (2022-07-05T17:55:42Z) - Accelerating Diffusion Models via Early Stop of the Diffusion Process [114.48426684994179]
Denoising Diffusion Probabilistic Models (DDPM) は、様々な世代タスクにおいて優れたパフォーマンスを実現している。
実際には、DDPMは高品質なサンプルを得るために何十万ものデノナイジングステップを必要とすることが多い。
本稿では,DDPMの早期停止型DDPM(Early-Stopped DDPM, ES-DDPM)の原理的高速化戦略を提案する。
論文 参考訳(メタデータ) (2022-05-25T06:40:09Z) - Denoising Diffusion Implicit Models [117.03720513930335]
DDPMと同様の訓練手順を施した反復的暗黙的確率モデルに対して,拡散暗黙モデル(DDIM)を提案する。
DDIMsは、DDPMsと比較して、壁面時間で10倍から50倍高速な高品質のサンプルを作成できる。
論文 参考訳(メタデータ) (2020-10-06T06:15:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。