論文の概要: Learning Quantized Adaptive Conditions for Diffusion Models
- arxiv url: http://arxiv.org/abs/2409.17487v1
- Date: Thu, 26 Sep 2024 02:49:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-28 23:28:13.999016
- Title: Learning Quantized Adaptive Conditions for Diffusion Models
- Title(参考訳): 拡散モデルのための量子化適応条件の学習
- Authors: Yuchen Liang, Yuchuan Tian, Lei Yu, Huao Tang, Jie Hu, Xiangzhong Fang, Hanting Chen,
- Abstract要約: 適応条件を利用して軌道曲率を小さくする新しい,効果的な手法を提案する。
本手法は, トレーニングパラメータの1%に過ぎず, 追加の正規化項の必要性を排除し, サンプル品質を著しく向上させる。
- 参考スコア(独自算出の注目度): 19.9601581920218
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The curvature of ODE trajectories in diffusion models hinders their ability to generate high-quality images in a few number of function evaluations (NFE). In this paper, we propose a novel and effective approach to reduce trajectory curvature by utilizing adaptive conditions. By employing a extremely light-weight quantized encoder, our method incurs only an additional 1% of training parameters, eliminates the need for extra regularization terms, yet achieves significantly better sample quality. Our approach accelerates ODE sampling while preserving the downstream task image editing capabilities of SDE techniques. Extensive experiments verify that our method can generate high quality results under extremely limited sampling costs. With only 6 NFE, we achieve 5.14 FID on CIFAR-10, 6.91 FID on FFHQ 64x64 and 3.10 FID on AFHQv2.
- Abstract(参考訳): 拡散モデルにおけるODE軌道の曲率は、少数の関数評価(NFE)において高品質な画像を生成する能力を妨げている。
本稿では,適応条件を利用して軌道曲率を小さくする,新しい効果的手法を提案する。
極端に軽量な量子化エンコーダを用いることで、トレーニングパラメータの1%しか増加せず、余分な正規化項が不要となるが、試料の品質は著しく向上する。
提案手法は,SDE手法の下流タスク画像編集能力を保ちながら,ODEサンプリングを高速化する。
大規模な実験により,本手法が極めて限られたサンプリングコストで高品質な結果が得られることが確認された。
6 NFEでCIFAR-10で5.14 FID、FFHQ 64x64で6.91 FID、AFHQv2で3.10 FIDを達成する。
関連論文リスト
- Simple and Fast Distillation of Diffusion Models [39.79747569096888]
本稿では,拡散モデルの簡易・高速蒸留(SFD)を提案する。
SFD は CIFAR-10 上で 4.53 FID (NFE=2) を達成する。
論文 参考訳(メタデータ) (2024-09-29T12:13:06Z) - Unveiling Advanced Frequency Disentanglement Paradigm for Low-Light Image Enhancement [61.22119364400268]
周波数不整合最適化を改良した新しい低周波整合性手法を提案する。
注目すべき改善点は5つの人気のあるベンチマークで示されており、6つの最先端モデルで達成されたPSNRの7.68dBのゲインである。
提案手法は,88K余剰パラメータで効率を保ち,低照度画像強調の挑戦的な領域に新たな標準を設定する。
論文 参考訳(メタデータ) (2024-09-03T06:19:03Z) - Diffusion Models Are Innate One-Step Generators [2.3359837623080613]
拡散モデル(DM)は優れた高品質な結果をもたらす。
DMの層は異なる時間ステップで微分活性化され、単一のステップで画像を生成する固有の能力をもたらす。
提案手法は, CIFAR-10, AFHQv2 64x64 (FID 1.23), FFHQ 64x64 (FID 0.85), ImageNet 64x64 (FID 1.16) のSOTA結果を効率よく達成する。
論文 参考訳(メタデータ) (2024-05-31T11:14:12Z) - QuEST: Low-bit Diffusion Model Quantization via Efficient Selective Finetuning [52.157939524815866]
本稿では,現行手法の有効性を損なう量子拡散モデルの3つの特性を実証的に明らかにする。
重要な時間的情報を保持する層と、ビット幅の低減に敏感な層という、2つの重要なタイプの量子化層を同定する。
提案手法は,3つの高分解能画像生成タスクに対して評価し,様々なビット幅設定で最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-02-06T03:39:44Z) - Fast ODE-based Sampling for Diffusion Models in Around 5 Steps [17.500594480727617]
本稿では, 高速サンプリングのための平均方向を直接学習することにより, トランケーション誤差を解消する近似平均方向解法(AMED-r)を提案する。
本手法は,既存の ODE ベースのサンプルを改良するためのプラグインとして容易に利用できる。
論文 参考訳(メタデータ) (2023-11-30T13:07:19Z) - Manifold Preserving Guided Diffusion [121.97907811212123]
条件付き画像生成は、コスト、一般化可能性、タスク固有のトレーニングの必要性といった課題に直面している。
トレーニング不要な条件生成フレームワークであるManifold Preserving Guided Diffusion (MPGD)を提案する。
論文 参考訳(メタデータ) (2023-11-28T02:08:06Z) - ACDMSR: Accelerated Conditional Diffusion Models for Single Image
Super-Resolution [84.73658185158222]
本稿では,ACDMSRと呼ばれる拡散モデルに基づく超解像法を提案する。
提案手法は, 決定論的反復分解過程を通じて超解像を行うために, 標準拡散モデルに適応する。
提案手法は,低解像度画像に対してより視覚的に現実的な表現を生成し,現実的なシナリオにおけるその有効性を強調した。
論文 参考訳(メタデータ) (2023-07-03T06:49:04Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - On Distillation of Guided Diffusion Models [94.95228078141626]
そこで本研究では,分類器を含まない誘導拡散モデルから抽出し易いモデルへ抽出する手法を提案する。
画素空間上で訓練された標準拡散モデルに対して,本手法は元のモデルに匹敵する画像を生成することができる。
遅延空間で訓練された拡散モデル(例えば、安定拡散)に対して、我々の手法は1から4段階のデノナイジングステップで高忠実度画像を生成することができる。
論文 参考訳(メタデータ) (2022-10-06T18:03:56Z) - Improved Vector Quantized Diffusion Models [34.23016989464389]
VQ拡散はテキスト-画像合成のための強力な生成モデルである。
テキスト入力で低品質のサンプルや弱い相関画像を生成することができる。
本稿では,VQ拡散の試料品質をさらに向上する2つの手法を提案する。
論文 参考訳(メタデータ) (2022-05-31T17:59:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。