論文の概要: Eliminating Lipschitz Singularities in Diffusion Models
- arxiv url: http://arxiv.org/abs/2306.11251v1
- Date: Tue, 20 Jun 2023 03:05:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 15:51:21.180418
- Title: Eliminating Lipschitz Singularities in Diffusion Models
- Title(参考訳): 拡散モデルにおけるリプシッツ特異点の除去
- Authors: Zhantao Yang, Ruili Feng, Han Zhang, Yujun Shen, Kai Zhu, Lianghua
Huang, Yifei Zhang, Yu Liu, Deli Zhao, Jingren Zhou, Fan Cheng
- Abstract要約: 拡散モデルは、時間ステップの零点付近で無限のリプシッツをしばしば表すことを示す。
これは、積分演算に依存する拡散過程の安定性と精度に脅威をもたらす。
我々はE-TSDMと呼ばれる新しい手法を提案し、これは0に近い拡散モデルのリプシッツを除去する。
- 参考スコア(独自算出の注目度): 51.806899946775076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models, which employ stochastic differential equations to sample
images through integrals, have emerged as a dominant class of generative
models. However, the rationality of the diffusion process itself receives
limited attention, leaving the question of whether the problem is well-posed
and well-conditioned. In this paper, we uncover a vexing propensity of
diffusion models: they frequently exhibit the infinite Lipschitz near the zero
point of timesteps. This poses a threat to the stability and accuracy of the
diffusion process, which relies on integral operations. We provide a
comprehensive evaluation of the issue from both theoretical and empirical
perspectives. To address this challenge, we propose a novel approach, dubbed
E-TSDM, which eliminates the Lipschitz singularity of the diffusion model near
zero. Remarkably, our technique yields a substantial improvement in
performance, e.g., on the high-resolution FFHQ dataset ($256\times256$).
Moreover, as a byproduct of our method, we manage to achieve a dramatic
reduction in the Frechet Inception Distance of other acceleration methods
relying on network Lipschitz, including DDIM and DPM-Solver, by over 33$\%$. We
conduct extensive experiments on diverse datasets to validate our theory and
method. Our work not only advances the understanding of the general diffusion
process, but also provides insights for the design of diffusion models.
- Abstract(参考訳): 積分による画像のサンプリングに確率微分方程式を用いる拡散モデルは、生成モデルの支配的なクラスとして現れている。
しかし、拡散過程自体の合理性は限定的な注意を受けており、問題が十分に提示され、十分に条件づけられているかどうかという疑問が残る。
本稿では,拡散モデルの粘り強さを明らかにし,時間経過のゼロ点付近で無限のリプシッツをしばしば提示する。
これは、積分演算に依存する拡散過程の安定性と精度に脅威をもたらす。
我々は,この問題を理論的および経験的視点から総合的に評価する。
この課題に対処するため、我々はE-TSDMと呼ばれる新しいアプローチを提案し、これは0に近い拡散モデルのリプシッツ特異性を排除している。
驚くべきことに、このテクニックはハイレゾのffhqデータセット(256\times256$)でパフォーマンスが大幅に向上する。
さらに,本手法の副産物として,DDIM や DPM-Solver などネットワークリプシッツに依存した他の加速度法において,Frechet Inception Distance を33$\%以上削減することに成功した。
様々なデータセットについて広範な実験を行い、理論と方法を検証する。
我々の研究は一般拡散過程の理解を深めるだけでなく、拡散モデルの設計についての洞察を提供する。
関連論文リスト
- Distillation of Discrete Diffusion through Dimensional Correlations [21.078500510691747]
離散拡散における「ミクチャー」モデルは、拡張性を維持しながら次元相関を扱える。
CIFAR-10データセットで事前学習した連続時間離散拡散モデルを蒸留することにより,提案手法が実際に動作することを実証的に実証した。
論文 参考訳(メタデータ) (2024-10-11T10:53:03Z) - Variational Distillation of Diffusion Policies into Mixture of Experts [26.315682445979302]
本研究は, 拡散反応をエキスパート混合体 (MoE) に蒸留する新しい方法である変動拡散蒸留 (VDD) を導入する。
拡散モデル(英: Diffusion Models)は、複雑なマルチモーダル分布を正確に学習し、表現する能力があるため、生成モデリングにおける現在の最先端技術である。
VDDは、事前学習した拡散モデルをMoEモデルに蒸留し、拡散モデルの表現性を混合モデルの利点と組み合わせる最初の方法である。
論文 参考訳(メタデータ) (2024-06-18T12:15:05Z) - Intention-aware Denoising Diffusion Model for Trajectory Prediction [14.524496560759555]
軌道予測は、特に衝突回避システムにおいて、自律運転において不可欠な要素である。
本稿では,拡散モデルを用いて将来の軌道の分布を生成することを提案する。
Intention-aware denoising Diffusion Model (IDM)を提案する。
提案手法は,SDDデータセットでは13.83ピクセル,ETH/UCYデータセットでは0.36メートルのFDEで,最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-03-14T09:05:25Z) - Guided Diffusion from Self-Supervised Diffusion Features [49.78673164423208]
ガイダンスは拡散モデルにおいて重要な概念として機能するが、その効果は追加のデータアノテーションや事前学習の必要性によって制限されることが多い。
本稿では,拡散モデルからガイダンスを抽出するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-14T11:19:11Z) - Soft Mixture Denoising: Beyond the Expressive Bottleneck of Diffusion
Models [76.46246743508651]
我々は,現在の拡散モデルが後方認知において表現力のあるボトルネックを持っていることを示した。
本稿では,後方復調のための表現的かつ効率的なモデルであるソフトミキシング・デノナイジング(SMD)を導入する。
論文 参考訳(メタデータ) (2023-09-25T12:03:32Z) - Exploring the Optimal Choice for Generative Processes in Diffusion
Models: Ordinary vs Stochastic Differential Equations [6.2284442126065525]
ゼロ拡散(ODE)の場合と大きな拡散の場合の2つの制限シナリオについて数学的に検討する。
その結果, 生成過程の終端に摂動が発生すると, ODEモデルは大きな拡散係数でSDEモデルより優れることがわかった。
論文 参考訳(メタデータ) (2023-06-03T09:27:15Z) - Reconstructing Graph Diffusion History from a Single Snapshot [87.20550495678907]
A single SnapsHot (DASH) から拡散履歴を再構築するための新しいバリセンターの定式化を提案する。
本研究では,拡散パラメータ推定のNP硬度により,拡散パラメータの推定誤差が避けられないことを証明する。
また、DITTO(Diffusion hitting Times with Optimal proposal)という効果的な解法も開発している。
論文 参考訳(メタデータ) (2023-06-01T09:39:32Z) - Diffusion Models are Minimax Optimal Distribution Estimators [49.47503258639454]
拡散モデリングの近似と一般化能力について、初めて厳密な分析を行った。
実密度関数がベソフ空間に属し、経験値整合損失が適切に最小化されている場合、生成したデータ分布は、ほぼ最小の最適推定値が得られることを示す。
論文 参考訳(メタデータ) (2023-03-03T11:31:55Z) - Where to Diffuse, How to Diffuse, and How to Get Back: Automated
Learning for Multivariate Diffusions [22.04182099405728]
拡散に基づく生成モデル(DBGM)は、ターゲット雑音分布に摂動データを変換し、この推論拡散過程を逆にしてサンプルを生成する。
補助変数の数に対して、低いバウンドを最大化する方法を示す。
次に,特定対象雑音分布の拡散をパラメータ化する方法を示す。
論文 参考訳(メタデータ) (2023-02-14T18:57:04Z) - How Much is Enough? A Study on Diffusion Times in Score-based Generative
Models [76.76860707897413]
現在のベストプラクティスは、フォワードダイナミクスが既知の単純なノイズ分布に十分に近づくことを確実にするために大きなTを提唱している。
本稿では, 理想とシミュレーションされたフォワードダイナミクスのギャップを埋めるために補助モデルを用いて, 標準的な逆拡散過程を導出する方法について述べる。
論文 参考訳(メタデータ) (2022-06-10T15:09:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。