Fugu-MT 論文翻訳(概要): gDDIM: Generalized denoising diffusion implicit models

論文の概要: gDDIM: Generalized denoising diffusion implicit models

arxiv url: http://arxiv.org/abs/2206.05564v2
Date: Thu, 23 Mar 2023 11:50:36 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-24 18:36:21.229261
Title: gDDIM: Generalized denoising diffusion implicit models
Title（参考訳）: gDDIM:一般化された拡散暗黙的モデル
Authors: Qinsheng Zhang and Molei Tao and Yongxin Chen
Abstract要約: 拡散暗黙モデル(DDIM)を等方的拡散に加えて一般拡散モデル(DM)に拡張する。我々は2つの非等方性DMにおいて20倍以上の加速を観測した。 CIFAR10のFIDスコアは2.26で,NFEは50点,NFEは27点,FIDスコアは2.86点であった。
参考スコア（独自算出の注目度）: 15.877673959068455
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Our goal is to extend the denoising diffusion implicit model (DDIM) to general diffusion models~(DMs) besides isotropic diffusions. Instead of constructing a non-Markov noising process as in the original DDIM, we examine the mechanism of DDIM from a numerical perspective. We discover that the DDIM can be obtained by using some specific approximations of the score when solving the corresponding stochastic differential equation. We present an interpretation of the accelerating effects of DDIM that also explains the advantages of a deterministic sampling scheme over the stochastic one for fast sampling. Building on this insight, we extend DDIM to general DMs, coined generalized DDIM (gDDIM), with a small but delicate modification in parameterizing the score network. We validate gDDIM in two non-isotropic DMs: Blurring diffusion model (BDM) and Critically-damped Langevin diffusion model (CLD). We observe more than 20 times acceleration in BDM. In the CLD, a diffusion model by augmenting the diffusion process with velocity, our algorithm achieves an FID score of 2.26, on CIFAR10, with only 50 number of score function evaluations~(NFEs) and an FID score of 2.86 with only 27 NFEs. Code is available at https://github.com/qsh-zh/gDDIM
Abstract（参考訳）: 我々のゴールは、異方性拡散の他に、一般拡散モデル~(DM)にまで拡大することである。従来のDDIMのように非マルコフ生成過程を構築する代わりに,数値的な観点からDDIMのメカニズムを検討する。我々は,対応する確率微分方程式を解く際に,スコアの特定の近似を用いてDDIMが得られることを発見した。本稿では, DDIMの高速化効果を解釈し, 高速サンプリングのための確率的サンプリング方式に対する決定論的サンプリング方式の利点を説明する。この知見に基づいてddimを一般化ddim(gddim)として一般dmsに拡張し、スコアネットワークのパラメータ化に小さいが繊細な修正を加えた。我々は,非等方性DMであるブラリング拡散モデル (BDM) と臨界減衰ランゲヴィン拡散モデル (CLD) でgDDIMを検証する。 BDMでは20倍以上の加速が観察された。 CIFAR10では,拡散過程を速度で増大させ拡散モデルを用いてFIDスコア2.26を達成し,FIDスコアが27NFEで50点,FIDスコアが2.86点であった。コードはhttps://github.com/qsh-zh/gDDIMで入手できる。

関連論文リスト

Low-dimensional adaptation of diffusion models: Convergence in total variation [13.218641525691195]
拡散生成モデルが(未知の)低次元構造をどのように活用してサンプリングを高速化するかを検討する。本研究はDDIM型試料試料の未知の低次元構造への適応性を示す最初の厳密な証拠である。
論文参考訳（メタデータ） (2025-01-22T16:12:33Z)
Constrained Diffusion Implicit Models [26.177111846501457]
本稿では,事前学習した拡散モデルを用いて,雑音の多い線形逆問題の解法を提案する。様々なタスクやメトリクスにわたる実験は、CDIMの強い性能を示し、非制約DDIMと類似の推論加速度を示す。我々は,超解像,デノイング,インペインティング,デブロアリング,3次元点雲再構成など,多くの問題に対するアプローチの汎用性を実証する。
論文参考訳（メタデータ） (2024-11-01T04:51:24Z)
Your Absorbing Discrete Diffusion Secretly Models the Conditional Distributions of Clean Data [55.54827581105283]
本研究では, 吸収拡散の具体的なスコアを, クリーンデータの条件付き確率として表すことができることを示す。時間に依存しない条件付き確率を特徴付ける時間条件のない専用拡散モデルを提案する。 5つのゼロショット言語モデルベンチマークにおける拡散モデル間のSOTA性能を実現する。
論文参考訳（メタデータ） (2024-06-06T04:22:11Z)
Diffusion Bridge Implicit Models [25.213664260896103]
分散ブリッジモデル(DDBM)は、2つの任意の対の分布を補間するための拡散モデルの強力な変種である。我々は,拡散モデルで確立されたレシピに動機づけられた,余分な訓練を伴わないDDBMの高速サンプリングの第一歩を踏み出す。我々は、高次数値解法を誘導する、新しい、単純で洞察に富んだ常微分方程式(ODE)を誘導する。
論文参考訳（メタデータ） (2024-05-24T19:08:30Z)
Gaussian Mixture Solvers for Diffusion Models [84.83349474361204]
本稿では,拡散モデルのためのGMSと呼ばれる,SDEに基づく新しい解法について紹介する。画像生成およびストロークベース合成におけるサンプル品質の観点から,SDEに基づく多くの解法よりも優れる。
論文参考訳（メタデータ） (2023-11-02T02:05:38Z)
Efficient Integrators for Diffusion Generative Models [22.01769257075573]
拡散モデルは、推論時に遅いサンプル生成に悩まされる。事前学習モデルにおけるサンプル生成を高速化するための2つの補完的フレームワークを提案する。本稿では,拡張空間における拡散モデルにおける最良報告性能を実現するハイブリッド手法を提案する。
論文参考訳（メタデータ） (2023-10-11T21:04:42Z)
SDDM: Score-Decomposed Diffusion Models on Manifolds for Unpaired Image-to-Image Translation [96.11061713135385]
本研究は,画像生成時の絡み合った分布を明示的に最適化する,新しいスコア分解拡散モデルを提案する。我々は、スコア関数の精製部分とエネルギー誘導を等しくし、多様体上の多目的最適化を可能にする。 SDDMは既存のSBDMベースの手法よりも優れており、I2Iベンチマークでは拡散ステップがはるかに少ない。
論文参考訳（メタデータ） (2023-08-04T06:21:57Z)
Semi-Implicit Denoising Diffusion Models (SIDDMs) [50.30163684539586]
Denoising Diffusion Probabilistic Models (DDPM)のような既存のモデルは、高品質で多様なサンプルを提供するが、本質的に多くの反復的なステップによって遅くなる。暗黙的要因と明示的要因を一致させることにより、この問題に対処する新しいアプローチを導入する。提案手法は拡散モデルに匹敵する生成性能と,少数のサンプリングステップを持つモデルに比較して非常に優れた結果が得られることを示す。
論文参考訳（メタデータ） (2023-06-21T18:49:22Z)
Eliminating Lipschitz Singularities in Diffusion Models [51.806899946775076]
拡散モデルは、時間ステップの零点付近で無限のリプシッツをしばしば表すことを示す。これは、積分演算に依存する拡散過程の安定性と精度に脅威をもたらす。我々はE-TSDMと呼ばれる新しい手法を提案し、これは0に近い拡散モデルのリプシッツを除去する。
論文参考訳（メタデータ） (2023-06-20T03:05:28Z)
Fast Diffusion Model [122.36693015093041]
拡散モデル(DM)は、複雑なデータ分布を捉える能力を持つ様々な分野に採用されている。本稿では,DM最適化の観点から,高速拡散モデル (FDM) を提案する。
論文参考訳（メタデータ） (2023-06-12T09:38:04Z)
Pseudo Numerical Methods for Diffusion Models on Manifolds [77.40343577960712]
Denoising Diffusion Probabilistic Models (DDPM) は、画像やオーディオサンプルなどの高品質なサンプルを生成することができる。 DDPMは最終的なサンプルを生成するために数百から数千のイテレーションを必要とする。拡散モデル(PNDM)の擬似数値法を提案する。 PNDMは、1000段DDIM(20倍の高速化)と比較して、50段の精度で高品質な合成画像を生成することができる
論文参考訳（メタデータ） (2022-02-20T10:37:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。