Fugu-MT 論文翻訳(概要): Multi-Step Consistency Models: Fast Generation with Theoretical Guarantees

論文の概要: Multi-Step Consistency Models: Fast Generation with Theoretical Guarantees

arxiv url: http://arxiv.org/abs/2505.01049v2
Date: Sun, 25 May 2025 04:06:45 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-27 14:32:54.546955
Title: Multi-Step Consistency Models: Fast Generation with Theoretical Guarantees
Title（参考訳）: マルチステップ一貫性モデル:理論的保証付き高速生成
Authors: Nishant Jain, Xunpeng Huang, Yian Ma, Tong Zhang,
Abstract要約: 所定時刻の入力を逆軌道に沿った任意の点にマッピングできる整合モデルの理論的解析を行う。 Oleft(logleft(fracdvarepsilonright) $ iterations for a constant step size。我々は,スムーズかつ非スムーズな設定でも,小さな離散化ステップを用いて,正確な学習が実現可能であると結論付けた。
参考スコア（独自算出の注目度）: 15.366598179769918
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Consistency models have recently emerged as a compelling alternative to traditional SDE-based diffusion models. They offer a significant acceleration in generation by producing high-quality samples in very few steps. Despite their empirical success, a proper theoretic justification for their speed-up is still lacking. In this work, we address the gap by providing a theoretical analysis of consistency models capable of mapping inputs at a given time to arbitrary points along the reverse trajectory. We show that one can achieve a KL divergence of order $ O(\varepsilon^2) $ using only $ O\left(\log\left(\frac{d}{\varepsilon}\right)\right) $ iterations with a constant step size. Additionally, under minimal assumptions on the data distribution (non smooth case) an increasingly common setting in recent diffusion model analyses we show that a similar KL convergence guarantee can be obtained, with the number of steps scaling as $ O\left(d \log\left(\frac{d}{\varepsilon}\right)\right) $. Going further, we also provide a theoretical analysis for estimation of such consistency models, concluding that accurate learning is feasible using small discretization steps, both in smooth and non-smooth settings. Notably, our results for the non-smooth case yield best in class convergence rates compared to existing SDE or ODE based analyses under minimal assumptions.
Abstract（参考訳）: 一貫性モデルは近年、従来のSDEベースの拡散モデルに代わる魅力的な代替品として出現している。これらは、非常に少数のステップで高品質なサンプルを生成することによって、生成を著しく加速する。彼らの経験的成功にもかかわらず、彼らのスピードアップに対する適切な理論的正当化は依然として不足している。本研究では,与えられた時刻に入力を逆軌道に沿った任意の点にマッピングできる一貫性モデルの理論的解析を提供することにより,このギャップに対処する。次数 $ O(\varepsilon^2) $ の KL 分岐を $ O\left(\log\left(\frac{d}{\varepsilon}\right)\right) $ の反復だけを用いて達成できることが示される。さらに、データ分布に関する最小限の仮定(非滑らかな場合)の下では、最近の拡散モデル解析において、同様のKL収束保証が得られることを示し、ステップの数は $ O\left(d \log\left(\frac{d}{\varepsilon}\right)\right) $ である。さらに、このような一貫性モデルの推定のための理論的解析も提供し、スムーズかつ非スムーズな設定で、小さな離散化ステップを用いて正確な学習が可能であることを結論づける。特に、非滑らかなケースに対する我々の結果は、最小の仮定の下での既存のSDEやODEに基づく分析と比較して、クラス収束率が最も良い。

関連論文リスト

Beyond Scores: Proximal Diffusion Models [10.27283386401996]
対数密度の近似演算子を学習するために, 近似拡散モデル (ProxDM) を開発した。 ProxDMの2つの変種は,従来のスコアマッチング法と比較して,わずか数ステップで大幅に高速化された。
論文参考訳（メタデータ） (2025-07-11T18:30:09Z)
Advancing Wasserstein Convergence Analysis of Score-Based Models: Insights from Discretization and Second-Order Acceleration [5.548787731232499]
スコアベース拡散モデルのワッサーシュタイン収束解析に着目する。我々は、オイラー離散化、指数中点法、ランダム化法など、様々な離散化スキームを比較する。局所線形化法に基づく加速型サンプリング器を提案する。
論文参考訳（メタデータ） (2025-02-07T11:37:51Z)
Improved Convergence Rate for Diffusion Probabilistic Models [7.237817437521988]
スコアベース拡散モデルは、機械学習と人工知能の分野で顕著な経験的性能を達成した。多くの理論的な試みにもかかわらず、理論と実践の間には大きなギャップがある。繰り返しの複雑性を$d2/3varepsilon-2/3$とすると、$d5/12varepsilon-1$よりよい。我々の理論は、$varepsilon$-accurate score estimatesを許容し、ターゲット分布の対数共振を必要としない。
論文参考訳（メタデータ） (2024-10-17T16:37:33Z)
Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.442307356162864]
連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文参考訳（メタデータ） (2024-10-03T09:07:13Z)
O(d/T) Convergence Theory for Diffusion Probabilistic Models under Minimal Assumptions [6.76974373198208]
最小の仮定の下で,拡散確率モデル(DDPM)の高速収束理論を確立する。収束率は$O(k/T)$に改善され、$k$は対象データ分布の内在次元であることを示す。これはDDPMが未知の低次元構造に自動的に適応する能力を強調している。
論文参考訳（メタデータ） (2024-09-27T17:59:10Z)
A Sharp Convergence Theory for The Probability Flow ODEs of Diffusion Models [45.60426164657739]
拡散型サンプリング器の非漸近収束理論を開発する。我々は、$d/varepsilon$がターゲット分布を$varepsilon$トータル偏差距離に近似するのに十分であることを証明した。我々の結果は、$ell$のスコア推定誤差がデータ生成プロセスの品質にどのように影響するかも特徴付ける。
論文参考訳（メタデータ） (2024-08-05T09:02:24Z)
Accelerating Diffusion Models with Parallel Sampling: Inference at Sub-Linear Time Complexity [11.71206628091551]
拡散モデルは、訓練と評価に費用がかかるため、拡散モデルの推論コストを削減することが大きな目標である。並列サンプリング手法であるHh2024parallelを用いて拡散モデルを高速化する実験的な成功に触発されて,サンプリングプロセスを各ブロック内に並列化可能なPicard繰り返しを持つ$mathcalO(1)$ブロックに分割することを提案する。我々の結果は、高速で効率的な高次元データサンプリングの可能性に光を当てた。
論文参考訳（メタデータ） (2024-05-24T23:59:41Z)
Broadening Target Distributions for Accelerated Diffusion Models via a Novel Analysis Approach [49.97755400231656]
本研究では,新しいDDPMサンプリング器が,これまで考慮されていなかった3種類の分散クラスに対して高速化性能を実現することを示す。この結果から, DDPM型加速サンプリング器におけるデータ次元$d$への依存性が改善された。
論文参考訳（メタデータ） (2024-02-21T16:11:47Z)
Gaussian Mixture Solvers for Diffusion Models [84.83349474361204]
本稿では,拡散モデルのためのGMSと呼ばれる,SDEに基づく新しい解法について紹介する。画像生成およびストロークベース合成におけるサンプル品質の観点から,SDEに基づく多くの解法よりも優れる。
論文参考訳（メタデータ） (2023-11-02T02:05:38Z)
Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文参考訳（メタデータ） (2023-06-15T16:30:08Z)
Improved Analysis of Score-based Generative Modeling: User-Friendly Bounds under Minimal Smoothness Assumptions [9.953088581242845]
2次モーメントを持つ任意のデータ分布に対して,コンバージェンス保証と複雑性を提供する。我々の結果は、対数共空性や機能的不等式を前提としない。我々の理論解析は、異なる離散近似の比較を提供し、実際の離散化点の選択を導くかもしれない。
論文参考訳（メタデータ） (2022-11-03T15:51:00Z)
Sharper Rates and Flexible Framework for Nonconvex SGD with Client and Data Sampling [64.31011847952006]
我々は、平均$n$スムーズでおそらくは非カラー関数のほぼ定常点を求める問題を再考する。我々は$smallsfcolorgreen$を一般化し、事実上あらゆるサンプリングメカニズムで確実に動作するようにします。我々は、スムーズな非カラー状態における最適境界の最も一般的な、最も正確な解析を提供する。
論文参考訳（メタデータ） (2022-06-05T21:32:33Z)
KL-Entropy-Regularized RL with a Generative Model is Minimax Optimal [70.15267479220691]
モデル強化学習のサンプル複雑性を,生成的分散自由モデルを用いて検討・解析する。我々の分析は、$varepsilon$が十分小さい場合、$varepsilon$-optimal Policyを見つけるのが、ほぼ最小の最適化であることを示している。
論文参考訳（メタデータ） (2022-05-27T19:39:24Z)
Faster Convergence of Stochastic Gradient Langevin Dynamics for Non-Log-Concave Sampling [110.88857917726276]
我々は,非log-concaveとなる分布のクラスからサンプリングするために,勾配ランゲヴィンダイナミクス(SGLD)の新たな収束解析を行う。我々のアプローチの核心は、補助的時間反転型マルコフ連鎖を用いたSGLDのコンダクタンス解析である。
論文参考訳（メタデータ） (2020-10-19T15:23:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。