Fugu-MT 論文翻訳(概要): Convergence of flow-based generative models via proximal gradient descent in Wasserstein space

論文の概要: Convergence of flow-based generative models via proximal gradient descent in Wasserstein space

arxiv url: http://arxiv.org/abs/2310.17582v1
Date: Thu, 26 Oct 2023 17:06:23 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-27 18:47:36.627325
Title: Convergence of flow-based generative models via proximal gradient descent in Wasserstein space
Title（参考訳）: ワッサーシュタイン空間における近位勾配降下による流れ型生成モデルの収束
Authors: Xiuyuan Cheng, Jianfeng Lu, Yixin Tan, Yao Xie
Abstract要約: フローベースの生成モデルは、データ生成と可能性の計算において一定の利点がある。本稿では,JKOフローモデルと呼ばれるプログレッシブフローモデルを用いて,データ分布の生成を理論的に保証する。
参考スコア（独自算出の注目度）: 22.691805716358903
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Flow-based generative models enjoy certain advantages in computing the data generation and the likelihood, and have recently shown competitive empirical performance. Compared to the accumulating theoretical studies on related score-based diffusion models, analysis of flow-based models, which are deterministic in both forward (data-to-noise) and reverse (noise-to-data) directions, remain sparse. In this paper, we provide a theoretical guarantee of generating data distribution by a progressive flow model, the so-called JKO flow model, which implements the Jordan-Kinderleherer-Otto (JKO) scheme in a normalizing flow network. Leveraging the exponential convergence of the proximal gradient descent (GD) in Wasserstein space, we prove the Kullback-Leibler (KL) guarantee of data generation by a JKO flow model to be $O(\varepsilon^2)$ when using $N \lesssim \log (1/\varepsilon)$ many JKO steps ($N$ Residual Blocks in the flow) where $\varepsilon $ is the error in the per-step first-order condition. The assumption on data density is merely a finite second moment, and the theory extends to data distributions without density and when there are inversion errors in the reverse process where we obtain KL-$W_2$ mixed error guarantees. The non-asymptotic convergence rate of the JKO-type $W_2$-proximal GD is proved for a general class of convex objective functionals that includes the KL divergence as a special case, which can be of independent interest.
Abstract（参考訳）: フローベースの生成モデルは、データ生成と可能性の計算において一定の利点を享受し、最近は競争力のある経験的性能を示している。関連するスコアベース拡散モデルに関する理論的研究と比べ、前方方向(データ-ノイズ)と逆方向(ノイズ-データ)の両方で決定論的なフローモデルの解析はいまだに不十分である。本稿では,Jordan-Kinderleherer-Otto(JKO)方式を正規化フローネットワークに実装した,プログレッシブフローモデルであるJKOフローモデルによりデータ分散を生成する理論的保証を提供する。ワッサーシュタイン空間における近位勾配降下(GD)の指数収束を利用して、JKOフローモデルによるデータ生成のKL(Kullback-Leibler)保証が$O(\varepsilon^2)$であると証明し、$N \lesssim \log (1/\varepsilon)$多くのJKOステップ(フロー内のResidual Blocks)を使用する場合、$\varepsilon $はステップ1次条件の誤差である。データ密度の仮定は単に有限第二モーメントであり、この理論は密度のないデータ分布と、KL-$W_2$混合誤差を保証する逆過程に逆誤差が存在する場合に拡張される。 JKO型$W_2$-proximal GDの非漸近収束速度は、KLの発散を特別な場合として含む凸対象汎函数の一般クラスに対して証明され、これは独立な興味を持つことができる。

関連論文リスト

A Sharp KL-Convergence Analysis for Diffusion Models under Minimal Assumptions [20.628481624954187]
拡散に基づく生成モデルは、高品質なサンプルを合成するための非常に効果的な方法として登場した。最近の研究は、最小限の仮定で生成プロセスの収束を分析することに重点を置いている。我々は$varepsilon$への依存を改善する洗練された分析法を提案する。
論文参考訳（メタデータ） (2025-08-22T11:29:06Z)
Wasserstein Convergence of Score-based Generative Models under Semiconvexity and Discontinuous Gradients [0.0]
スコアベース生成モデル(SGM)は、ガウス雑音で摂動させ、学習された拡散過程を通じてデノベーションすることで、データ分布を近似する。我々は、潜在的に不連続な勾配を持つ半1次を対象とするSGMに対して、最初の非同相なワッサーシュタイン-2収束保証を確立する。
論文参考訳（メタデータ） (2025-05-06T11:17:15Z)
Gaussian Mixture Flow Matching Models [51.976452482535954]
拡散モデルは正規分布をガウス平均として近似し,その平均を推定する一方,フローマッチングモデルはガウス平均をフロー速度としてパラメータ化する。離散化誤差による数段階のサンプリングでは性能が低下し、分類器フリーガイダンス(CFG)では過飽和色が生じる傾向にある。本稿では,CFGの過飽和問題を緩和し,画像生成品質を向上する新しい確率的ガイダンス手法を提案する。
論文参考訳（メタデータ） (2025-04-07T17:59:42Z)
Advancing Wasserstein Convergence Analysis of Score-Based Models: Insights from Discretization and Second-Order Acceleration [5.548787731232499]
スコアベース拡散モデルのワッサーシュタイン収束解析に着目する。我々は、オイラー離散化、指数中点法、ランダム化法など、様々な離散化スキームを比較する。局所線形化法に基づく加速型サンプリング器を提案する。
論文参考訳（メタデータ） (2025-02-07T11:37:51Z)
Straightness of Rectified Flow: A Theoretical Insight into Wasserstein Convergence [54.580605276017096]
拡散モデルは画像生成とデノナイズのための強力なツールとして登場した。最近、Liuらは新しい代替生成モデル Rectified Flow (RF) を設計した。 RFは,一連の凸最適化問題を用いて,ノイズからデータへの直流軌跡の学習を目的としている。
論文参考訳（メタデータ） (2024-10-19T02:36:11Z)
O(d/T) Convergence Theory for Diffusion Probabilistic Models under Minimal Assumptions [6.76974373198208]
最小の仮定の下で,拡散確率モデル(DDPM)の高速収束理論を確立する。収束率は$O(k/T)$に改善され、$k$は対象データ分布の内在次元であることを示す。これはDDPMが未知の低次元構造に自動的に適応する能力を強調している。
論文参考訳（メタデータ） (2024-09-27T17:59:10Z)
A Sharp Convergence Theory for The Probability Flow ODEs of Diffusion Models [45.60426164657739]
拡散型サンプリング器の非漸近収束理論を開発する。我々は、$d/varepsilon$がターゲット分布を$varepsilon$トータル偏差距離に近似するのに十分であることを証明した。我々の結果は、$ell$のスコア推定誤差がデータ生成プロセスの品質にどのように影響するかも特徴付ける。
論文参考訳（メタデータ） (2024-08-05T09:02:24Z)
Generative Modeling by Minimizing the Wasserstein-2 Loss [1.2277343096128712]
本稿では,分布依存常微分方程式(ODE)を用いて2次ワッサーシュタイン損失($W$損失)を最小化することにより,教師なし学習問題にアプローチする。主要な結果から、ODE の時空間法則は、$W$損失に対して勾配流を形成し、真のデータ分布に指数関数的に収束することを示す。アルゴリズムはスキームに従い、永続的なトレーニングを適用することで設計されます。
論文参考訳（メタデータ） (2024-06-19T15:15:00Z)
Closed-form Filtering for Non-linear Systems [83.91296397912218]
我々は密度近似と計算効率の面でいくつかの利点を提供するガウスPSDモデルに基づく新しいフィルタのクラスを提案する。本研究では,遷移や観測がガウスPSDモデルである場合,フィルタリングを効率的にクローズド形式で行うことができることを示す。提案する推定器は, 近似の精度に依存し, 遷移確率の正則性に適応する推定誤差を伴って, 高い理論的保証を享受する。
論文参考訳（メタデータ） (2024-02-15T08:51:49Z)
Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文参考訳（メタデータ） (2023-06-15T16:30:08Z)
Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文参考訳（メタデータ） (2022-11-30T05:33:29Z)
Wasserstein Distributional Learning [5.830831796910439]
Wasserstein Distributional Learning (WDL)はフレキシブルな密度オンスカラー回帰モデリングフレームワークである。 WDLは, 条件密度の非線形依存性をよりよく特徴付け, 明らかにする。シミュレーションと実世界の応用を通してWDLフレームワークの有効性を実証する。
論文参考訳（メタデータ） (2022-09-12T02:32:17Z)
Discrete Denoising Flows [87.44537620217673]
分類的確率変数に対する離散的フローベースモデル(DDF)を提案する。他の離散フローベースモデルとは対照的に、我々のモデルは勾配バイアスを導入することなく局所的に訓練することができる。そこで本研究では, DDFs が離散フローより優れていることを示し, 対数類似度で測定した2値MNIST と Cityscapes のセグメンテーションマップをモデル化した。
論文参考訳（メタデータ） (2021-07-24T14:47:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。