論文の概要: One-Step Generative Modeling via Wasserstein Gradient Flows
- arxiv url: http://arxiv.org/abs/2605.11755v1
- Date: Tue, 12 May 2026 08:29:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.713451
- Title: One-Step Generative Modeling via Wasserstein Gradient Flows
- Title(参考訳): ワッサーシュタイン勾配流によるワンステップ生成モデリング
- Authors: Jiaqi Han, Puheng Li, Qiushan Guo, Renyuan Xu, Stefano Ermon, Emmanuel J. Candès,
- Abstract要約: W-Flowは、単純な参照分布からサンプルをターゲットデータ分布からサンプルに変換するジェネレータを1ステップでトレーニングするフレームワークである。
我々は1ステップのImageNet 256$times$256 生成のための新しい技術状況を設定し、モードカバレッジとドメイン転送を改善した 1.29 FID を達成した。
- 参考スコア(独自算出の注目度): 56.266175641614986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models and flow-based methods have shown impressive generative capability, especially for images, but their sampling is expensive because it requires many iterative updates. We introduce W-Flow, a framework for training a generator that transforms samples from a simple reference distribution into samples from a target data distribution in a single step. This is achieved in two steps: we first define an evolution from the reference distribution to the target distribution through a Wasserstein gradient flow that minimizes an energy functional; second, we train a static neural generator to compress this evolution into one-step generation. We instantiate the energy functional with the Sinkhorn divergence, which yields an efficient optimal-transport-based update rule that captures global distributional discrepancy and improves coverage of the target distribution. We further prove that the finite-sample training dynamics converge to the continuous-time distributional dynamics under suitable assumptions. Empirically, W-Flow sets a new state of the art for one-step ImageNet 256$\times$256 generation, achieving 1.29 FID, with improved mode coverage and domain transfer. Compared to multi-step diffusion models with similar FID scores, our method yields approximately 100$\times$ faster sampling. These results show that Wasserstein gradient flows provide a principled and effective foundation for fast and high-fidelity generative modeling.
- Abstract(参考訳): 拡散モデルとフローベース手法は、特に画像において顕著な生成能力を示しているが、多くの反復的な更新を必要とするため、サンプリングは高価である。
W-Flowは、単純な参照分布からサンプルを単一のステップで対象データ分布からサンプルに変換するジェネレータのトレーニングフレームワークである。
まず、エネルギー関数を最小化するワッサーシュタイン勾配流を用いて、基準分布から目標分布への進化を定義する。
我々は,Sinkhornの発散によるエネルギー関数のインスタンス化を行い,グローバルな分布の不一致を捕捉し,対象分布のカバレッジを向上する効率的な最適トランスポートベースの更新ルールを導出する。
さらに、有限サンプルのトレーニング力学が適切な仮定の下で連続時間分布力学に収束することを証明した。
経験的に、W-Flowは1ステップのImageNet 256$\times$256 生成のための新しい最先端をセットし、1.29 FIDを達成し、モードカバレッジとドメイン転送を改善した。
FIDスコアが類似した多段階拡散モデルと比較すると,本手法はより高速なサンプリングを約100$\times$とする。
これらの結果は、ワッサーシュタイン勾配流が高速かつ高忠実な生成モデリングの原理的かつ効果的な基礎を提供することを示している。
関連論文リスト
- FlowConsist: Make Your Flow Consistent with Real Trajectory [99.22869983378062]
現在の高速フロートレーニングパラダイムには,2つの根本的な問題がある,と我々は主張する。
ランダムにペアリングされたノイズデータサンプルから構築された条件付き速度は、系統的な軌跡ドリフトを導入する。
本研究では,高速フローにおける軌道整合性を実現するためのトレーニングフレームワークであるFlowConsistを提案する。
論文 参考訳(メタデータ) (2026-02-06T03:24:23Z) - Transport Based Mean Flows for Generative Modeling [19.973366424307077]
フローマッチング生成モデルは、連続データ生成の強力なパラダイムとして現れています。
これらのモデルは、多数のシーケンシャルサンプリングステップを必要とするため、推論が遅い。
最近の研究はサンプリングステップの数を減らして推論を加速させようとしている。
論文 参考訳(メタデータ) (2025-09-26T17:12:19Z) - Align Your Flow: Scaling Continuous-Time Flow Map Distillation [63.927438959502226]
フローマップは、任意の2つのノイズレベルを1ステップで接続し、すべてのステップカウントで有効に保ちます。
画像生成ベンチマークにおいて、Align Your Flowと呼ばれるフローマップモデルを広範囲に検証する。
テキスト条件付き合成において、既存の非横断的訓練された数ステップのサンプルよりも優れたテキスト間フローマップモデルを示す。
論文 参考訳(メタデータ) (2025-06-17T15:06:07Z) - Mean Flows for One-step Generative Modeling [64.4997821467102]
本稿では,一段階生成モデリングのための原理的かつ効果的なフレームワークを提案する。
ニューラルネットワークトレーニングのガイドには,平均速度と瞬時速度を適切に定義したアイデンティティが導出され,使用される。
提案手法はMeanFlowモデルと呼ばれ,自己完結型であり,事前学習,蒸留,カリキュラム学習は不要である。
論文 参考訳(メタデータ) (2025-05-19T17:59:42Z) - Improving Consistency Models with Generator-Augmented Flows [16.049476783301724]
一貫性モデルは、ニューラルネットワークの単一前方通過におけるスコアベース拡散の多段階サンプリングを模倣する。
それらは、一貫性の蒸留と一貫性のトレーニングの2つの方法を学ぶことができる。
本稿では,一貫性モデルから得られたノイズデータを対応する出力へ転送する新しい流れを提案する。
論文 参考訳(メタデータ) (2024-06-13T20:22:38Z) - Flow map matching with stochastic interpolants: A mathematical framework for consistency models [15.520853806024943]
フローマップマッチングは、基礎となる生成モデルの2時間フローマップを学ぶための原則化されたフレームワークである。
FMMは,高速サンプリングのための既存手法の幅広いクラスを統一し,拡張することを示す。
論文 参考訳(メタデータ) (2024-06-11T17:41:26Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z) - Fast Sampling of Diffusion Models via Operator Learning [74.37531458470086]
我々は,拡散モデルのサンプリング過程を高速化するために,確率フロー微分方程式の効率的な解法であるニューラル演算子を用いる。
シーケンシャルな性質を持つ他の高速サンプリング手法と比較して、並列復号法を最初に提案する。
本稿では,CIFAR-10では3.78、ImageNet-64では7.83の最先端FIDを1モデル評価環境で達成することを示す。
論文 参考訳(メタデータ) (2022-11-24T07:30:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。