論文の概要: Flow Diverse and Efficient: Learning Momentum Flow Matching via Stochastic Velocity Field Sampling
- arxiv url: http://arxiv.org/abs/2506.08796v1
- Date: Tue, 10 Jun 2025 13:44:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 15:11:42.560786
- Title: Flow Diverse and Efficient: Learning Momentum Flow Matching via Stochastic Velocity Field Sampling
- Title(参考訳): 流れの多様性と効率:確率速度場サンプリングによるモーメントフローマッチングの学習
- Authors: Zhiyuan Ma, Ruixun Liu, Sixian Liu, Jianjun Li, Bowen Zhou,
- Abstract要約: フローベース拡散モデルにおける新しい最先端技術として整流流(RF)が出現している。
本稿では,新しい整流モデルである離散RFについて述べる。
本稿では,その方向を変えるためにサブパスのベロシティ$bm対$のノイズを導入し,多様性とマルチスケールノイズモデリング能力を向上する。
- 参考スコア(独自算出の注目度): 23.57202605415588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, the rectified flow (RF) has emerged as the new state-of-the-art among flow-based diffusion models due to its high efficiency advantage in straight path sampling, especially with the amazing images generated by a series of RF models such as Flux 1.0 and SD 3.0. Although a straight-line connection between the noisy and natural data distributions is intuitive, fast, and easy to optimize, it still inevitably leads to: 1) Diversity concerns, which arise since straight-line paths only cover a fairly restricted sampling space. 2) Multi-scale noise modeling concerns, since the straight line flow only needs to optimize the constant velocity field $\bm v$ between the two distributions $\bm\pi_0$ and $\bm\pi_1$. In this work, we present Discretized-RF, a new family of rectified flow (also called momentum flow models since they refer to the previous velocity component and the random velocity component in each diffusion step), which discretizes the straight path into a series of variable velocity field sub-paths (namely ``momentum fields'') to expand the search space, especially when close to the distribution $p_\text{noise}$. Different from the previous case where noise is directly superimposed on $\bm x$, we introduce noise on the velocity $\bm v$ of the sub-path to change its direction in order to improve the diversity and multi-scale noise modeling abilities. Experimental results on several representative datasets demonstrate that learning momentum flow matching by sampling random velocity fields will produce trajectories that are both diverse and efficient, and can consistently generate high-quality and diverse results. Code is available at https://github.com/liuruixun/momentum-fm.
- Abstract(参考訳): 近年,Flux 1.0 や SD 3.0 といった一連の RF モデルによって生成される驚くべき画像とともに,流路サンプリングにおける高効率の優位性により,流路拡散モデルの新たな最先端技術として整流流流(RF)が出現している。
ノイズの多いデータディストリビューションと自然データディストリビューションの直線接続は直感的で、高速で、最適化が簡単ですが、それでも必然的に次のようになります。
1) 直線経路がかなり制限されたサンプリング空間のみをカバーすることから生じる多様性の懸念。
2) 直線流は, 2つの分布間の定数速度場$\bm v$, $\bm\pi_0$, $\bm\pi_1$を最適化するだけでよい。
本稿では,新しい整流系である離散RF(運動量フローモデルとも呼ばれる)について述べる。これは,分布が$p_\text{noise}$に近づくと,直進路を一連の可変速度場サブパス("momentum field'''")に離散化し,探索空間を拡大する。
ノイズが直接$\bm x$に重畳される従来の場合と異なり、音速上のノイズをサブパスの$\bm v$で導入して、多様性とマルチスケールノイズモデリング能力を向上する。
いくつかの代表的なデータセットに対する実験結果から,ランダムな速度場をサンプリングすることによって学習運動量フローマッチングが,多種多様かつ効率的であり,高品質で多種多様な結果が得られる軌道を生成することが示されている。
コードはhttps://github.com/liuruixun/momentum-fm.comで入手できる。
関連論文リスト
- Rectified Flows for Fast Multiscale Fluid Flow Modeling [11.597597438962026]
時間依存速度場を学習する修正フローフレームワークを提案する。
我々の手法は、各統合ステップをより効果的にし、わずか8ステップで済むようにします。
マルチスケール・フロー・ベンチマーク実験により, 整流流は拡散モデルと同じ後部分布を回復することが示された。
論文 参考訳(メタデータ) (2025-06-03T17:40:39Z) - FlowDPS: Flow-Driven Posterior Sampling for Inverse Problems [51.99765487172328]
逆問題解決のための後部サンプリングは,フローを用いて効果的に行うことができる。
Flow-Driven Posterior Smpling (FlowDPS) は最先端の代替手段よりも優れています。
論文 参考訳(メタデータ) (2025-03-11T07:56:14Z) - Towards Hierarchical Rectified Flow [18.976435451156824]
階層的な整流流を定式化し、データ分布をモデル化する。
我々は、既知のソース分布からデータ分布を生成する時間差分プロセスを経験的に定義する。
我々は,MNIST,CIFAR-10,ImageNet-32データとともに,合成1Dおよび2Dデータ上でこれを検証する。
論文 参考訳(メタデータ) (2025-02-24T18:59:55Z) - On the Wasserstein Convergence and Straightness of Rectified Flow [54.580605276017096]
Rectified Flow (RF) は、ノイズからデータへの直流軌跡の学習を目的とした生成モデルである。
RFのサンプリング分布とターゲット分布とのワッサーシュタイン距離に関する理論的解析を行った。
本稿では,従来の経験的知見と一致した1-RFの特異性と直線性を保証する一般的な条件について述べる。
論文 参考訳(メタデータ) (2024-10-19T02:36:11Z) - FlowTurbo: Towards Real-time Flow-Based Image Generation with Velocity Refiner [70.90505084288057]
フローベースモデルはサンプリングプロセス中により直線的なサンプリング軌道を生成する傾向にある。
擬似修正器やサンプル認識コンパイルなどいくつかの手法を導入し,推論時間をさらに短縮する。
FlowTurboはImageNet上で100(ms/img)で2.12FID、38(ms/img)で3.93FIDに達する
論文 参考訳(メタデータ) (2024-09-26T17:59:51Z) - Consistency Flow Matching: Defining Straight Flows with Velocity Consistency [97.28511135503176]
本稿では,速度場の自己整合性を明示する新しいFM法であるConsistency Flow Matching(Consistency-FM)を紹介する。
予備実験により、一貫性FMは、一貫性モデルよりも4.4倍速く収束することにより、トレーニング効率を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-07-02T16:15:37Z) - Exploring Straighter Trajectories of Flow Matching with Diffusion
Guidance [66.4153984834872]
フローマッチング(StraightFM)のストレートトラジェクトリを提案する。
分布レベル全体から拡散モデルによって導かれる結合戦略により軌道を直線化する。
拡散法と従来のフローマッチング法の間で、FIDが低い視覚的に魅力的な画像を生成する。
論文 参考訳(メタデータ) (2023-11-28T06:19:30Z) - Fast Sampling of Diffusion Models via Operator Learning [74.37531458470086]
我々は,拡散モデルのサンプリング過程を高速化するために,確率フロー微分方程式の効率的な解法であるニューラル演算子を用いる。
シーケンシャルな性質を持つ他の高速サンプリング手法と比較して、並列復号法を最初に提案する。
本稿では,CIFAR-10では3.78、ImageNet-64では7.83の最先端FIDを1モデル評価環境で達成することを示す。
論文 参考訳(メタデータ) (2022-11-24T07:30:27Z) - Gravitational-wave parameter estimation with autoregressive neural
network flows [0.0]
深部ニューラルネットワークを用いた重力波データから二元ブラックホール系のパラメータを高速に推定するための自己回帰正規化フローを導入する。
正規化フロー(英: normalizing flow)は、単純な確率分布からより複雑なものへの変換を誘導するために用いられるサンプル空間上の可逆写像である。
可変オートエンコーダフレームワークに自己回帰フローを組み込むことにより,より強力な潜在変数モデルを構築する。
論文 参考訳(メタデータ) (2020-02-18T15:44:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。