論文の概要: MixFlow: Mixed Source Distributions Improve Rectified Flows
- arxiv url: http://arxiv.org/abs/2604.09181v1
- Date: Fri, 10 Apr 2026 10:06:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.81857
- Title: MixFlow: Mixed Source Distributions Improve Rectified Flows
- Title(参考訳): MixFlow: ソースの混合分布が整流性を改善する
- Authors: Nazir Nayal, Christopher Wewer, Jan Eric Lenssen,
- Abstract要約: 拡散モデルとその変種(整流など)は、多彩で高品質な画像を生成する。
それらは、彼らが学習する高度に湾曲した生成経路によって引き起こされる、遅い反復的なサンプリングによって妨げられる。
生成経路曲率を低減し,サンプリング効率を大幅に向上させる訓練戦略であるMixFlowを提案する。
- 参考スコア(独自算出の注目度): 18.451270798004344
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models and their variations, such as rectified flows, generate diverse and high-quality images, but they are still hindered by slow iterative sampling caused by the highly curved generative paths they learn. An important cause of high curvature, as shown by previous work, is independence between the source distribution (standard Gaussian) and the data distribution. In this work, we tackle this limitation by two complementary contributions. First, we attempt to break away from the standard Gaussian assumption by introducing $κ\texttt{-FC}$, a general formulation that conditions the source distribution on an arbitrary signal $κ$ that aligns it better with the data distribution. Then, we present MixFlow, a simple but effective training strategy that reduces the generative path curvatures and considerably improves sampling efficiency. MixFlow trains a flow model on linear mixtures of a fixed unconditional distribution and a $κ\texttt{-FC}$-based distribution. This simple mixture improves the alignment between the source and data, provides better generation quality with less required sampling steps, and accelerates the training convergence considerably. On average, our training procedure improves the generation quality by 12\% in FID compared to standard rectified flow and 7\% compared to previous baselines under a fixed sampling budget. Code available at: $\href{https://github.com/NazirNayal8/MixFlow}{https://github.com/NazirNayal8/MixFlow}$
- Abstract(参考訳): 拡散モデルとその変種(整流流など)は多彩で高品質な画像を生成するが、それらが学習する高度に湾曲した生成経路によって引き起こされる遅い反復サンプリングによって妨げられている。
以前の研究で示されているように、高い曲率の重要な原因は、ソース分布(標準ガウス)とデータ分布の独立性である。
本研究では,2つの補完的な貢献によって,この制限に対処する。
まず、任意の信号でソース分布を条件づける一般的な定式化である$κ\texttt{-FC}$を導入して、標準ガウスの仮定から切り離そうとする。
そこで本研究では,生成経路の曲率を低減し,サンプリング効率を大幅に向上させる,シンプルだが効果的なトレーニング戦略であるMixFlowを提案する。
MixFlowは、固定された無条件分布と$κ\texttt{-FC}$-based分布の線形混合上でフローモデルを訓練する。
この単純な混合は、ソースとデータのアライメントを改善し、より少ないサンプリングステップでより良い生成品質を提供し、トレーニング収束を大幅に加速する。
本訓練は, 標準整流法に比べてFIDの12%, 従来の基準線法に比べて75%向上した。
$\href{https://github.com/NazirNayal8/MixFlow}{https://github.com/NazirNayal8/MixFlow}$
関連論文リスト
- Gaussian Mixture Flow Matching Models [63.092956669059824]
拡散モデルは正規分布をガウス平均として近似し,その平均を推定する一方,フローマッチングモデルはガウス平均をフロー速度としてパラメータ化する。
離散化誤差による数段階のサンプリングでは性能が低下し、分類器フリーガイダンス(CFG)では過飽和色が生じる傾向にある。
本稿では,CFGの過飽和問題を緩和し,画像生成品質を向上する新しい確率的ガイダンス手法を提案する。
論文 参考訳(メタデータ) (2025-04-07T17:59:42Z) - Boundary-aware Decoupled Flow Networks for Realistic Extreme Rescaling [49.215957313126324]
Invertible rescaling Network (IRN) やgenerative adversarial Network (GAN) などを含む最近の生成手法は、画像再スケーリングにおいて例外的な性能を示した。
しかし、IRNベースの手法は過度に滑らかな結果を生成する傾向にあり、一方、GANベースの手法は偽の細部を容易に生成する。
本稿では,現実的かつ視覚的に満足な結果を生成するために,境界対応デカップリングフローネットワーク(BDFlow)を提案する。
論文 参考訳(メタデータ) (2024-05-05T14:05:33Z) - MGF: Mixed Gaussian Flow for Diverse Trajectory Prediction [72.70572835589158]
本稿では,軌道予測のための正規化フローモデルに対して,混合ガウス前駆体を構築することを提案する。
提案手法は,一般的な UCY/ETH および SDD データセットにおける軌道アライメントと多様性の評価において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-02-19T15:48:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。