論文の概要: Laplacian Multi-scale Flow Matching for Generative Modeling
- arxiv url: http://arxiv.org/abs/2602.19461v1
- Date: Mon, 23 Feb 2026 03:09:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.657102
- Title: Laplacian Multi-scale Flow Matching for Generative Modeling
- Title(参考訳): 生成モデリングのためのラプラシアン多スケールフローマッチング
- Authors: Zelin Zhao, Petr Molodyk, Haotian Xue, Yongxin Chen,
- Abstract要約: 本稿では、画像生成モデルにマルチスケール表現を活用することにより、フローマッチングを強化する新しいフレームワークであるLaplacian multiscale flow matching(LapFlow)を提案する。
提案手法は,画像をラプラシアのピラミッド残差に分解し,因果的注意機構を備えた混合変圧器 (MoT) アーキテクチャを用いて異なるスケールの並列処理を行う。
- 参考スコア(独自算出の注目度): 23.408491192194926
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present Laplacian multiscale flow matching (LapFlow), a novel framework that enhances flow matching by leveraging multi-scale representations for image generative modeling. Our approach decomposes images into Laplacian pyramid residuals and processes different scales in parallel through a mixture-of-transformers (MoT) architecture with causal attention mechanisms. Unlike previous cascaded approaches that require explicit renoising between scales, our model generates multi-scale representations in parallel, eliminating the need for bridging processes. The proposed multi-scale architecture not only improves generation quality but also accelerates the sampling process and promotes scaling flow matching methods. Through extensive experimentation on CelebA-HQ and ImageNet, we demonstrate that our method achieves superior sample quality with fewer GFLOPs and faster inference compared to single-scale and multi-scale flow matching baselines. The proposed model scales effectively to high-resolution generation (up to 1024$\times$1024) while maintaining lower computational overhead.
- Abstract(参考訳): 本稿では、画像生成モデルにマルチスケール表現を活用することにより、フローマッチングを強化する新しいフレームワークであるLaplacian multiscale flow matching(LapFlow)を提案する。
提案手法は,画像をラプラシアのピラミッド残差に分解し,因果的注意機構を備えた混合変圧器 (MoT) アーキテクチャを用いて異なるスケールの並列処理を行う。
スケール間の明示的なレノジングを必要とする従来のケースケードアプローチとは異なり、我々のモデルは並列にマルチスケール表現を生成し、ブリッジングプロセスの必要性をなくす。
提案するマルチスケールアーキテクチャは, 生成品質の向上だけでなく, サンプリングプロセスの高速化や, スケーリングフローマッチング手法の促進にも寄与する。
CelebA-HQとImageNetの広範な実験を通して,本手法は単一スケールおよび複数スケールのフローマッチングベースラインと比較して,より少ないGFLOPと高速な推論で優れたサンプル品質を実現することを実証した。
提案したモデルは,計算オーバーヘッドを低く抑えながら,高分解能生成(最大1024$\times$1024)に効果的にスケールする。
関連論文リスト
- Know Your Step: Faster and Better Alignment for Flow Matching Models via Step-aware Advantages [6.470160796651034]
本研究では,画像モデルに対するフローマッチングテキストを,人間の好みによく適合した効率的な数ステップ生成器にトレーニングするための新しいフレームワークを提案する。
TAFS GRPOは画像生成のステップ数で高い性能を示し、生成した画像と人間の好みとのアライメントを大幅に改善する。
論文 参考訳(メタデータ) (2026-02-02T03:32:00Z) - GLASS Flows: Transition Sampling for Alignment of Flow and Diffusion Models [42.15046750300825]
GLASS Flowsは「フローマッチングモデル」をシミュレートしてマルコフ遷移をサンプリングする新しいサンプリングパラダイムである。
大規模テキスト・画像モデルでは,GLASSフローが進化と効率のトレードオフをなくすことが示されている。
論文 参考訳(メタデータ) (2025-09-29T17:58:36Z) - Transport Based Mean Flows for Generative Modeling [19.973366424307077]
フローマッチング生成モデルは、連続データ生成の強力なパラダイムとして現れています。
これらのモデルは、多数のシーケンシャルサンプリングステップを必要とするため、推論が遅い。
最近の研究はサンプリングステップの数を減らして推論を加速させようとしている。
論文 参考訳(メタデータ) (2025-09-26T17:12:19Z) - Improving Progressive Generation with Decomposable Flow Matching [50.63174319509629]
Decomposable Flow Matching (DFM)は、ビジュアルメディアのプログレッシブな生成のためのシンプルで効果的なフレームワークである。
Imagenet-1k 512pxでは、DFMはベースアーキテクチャよりも35.2%改善され、ベースラインは26.4%向上した。
論文 参考訳(メタデータ) (2025-06-24T17:58:02Z) - Align Your Flow: Scaling Continuous-Time Flow Map Distillation [63.927438959502226]
フローマップは、任意の2つのノイズレベルを1ステップで接続し、すべてのステップカウントで有効に保ちます。
画像生成ベンチマークにおいて、Align Your Flowと呼ばれるフローマップモデルを広範囲に検証する。
テキスト条件付き合成において、既存の非横断的訓練された数ステップのサンプルよりも優れたテキスト間フローマップモデルを示す。
論文 参考訳(メタデータ) (2025-06-17T15:06:07Z) - Oscillation Inversion: Understand the structure of Large Flow Model through the Lens of Inversion Method [60.88467353578118]
実世界のイメージを逆転させる固定点インスパイアされた反復的アプローチは収束を達成せず、異なるクラスタ間で振動することを示す。
本稿では,画像強調,ストロークベースのリカラー化,および視覚的プロンプト誘導画像編集を容易にする,シンプルで高速な分布転送手法を提案する。
論文 参考訳(メタデータ) (2024-11-17T17:45:37Z) - A Simple Approach to Unifying Diffusion-based Conditional Generation [63.389616350290595]
多様な条件生成タスクを処理するための、シンプルで統一されたフレームワークを導入します。
提案手法は,異なる推論時間サンプリング方式による多目的化を実現する。
我々のモデルは、非親密なアライメントや粗い条件付けのような追加機能をサポートしています。
論文 参考訳(メタデータ) (2024-10-15T09:41:43Z) - Normalizing Flows with Multi-Scale Autoregressive Priors [131.895570212956]
マルチスケール自己回帰前処理(mAR)を通した遅延空間におけるチャネルワイド依存性を導入する。
我々のmARは、分割結合フロー層(mAR-SCF)を持つモデルに先立って、複雑なマルチモーダルデータの依存関係をよりよく捉えます。
我々は,mAR-SCFにより画像生成品質が向上し,FIDとインセプションのスコアは最先端のフローベースモデルと比較して向上したことを示す。
論文 参考訳(メタデータ) (2020-04-08T09:07:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。