論文の概要: Multi-Scale Generative Modeling with Heat Dissipation Flow Matching
- arxiv url: http://arxiv.org/abs/2605.19371v1
- Date: Tue, 19 May 2026 05:08:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.135566
- Title: Multi-Scale Generative Modeling with Heat Dissipation Flow Matching
- Title(参考訳): 熱散逸流マッチングを用いたマルチスケール生成モデル
- Authors: Jun Ma, Hanquan Zhang, Yanjun Qin, Haoyuan Guan, Ke Zhang,
- Abstract要約: 拡散モデルは画像生成に広く使われており、ほとんどはノイズベースの汚損とノイズの除去に依存している。
異なるブランチでは、ブラーをメインの汚職として使用し、より優れたカラー予算とマルチスケールの詳細をマルチスケールで提供することで保存する。
本研究では, 連続的ぼやけた(熱散布)プロセスをフローマッチング (FM) に導入し, 複数スケールの先行を注入する熱散布フローマッチング (HDFM) を提案する。
- 参考スコア(独自算出の注目度): 8.67799593356029
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Diffusion models are widely used in image generation, with most relying on noise-based corruption and denoising. A distinct branch instead uses blur as the main corruption, preserving better color budgets and multi-scale detail by providing multi-scale priors. However, blur-based models remain in SDE-based frameworks and are not integrated into ODE-based frameworks, such as Flow Matching (FM). Meanwhile, in the blur-based formulation, the classical inverse heat-dissipation (IHD) process faces an ill-posed challenge. Moreover, under the data-manifold assumption, regressing blurred images from high-dimensional noise (or velocity) space is also difficult. We propose Heat Dissipation Flow Matching (HDFM), which introduces a continuous blurred (heat-dissipation) process into FM to inject multi-scale priors. HDFM aligns an interpolated heat-dissipation path to address ill-posedness and adopts $x$-prediction to mitigate high-dimensional regression difficulty. Toy experiments and ablation studies show that HDFM consistently benefits from both blur and $x$-prediction. The performance of HDFM outperforms most baseline methods on all datasets.
- Abstract(参考訳): 拡散モデルは画像生成に広く使われており、ほとんどはノイズベースの汚損とノイズの除去に依存している。
異なるブランチは、代わりにメインの汚職としてぼやけを使い、より優れたカラー予算とマルチスケールの詳細をマルチスケールで提供することで保存する。
しかし、ボケベースのモデルはSDEベースのフレームワークに留まり、Flow Matching(FM)のようなODEベースのフレームワークには統合されていない。
一方、ぼやけに基づく定式化では、古典的逆熱散逸(IHD)プロセスは不適切な課題に直面している。
さらに,データマンフォールド仮定の下では,高次元ノイズ(速度)空間からのぼやけた画像の回帰も困難である。
本研究では, 連続的ぼかし(放熱)処理をFMに導入し, マルチスケールの先駆体を注入する熱拡散流マッチング(HDFM)を提案する。
HDFMは補間された熱散逸経路を整列して不測に対処し、高次元の回帰困難を軽減するために$x$-predictionを採用する。
トイ実験とアブレーション研究により、HDFMはぼやけと$x$-predictionの双方から一貫して恩恵を受けていることが示されている。
HDFMの性能は、すべてのデータセット上で、ほとんどのベースラインメソッドより優れています。
関連論文リスト
- BlindDiff: Empowering Degradation Modelling in Diffusion Models for Blind Image Super-Resolution [52.47005445345593]
BlindDiff は SISR のブラインド劣化に対処するための DM ベースのブラインドSR 手法である。
BlindDiffはMAPベースの最適化をDMにシームレスに統合する。
合成データセットと実世界のデータセットの両方の実験は、BlindDiffが最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2024-03-15T11:21:34Z) - Denoising Diffusion Bridge Models [54.87947768074036]
拡散モデルは、プロセスを使用してデータにノイズをマッピングする強力な生成モデルである。
画像編集のような多くのアプリケーションでは、モデル入力はランダムノイズではない分布から来る。
本研究では, DDBM(Denoising Diffusion Bridge Models)を提案する。
論文 参考訳(メタデータ) (2023-09-29T03:24:24Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。