論文の概要: Warm Diffusion: Recipe for Blur-Noise Mixture Diffusion Models
- arxiv url: http://arxiv.org/abs/2511.16904v1
- Date: Fri, 21 Nov 2025 02:37:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:18.864533
- Title: Warm Diffusion: Recipe for Blur-Noise Mixture Diffusion Models
- Title(参考訳): 温度拡散:Blur-Noise混合拡散モデルの準備
- Authors: Hao-Chien Hsueh, Chi-En Yen, Wen-Hsiao Peng, Ching-Chun Huang,
- Abstract要約: 熱拡散は、高周波画像の細部と低周波構造との強い相関をうまく利用できないと我々は主張する。
本稿では,Blur-Noise Mixture Diffusion Model(BNMD)を提案する。
- 参考スコア(独自算出の注目度): 14.963168108932761
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Diffusion probabilistic models have achieved remarkable success in generative tasks across diverse data types. While recent studies have explored alternative degradation processes beyond Gaussian noise, this paper bridges two key diffusion paradigms: hot diffusion, which relies entirely on noise, and cold diffusion, which uses only blurring without noise. We argue that hot diffusion fails to exploit the strong correlation between high-frequency image detail and low-frequency structures, leading to random behaviors in the early steps of generation. Conversely, while cold diffusion leverages image correlations for prediction, it neglects the role of noise (randomness) in shaping the data manifold, resulting in out-of-manifold issues and partially explaining its performance drop. To integrate both strengths, we propose Warm Diffusion, a unified Blur-Noise Mixture Diffusion Model (BNMD), to control blurring and noise jointly. Our divide-and-conquer strategy exploits the spectral dependency in images, simplifying score model estimation by disentangling the denoising and deblurring processes. We further analyze the Blur-to-Noise Ratio (BNR) using spectral analysis to investigate the trade-off between model learning dynamics and changes in the data manifold. Extensive experiments across benchmarks validate the effectiveness of our approach for image generation.
- Abstract(参考訳): 拡散確率モデルは多種多様なデータ型にまたがる生成タスクにおいて顕著な成功を収めた。
最近の研究では、ガウスノイズ以外の別の劣化過程について研究されているが、この論文では、ノイズに完全に依存する熱拡散と、ノイズのないぼかしのみを使用する冷拡散という2つの主要な拡散パラダイムを橋渡ししている。
熱拡散は、高周波画像の細部と低周波構造との強い相関を利用しており、生成の初期段階におけるランダムな挙動をもたらすと論じる。
逆に、コールド拡散は画像相関を利用して予測を行うが、データ多様体の形成におけるノイズ(ランダム性)の役割を無視する。
両強みを統合するため,Blur-Noise Mixture Diffusion Model (BNMD) を統一したワーム拡散モデル(Warm Diffusion)を提案する。
分割・分散戦略は画像のスペクトル依存性を利用して,デノイング・デブロワー処理の分離によるスコアモデル推定を単純化する。
さらに、スペクトル分析を用いてBlur-to-Noise Ratio(BNR)を分析し、モデル学習力学とデータ多様体の変化の間のトレードオフについて検討する。
ベンチマークによる大規模な実験により、画像生成に対する我々のアプローチの有効性が検証された。
関連論文リスト
- Noise Aggregation Analysis Driven by Small-Noise Injection: Efficient Membership Inference for Diffusion Models [19.763802072516228]
主要な関心事は、モデルトレーニングプロセスで特定のデータサンプルが使用されたかどうかを判断しようとするメンバシップ推論攻撃である。
本稿では,拡散モデルに対する効率的なメンバーシップ推論手法を提案する。
また,大規模なテキスト・画像拡散モデルに直面する場合,ASRとAUCの攻撃効果も向上する。
論文 参考訳(メタデータ) (2025-10-18T16:28:48Z) - Immiscible Diffusion: Accelerating Diffusion Training with Noise Assignment [56.609042046176555]
準最適雑音データマッピングは拡散モデルの遅い訓練につながる。
物理学における不和性現象からインスピレーションを得て,不和性拡散を提案する。
我々のアプローチは極めて単純で、各画像の拡散可能な領域を制限するために1行のコードしか必要としない。
論文 参考訳(メタデータ) (2024-06-18T06:20:42Z) - Blue noise for diffusion models [50.99852321110366]
本稿では,画像内および画像間の相関雑音を考慮した拡散モデルを提案する。
我々のフレームワークは、勾配流を改善するために、1つのミニバッチ内に画像間の相関を導入することができる。
本手法を用いて,各種データセットの質的,定量的な評価を行う。
論文 参考訳(メタデータ) (2024-02-07T14:59:25Z) - Diffusion Models With Learned Adaptive Noise [12.530583016267768]
本稿では,拡散過程がデータから学べるかどうかを考察する。
広く信じられている仮定は、ELBOはノイズプロセスに不変であるということである。
画像間で異なる速度でノイズを印加する学習拡散過程であるMULANを提案する。
論文 参考訳(メタデータ) (2023-12-20T18:00:16Z) - Denoising Diffusion Bridge Models [54.87947768074036]
拡散モデルは、プロセスを使用してデータにノイズをマッピングする強力な生成モデルである。
画像編集のような多くのアプリケーションでは、モデル入力はランダムノイズではない分布から来る。
本研究では, DDBM(Denoising Diffusion Bridge Models)を提案する。
論文 参考訳(メタデータ) (2023-09-29T03:24:24Z) - PartDiff: Image Super-resolution with Partial Diffusion Models [3.8435187580887717]
拡散確率モデル(DDPM)は,様々な画像生成タスクにおいて顕著な性能を達成している。
DDPMは、ランダムノイズから反復的にデノイングすることで、新しいデータを生成する。
しかし、拡散に基づく生成モデルは、多くのデノナイジングステップのために高い計算コストに悩まされる。
本稿では,部分拡散モデル (PartDiff) を提案する。
論文 参考訳(メタデータ) (2023-07-21T22:11:23Z) - VideoFusion: Decomposed Diffusion Models for High-Quality Video
Generation [88.49030739715701]
本研究は, フレームごとのノイズを, 全フレーム間で共有されるベースノイズ, 時間軸に沿って変化する残雑音に分解することで, 拡散過程を分解する。
様々なデータセットの実験により,ビデオフュージョンと呼ばれる我々の手法が,高品質なビデオ生成において,GANベースと拡散ベースの両方の選択肢を上回ることが確認された。
論文 参考訳(メタデータ) (2023-03-15T02:16:39Z) - Come-Closer-Diffuse-Faster: Accelerating Conditional Diffusion Models
for Inverse Problems through Stochastic Contraction [31.61199061999173]
拡散モデルには重要な欠点がある。純粋なガウスノイズから画像を生成するために数千ステップの反復を必要とするため、サンプリングが本質的に遅い。
ガウスノイズから始めることは不要であることを示す。代わりに、より優れた初期化を伴う単一前方拡散から始めると、逆条件拡散におけるサンプリングステップの数を大幅に減少させる。
ComeCloser-DiffuseFaster (CCDF)と呼ばれる新しいサンプリング戦略は、逆問題に対する既存のフィードフォワードニューラルネットワークアプローチが拡散モデルと相乗的に組み合わせられる方法について、新たな洞察を明らかにしている。
論文 参考訳(メタデータ) (2021-12-09T04:28:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。