論文の概要: Elucidating the SNR-t Bias of Diffusion Probabilistic Models
- arxiv url: http://arxiv.org/abs/2604.16044v1
- Date: Fri, 17 Apr 2026 13:16:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.930324
- Title: Elucidating the SNR-t Bias of Diffusion Probabilistic Models
- Title(参考訳): 拡散確率モデルのSNR-tバイアスの解明
- Authors: Meng Yu, Lei Sun, Jianhao Zeng, Xiangxiang Chu, Kun Zhan,
- Abstract要約: 拡散モデルは、しばしば信号対雑音比時間ステップ(SNR-t)バイアスに悩まされる。
本稿では,SNR-tバイアスを軽減するための簡易かつ効果的な差分補正法を提案する。
提案手法は,様々な拡散モデルの生成品質を著しく向上させる。
- 参考スコア(独自算出の注目度): 28.312988944419516
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion Probabilistic Models have demonstrated remarkable performance across a wide range of generative tasks. However, we have observed that these models often suffer from a Signal-to-Noise Ratio-timestep (SNR-t) bias. This bias refers to the misalignment between the SNR of the denoising sample and its corresponding timestep during the inference phase. Specifically, during training, the SNR of a sample is strictly coupled with its timestep. However, this correspondence is disrupted during inference, leading to error accumulation and impairing the generation quality. We provide comprehensive empirical evidence and theoretical analysis to substantiate this phenomenon and propose a simple yet effective differential correction method to mitigate the SNR-t bias. Recognizing that diffusion models typically reconstruct low-frequency components before focusing on high-frequency details during the reverse denoising process, we decompose samples into various frequency components and apply differential correction to each component individually. Extensive experiments show that our approach significantly improves the generation quality of various diffusion models (IDDPM, ADM, DDIM, A-DPM, EA-DPM, EDM, PFGM++, and FLUX) on datasets of various resolutions with negligible computational overhead. The code is at https://github.com/AMAP-ML/DCW.
- Abstract(参考訳): 拡散確率モデルは、広範囲な生成タスクで顕著な性能を示した。
しかし,これらのモデルでは信号対雑音比時間ステップ(SNR-t)のバイアスがしばしば発生する。
このバイアスは、推論フェーズにおいて、デノナイジングサンプルのSNRと対応する時間ステップのミスアライメントを指す。
具体的には、トレーニング中、サンプルのSNRは、そのタイムステップと厳密に結合される。
しかし、この対応は推論中に破壊され、エラーの蓄積と生成品質を損なう。
我々は、この現象を裏付ける包括的実証的証拠と理論的解析を提供し、SNR-tバイアスを軽減するための単純かつ効果的な差分補正法を提案する。
拡散モデルでは, 逆復調過程において, 低周波成分を分解し, 個々の成分に差分補正を施すことで, 逆復調過程において高周波成分を分解する。
大規模実験により, 計算オーバーヘッドが無視できない様々な解像度のデータセット上で, 様々な拡散モデル(IDDPM, ADM, DDIM, A-DPM, EA-DPM, EDM, PFGM++, FLUX)の生成品質が大幅に向上することが示された。
コードはhttps://github.com/AMAP-ML/DCWにある。
関連論文リスト
- Mitigating the Noise Shift for Denoising Generative Models via Noise Awareness Guidance [54.88271057438763]
ノイズアウェアネスガイダンス (NAG) は、事前に定義された騒音スケジュールと整合性を保つために、サンプリング軌道を明示的に制御する補正手法である。
NAGは一貫してノイズシフトを緩和し、主流拡散モデルの生成品質を大幅に改善する。
論文 参考訳(メタデータ) (2025-10-14T13:31:34Z) - Noise Conditional Variational Score Distillation [60.38982038894823]
騒音条件変化スコア蒸留(NCVSD)は, 予混合拡散モデルから生成消音剤を蒸留する新しい方法である。
この知見を変分スコア蒸留フレームワークに組み込むことで、生成的デノイザのスケーラブルな学習を可能にする。
論文 参考訳(メタデータ) (2025-06-11T06:01:39Z) - A Fourier Space Perspective on Diffusion Models [6.834230686279937]
拡散モデルは、画像、オーディオ、タンパク質、材料などのデータモダリティに関する最先端の生成モデルである。
フーリエ空間における拡散モデルの前方過程の帰納バイアスについて検討する。
論文 参考訳(メタデータ) (2025-05-16T14:13:02Z) - Non-stationary Diffusion For Probabilistic Time Series Forecasting [3.7687375904925484]
非定常拡散(NsDiff)と呼ばれる拡散に基づく確率的予測フレームワークを開発する。
NsDiffは、デノナイズド拡散に基づく条件生成モデルと、事前訓練された条件平均と分散推定器を組み合わせる。
9つの実世界および合成データセットで実施された実験は、既存のアプローチと比較して、NsDiffの優れた性能を示している。
論文 参考訳(メタデータ) (2025-05-07T09:29:39Z) - Boosting Diffusion Models with Moving Average Sampling in Frequency Domain [101.43824674873508]
拡散モデルは、現在のサンプルに頼って次のサンプルをノイズ化し、おそらく不安定化を引き起こす。
本稿では,反復的復調過程をモデル最適化として再解釈し,移動平均機構を利用して全ての先行サンプルをアンサンブルする。
周波数領域における平均サンプリング(MASF)の動作」という完全なアプローチを命名する。
論文 参考訳(メタデータ) (2024-03-26T16:57:55Z) - One More Step: A Versatile Plug-and-Play Module for Rectifying Diffusion
Schedule Flaws and Enhancing Low-Frequency Controls [77.42510898755037]
One More Step (OMS) は、推論中に単純だが効果的なステップを付加したコンパクトネットワークである。
OMSは画像の忠実度を高め、トレーニングと推論の二分法を調和させ、元のモデルパラメータを保存する。
トレーニングが完了すると、同じ潜在ドメインを持つ様々な事前訓練された拡散モデルが同じOMSモジュールを共有することができる。
論文 参考訳(メタデータ) (2023-11-27T12:02:42Z) - Soft Mixture Denoising: Beyond the Expressive Bottleneck of Diffusion
Models [76.46246743508651]
我々は,現在の拡散モデルが後方認知において表現力のあるボトルネックを持っていることを示した。
本稿では,後方復調のための表現的かつ効率的なモデルであるソフトミキシング・デノナイジング(SMD)を導入する。
論文 参考訳(メタデータ) (2023-09-25T12:03:32Z) - Semi-Implicit Denoising Diffusion Models (SIDDMs) [50.30163684539586]
Denoising Diffusion Probabilistic Models (DDPM)のような既存のモデルは、高品質で多様なサンプルを提供するが、本質的に多くの反復的なステップによって遅くなる。
暗黙的要因と明示的要因を一致させることにより、この問題に対処する新しいアプローチを導入する。
提案手法は拡散モデルに匹敵する生成性能と,少数のサンプリングステップを持つモデルに比較して非常に優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2023-06-21T18:49:22Z) - On Diffusion Modeling for Anomaly Detection [13.312007032203857]
拡散モデルは密度に基づく異常検出の魅力的な候補である。
本研究では,拡散に基づく異常検出手法が,半教師付き設定と教師なし設定の両方で競合的に動作することを示す。
これらの結果は拡散に基づく異常検出を従来の方法に代わるスケーラブルな代替手段として確立する。
論文 参考訳(メタデータ) (2023-05-29T20:19:45Z) - Diffusion Model Based Posterior Sampling for Noisy Linear Inverse Problems [14.809545109705256]
本稿では、簡単な閉形式近似を確率スコアに提案することにより、高速で効果的な解を提案する。
拡散モデルとフローベースモデルの両方において、様々な雑音線形逆問題に対して広範な実験を行う。
提案手法は,全ての基本手法よりもはるかに高速でありながら,高い競争力あるいはより優れた復元性能を示す。
論文 参考訳(メタデータ) (2022-11-20T01:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。