論文の概要: Frequency Regulation for Exposure Bias Mitigation in Diffusion Models
- arxiv url: http://arxiv.org/abs/2507.10072v2
- Date: Mon, 04 Aug 2025 12:53:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 14:07:57.489811
- Title: Frequency Regulation for Exposure Bias Mitigation in Diffusion Models
- Title(参考訳): 拡散モデルにおける露光バイアス低減の周波数規制
- Authors: Meng Yu, Kun Zhan,
- Abstract要約: 逆過程における予測ノイズサンプルのエネルギーは、前方過程における摂動サンプルと比較して連続的に減少する。
我々はウェーブレット変換を利用した動的周波数制御機構を導入し、低周波サブバンドと高周波サブバンドを別々に調整する。
我々は厳密な数学的形態の露出バイアスを導出する。
- 参考スコア(独自算出の注目度): 13.095683155232281
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models exhibit impressive generative capabilities but are significantly impacted by exposure bias. In this paper, we make a key observation: the energy of predicted noisy samples in the reverse process continuously declines compared to perturbed samples in the forward process. Building on this, we identify two important findings: 1) The reduction in energy follows distinct patterns in the low-frequency and high-frequency subbands; 2) The subband energy of reverse-process reconstructed samples is consistently lower than that of forward-process ones, and both are lower than the original data samples. Based on the first finding, we introduce a dynamic frequency regulation mechanism utilizing wavelet transforms, which separately adjusts the low- and high-frequency subbands. Leveraging the second insight, we derive the rigorous mathematical form of exposure bias. It is worth noting that, our method is training-free and plug-and-play, significantly improving the generative quality of various diffusion models and frameworks with negligible computational cost. The source code is available at https://github.com/kunzhan/wpp.
- Abstract(参考訳): 拡散モデルは印象的な生成能力を示すが、露光バイアスの影響は大きい。
本稿では, 逆過程における予測ノイズサンプルのエネルギーは, 前方過程における摂動サンプルと比較して連続的に減少することを示す。
これに基づいて、我々は2つの重要な発見を見出します。
1)低周波及び高周波サブバンドの異なるパターンに従ってエネルギーの低減を行う。
2) 逆プロセス再構成試料のサブバンドエネルギーは前処理試料のサブバンドエネルギーよりも一貫して低く, どちらも元のデータサンプルよりも低い。
最初の発見に基づいて、ウェーブレット変換を利用した動的周波数制御機構を導入し、低周波サブバンドと高周波サブバンドを別々に調整する。
第2の洞察を活用して、厳密な数学的形態の露出バイアスを導出する。
なお,本手法はトレーニングフリーかつプラグアンドプレイであり,様々な拡散モデルやフレームワークの生成品質を,計算コストを無視して大幅に向上させることに注意が必要である。
ソースコードはhttps://github.com/kunzhan/wpp.comで入手できる。
関連論文リスト
- Frequency Domain-Based Diffusion Model for Unpaired Image Dehazing [92.61216319417208]
そこで本稿では,未確認データにおける有益な知識を十分に活用するための,新しい周波数領域ベース拡散モデルを提案する。
拡散モデル(DM)が示す強い生成能力に着想を得て,周波数領域再構成の観点からデハージング課題に取り組む。
論文 参考訳(メタデータ) (2025-07-02T01:22:46Z) - Noise Conditional Variational Score Distillation [60.38982038894823]
騒音条件変化スコア蒸留(NCVSD)は, 予混合拡散モデルから生成消音剤を蒸留する新しい方法である。
この知見を変分スコア蒸留フレームワークに組み込むことで、生成的デノイザのスケーラブルな学習を可能にする。
論文 参考訳(メタデータ) (2025-06-11T06:01:39Z) - ReDDiT: Rehashing Noise for Discrete Visual Generation [41.72349583047408]
本稿では,離散拡散変圧器(ReDDiT)の吸音状態を拡張し,離散拡散モデルの表現能力を向上させるために,離散拡散変圧器(ReDDiT)のリハッシングノイズフレームワークを提案する。
実験により、ReDDiTはベースライン(gFIDを6.18から1.61に還元する)を著しく上回り、高い効率で連続するものと同等であることが示された。
論文 参考訳(メタデータ) (2025-05-26T08:17:20Z) - A Fourier Space Perspective on Diffusion Models [6.834230686279937]
拡散モデルは、画像、オーディオ、タンパク質、材料などのデータモダリティに関する最先端の生成モデルである。
フーリエ空間における拡散モデルの前方過程の帰納バイアスについて検討する。
論文 参考訳(メタデータ) (2025-05-16T14:13:02Z) - Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation [82.39763984380625]
低品質データから高品質な生成モデルをトレーニングするための驚くほど効果的で斬新なアプローチであるDSD(Denoising score distillation)を導入する。
DSDはノイズの多い劣化したサンプルにのみ拡散モデルを事前訓練し、精製されたクリーンな出力を生成することができる1ステップの発電機に蒸留する。
論文 参考訳(メタデータ) (2025-03-10T17:44:46Z) - Shaping Inductive Bias in Diffusion Models through Frequency-Based Noise Control [43.87692887705523]
我々は拡散確率モデル(DPM)のトレーニングとサンプリングに誘導バイアスを組み込む。
本研究は,各データセットが異なる誘導バイアスを必要とすること,および適切な周波数ベースノイズ制御により,標準拡散よりも生成性能が向上することを示す。
論文 参考訳(メタデータ) (2025-02-14T15:46:37Z) - Boosting Diffusion Models with Moving Average Sampling in Frequency Domain [101.43824674873508]
拡散モデルは、現在のサンプルに頼って次のサンプルをノイズ化し、おそらく不安定化を引き起こす。
本稿では,反復的復調過程をモデル最適化として再解釈し,移動平均機構を利用して全ての先行サンプルをアンサンブルする。
周波数領域における平均サンプリング(MASF)の動作」という完全なアプローチを命名する。
論文 参考訳(メタデータ) (2024-03-26T16:57:55Z) - Frequency Compensated Diffusion Model for Real-scene Dehazing [6.105813272271171]
本研究では,実ヘイズへの一般化を改善する条件付き拡散モデルに基づく脱ヘイズフレームワークについて考察する。
提案手法は, 実世界の画像において, 最先端の手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2023-08-21T06:50:44Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - DiffusionAD: Norm-guided One-step Denoising Diffusion for Anomaly Detection [80.20339155618612]
DiffusionADは、再構成サブネットワークとセグメンテーションサブネットワークからなる、新しい異常検出パイプラインである。
高速なワンステップデノゲーションパラダイムは、同等の再現品質を維持しながら、数百倍の加速を達成する。
異常の出現の多様性を考慮し、複数のノイズスケールの利点を統合するためのノルム誘導パラダイムを提案する。
論文 参考訳(メタデータ) (2023-03-15T16:14:06Z) - DDS2M: Self-Supervised Denoising Diffusion Spatio-Spectral Model for
Hyperspectral Image Restoration [103.79030498369319]
ハイパースペクトル画像復元のための自己教師付き拡散モデルを提案する。
textttDDS2Mは、既存の拡散法と比較して、より強力な一般化能力を持っている。
HSIのノイズ除去、ノイズ除去、様々なHSIの超解像実験は、既存のタスク固有状態よりもtextttDDS2Mの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-03-12T14:57:04Z) - SinDiffusion: Learning a Diffusion Model from a Single Natural Image [159.4285444680301]
SinDiffusionは1つの自然な画像からパッチの内部分布を捉えるためにデノナイズ拡散モデルを利用する。
SinDiffusionは、2つのコア設計に基づいている。まず、SinDiffusionは、段階的にスケールが成長する複数のモデルではなく、1つのスケールで1つのモデルで訓練されている。
第2に,拡散ネットワークのパッチレベルの受容領域は,画像のパッチ統計を捉える上で重要かつ効果的であることを示す。
論文 参考訳(メタデータ) (2022-11-22T18:00:03Z) - How Much is Enough? A Study on Diffusion Times in Score-based Generative
Models [76.76860707897413]
現在のベストプラクティスは、フォワードダイナミクスが既知の単純なノイズ分布に十分に近づくことを確実にするために大きなTを提唱している。
本稿では, 理想とシミュレーションされたフォワードダイナミクスのギャップを埋めるために補助モデルを用いて, 標準的な逆拡散過程を導出する方法について述べる。
論文 参考訳(メタデータ) (2022-06-10T15:09:46Z) - Diffusion-GAN: Training GANs with Diffusion [135.24433011977874]
GAN(Generative Adversarial Network)は、安定してトレーニングすることが難しい。
フォワード拡散チェーンを利用してインスタンスノイズを生成する新しいGANフレームワークであるDiffusion-GANを提案する。
我々は,Diffusion-GANにより,最先端のGANよりも高い安定性とデータ効率で,よりリアルな画像を生成することができることを示す。
論文 参考訳(メタデータ) (2022-06-05T20:45:01Z) - On Analyzing Generative and Denoising Capabilities of Diffusion-based
Deep Generative Models [18.018935233383935]
拡散に基づくDeep Generative Models (DDGM)は、生成モデルにおける最先端のパフォーマンスを提供する。
後方拡散過程において, 少量のノイズがどのように変換されるかを検討する。
論文 参考訳(メタデータ) (2022-05-31T19:29:27Z) - Come-Closer-Diffuse-Faster: Accelerating Conditional Diffusion Models
for Inverse Problems through Stochastic Contraction [31.61199061999173]
拡散モデルには重要な欠点がある。純粋なガウスノイズから画像を生成するために数千ステップの反復を必要とするため、サンプリングが本質的に遅い。
ガウスノイズから始めることは不要であることを示す。代わりに、より優れた初期化を伴う単一前方拡散から始めると、逆条件拡散におけるサンプリングステップの数を大幅に減少させる。
ComeCloser-DiffuseFaster (CCDF)と呼ばれる新しいサンプリング戦略は、逆問題に対する既存のフィードフォワードニューラルネットワークアプローチが拡散モデルと相乗的に組み合わせられる方法について、新たな洞察を明らかにしている。
論文 参考訳(メタデータ) (2021-12-09T04:28:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。