論文の概要: A Fourier Space Perspective on Diffusion Models
- arxiv url: http://arxiv.org/abs/2505.11278v1
- Date: Fri, 16 May 2025 14:13:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:15.195037
- Title: A Fourier Space Perspective on Diffusion Models
- Title(参考訳): 拡散モデルにおけるフーリエ空間の展望
- Authors: Fabian Falck, Teodora Pandeva, Kiarash Zahirnia, Rachel Lawrence, Richard Turner, Edward Meeds, Javier Zazo, Sushrut Karmalkar,
- Abstract要約: 拡散モデルは、画像、オーディオ、タンパク質、材料などのデータモダリティに関する最先端の生成モデルである。
フーリエ空間における拡散モデルの前方過程の帰納バイアスについて検討する。
- 参考スコア(独自算出の注目度): 6.834230686279937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models are state-of-the-art generative models on data modalities such as images, audio, proteins and materials. These modalities share the property of exponentially decaying variance and magnitude in the Fourier domain. Under the standard Denoising Diffusion Probabilistic Models (DDPM) forward process of additive white noise, this property results in high-frequency components being corrupted faster and earlier in terms of their Signal-to-Noise Ratio (SNR) than low-frequency ones. The reverse process then generates low-frequency information before high-frequency details. In this work, we study the inductive bias of the forward process of diffusion models in Fourier space. We theoretically analyse and empirically demonstrate that the faster noising of high-frequency components in DDPM results in violations of the normality assumption in the reverse process. Our experiments show that this leads to degraded generation quality of high-frequency components. We then study an alternate forward process in Fourier space which corrupts all frequencies at the same rate, removing the typical frequency hierarchy during generation, and demonstrate marked performance improvements on datasets where high frequencies are primary, while performing on par with DDPM on standard imaging benchmarks.
- Abstract(参考訳): 拡散モデルは、画像、オーディオ、タンパク質、材料などのデータモダリティに関する最先端の生成モデルである。
これらのモジュラリティはフーリエ領域における指数関数的に減衰する分散と等級の性質を共有する。
定型化拡散確率モデル (DDPM) では、この特性により、高周波成分は低周波成分よりもSNR(Signal-to-Noise Ratio)の方が早く、より早く劣化する。
逆処理は、高周波の詳細の前に低周波情報を生成する。
本研究ではフーリエ空間における拡散モデルの前方過程の帰納バイアスについて検討する。
DDPMにおける高周波成分の高速ノイズ化は, 逆過程における正規性仮定に違反することを示す。
実験により、これは高周波部品の劣化生成品質につながることが示された。
次に、Fourier空間において、全ての周波数を同じ速度で破壊し、生成中の典型的な周波数階層を除去し、標準画像ベンチマークでDDPMと同等の性能を示しながら、高周波数が一次であるデータセットに対して顕著な性能向上を示す。
関連論文リスト
- Fredformer: Frequency Debiased Transformer for Time Series Forecasting [8.356290446630373]
Transformerモデルは時系列予測において主要なパフォーマンスを示している。
データの中で低周波の特徴を学習し、高周波の特徴を見落とし、周波数バイアスを示す傾向がある。
そこで我々はFredformerを提案する。Fredformerは、異なる周波数帯域にまたがる特徴を均等に学習することで、周波数バイアスを軽減するために設計されたフレームワークである。
論文 参考訳(メタデータ) (2024-06-13T11:29:21Z) - Boosting Diffusion Models with Moving Average Sampling in Frequency Domain [101.43824674873508]
拡散モデルは、現在のサンプルに頼って次のサンプルをノイズ化し、おそらく不安定化を引き起こす。
本稿では,反復的復調過程をモデル最適化として再解釈し,移動平均機構を利用して全ての先行サンプルをアンサンブルする。
周波数領域における平均サンプリング(MASF)の動作」という完全なアプローチを命名する。
論文 参考訳(メタデータ) (2024-03-26T16:57:55Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - PartDiff: Image Super-resolution with Partial Diffusion Models [3.8435187580887717]
拡散確率モデル(DDPM)は,様々な画像生成タスクにおいて顕著な性能を達成している。
DDPMは、ランダムノイズから反復的にデノイングすることで、新しいデータを生成する。
しかし、拡散に基づく生成モデルは、多くのデノナイジングステップのために高い計算コストに悩まされる。
本稿では,部分拡散モデル (PartDiff) を提案する。
論文 参考訳(メタデータ) (2023-07-21T22:11:23Z) - Modeling low- and high-frequency noise in transmon qubits with
resource-efficient measurement [0.0]
Transmon qubitsは、幅広い周波数でノイズとして現れるオープンシステム効果を経験する。
低周波成分と高周波成分からなるハイブリッド浴を用いたレッドフィールド・マスター方程式を用いて,これらの効果のモデルを提案する。
超伝導量子ビットのデコヒーレンス源である1/f型ノイズ挙動をシミュレートするために, 2レベルゆらぎ器を用いる。
論文 参考訳(メタデータ) (2023-02-28T21:46:03Z) - Diffusion Probabilistic Model Made Slim [128.2227518929644]
軽量画像合成のためのスリム拡散確率モデル(DPM)のカスタマイズ設計を提案する。
一連の条件および非条件画像生成タスクにおける遅延拡散モデルと比較して,計算複雑性を8-18倍に削減する。
論文 参考訳(メタデータ) (2022-11-27T16:27:28Z) - Transform Once: Efficient Operator Learning in Frequency Domain [69.74509540521397]
本研究では、周波数領域の構造を利用して、空間や時間における長距離相関を効率的に学習するために設計されたディープニューラルネットワークについて検討する。
この研究は、単一変換による周波数領域学習のための青写真を導入している。
論文 参考訳(メタデータ) (2022-11-26T01:56:05Z) - Accelerating Diffusion Models via Early Stop of the Diffusion Process [114.48426684994179]
Denoising Diffusion Probabilistic Models (DDPM) は、様々な世代タスクにおいて優れたパフォーマンスを実現している。
実際には、DDPMは高品質なサンプルを得るために何十万ものデノナイジングステップを必要とすることが多い。
本稿では,DDPMの早期停止型DDPM(Early-Stopped DDPM, ES-DDPM)の原理的高速化戦略を提案する。
論文 参考訳(メタデータ) (2022-05-25T06:40:09Z) - SpecGrad: Diffusion Probabilistic Model based Neural Vocoder with
Adaptive Noise Spectral Shaping [51.698273019061645]
SpecGradは拡散雑音に適応し、その時間変化スペクトル包絡が条件付き対数メル分光器に近づく。
時間周波数領域で処理され、計算コストは従来のDDPMベースのニューラルボコーダとほぼ同じである。
論文 参考訳(メタデータ) (2022-03-31T02:08:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。