論文の概要: Rethinking Oversaturation in Classifier-Free Guidance via Low Frequency
- arxiv url: http://arxiv.org/abs/2506.21452v1
- Date: Thu, 26 Jun 2025 16:34:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.19453
- Title: Rethinking Oversaturation in Classifier-Free Guidance via Low Frequency
- Title(参考訳): 低周波によるクラシファイアフリー誘導における過飽和の再考
- Authors: Kaiyu Song, Hanjiang Lai,
- Abstract要約: 低周波信号に基づく新しい視点を導入する。
これらの信号の冗長な情報の蓄積は、過飽和や非現実的なアーティファクトの背後にある重要な要因である。
実験により,LF-CFGは様々な拡散モデルにおける過飽和や非現実的アーティファクトを効果的に緩和することを示した。
- 参考スコア(独自算出の注目度): 7.3604864243987365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classifier-free guidance (CFG) succeeds in condition diffusion models that use a guidance scale to balance the influence of conditional and unconditional terms. A high guidance scale is used to enhance the performance of the conditional term. However, the high guidance scale often results in oversaturation and unrealistic artifacts. In this paper, we introduce a new perspective based on low-frequency signals, identifying the accumulation of redundant information in these signals as the key factor behind oversaturation and unrealistic artifacts. Building on this insight, we propose low-frequency improved classifier-free guidance (LF-CFG) to mitigate these issues. Specifically, we introduce an adaptive threshold-based measurement to pinpoint the locations of redundant information. We determine a reasonable threshold by analyzing the change rate of low-frequency information between prior and current steps. We then apply a down-weight strategy to reduce the impact of redundant information in the low-frequency signals. Experimental results demonstrate that LF-CFG effectively alleviates oversaturation and unrealistic artifacts across various diffusion models, including Stable Diffusion-XL, Stable Diffusion 2.1, 3.0, 3.5, and SiT-XL.
- Abstract(参考訳): クラシファイアフリーガイダンス(CFG)は、条件付きおよび非条件付き用語の影響のバランスをとるためにガイダンススケールを使用する条件拡散モデルに成功している。
条件項の性能を高めるために高いガイダンス尺度が用いられる。
しかし、高いガイダンススケールは、しばしば過飽和と非現実的なアーティファクトをもたらす。
本稿では,低周波信号に基づく新しい視点を導入し,過飽和や非現実的アーティファクトの背後にある重要な要因として,これらの信号の冗長な情報の蓄積を同定する。
この知見に基づいて、これらの問題を緩和するための低周波改良型分類器フリーガイダンス(LF-CFG)を提案する。
具体的には、冗長な情報の位置をピンポイントするアダプティブしきい値に基づく測定を導入する。
我々は、前段と現在段の間の低周波情報の変化率を分析することにより、合理的な閾値を決定する。
次に、低周波信号における冗長な情報の影響を低減するために、ダウンウェイト戦略を適用する。
LF-CFGは, 安定拡散XL, 安定拡散2.1, 3.0, 3.5, SiT-XLなど, 様々な拡散モデルにおいて, 過飽和や非現実的アーティファクトを効果的に緩和することを示した。
関連論文リスト
- Diffusion Sampling Path Tells More: An Efficient Plug-and-Play Strategy for Sample Filtering [18.543769006014383]
拡散モデルはしばしば、サンプリング軌跡に固有の変化のために、一貫性のないサンプル品質を示す。
CFG-リジェクション(CFG-Rejection)は,デノナイジングプロセスの初期段階において,低品質なサンプルをフィルタリングする効率的なプラグアンドプレイ戦略である。
画像生成におけるCFG-Rejectionの有効性を広範囲な実験により検証する。
論文 参考訳(メタデータ) (2025-05-29T11:08:24Z) - Normalized Attention Guidance: Universal Negative Guidance for Diffusion Models [57.20761595019967]
注意空間にL1をベースとした正規化・精細化を施した,効率的かつトレーニング不要な機構である正規化注意誘導(NAG)を提案する。
NAGは、CFGが忠実性を維持しながら崩壊する効果的な負のガイダンスを復元する。
NAGはアーキテクチャ(UNet、DiT)、サンプリングレシスタンス(複数ステップ、複数ステップ)、モダリティ(イメージ、ビデオ)をまたいで一般化する
論文 参考訳(メタデータ) (2025-05-27T13:30:46Z) - RestoreGrad: Signal Restoration Using Conditional Denoising Diffusion Models with Jointly Learned Prior [42.55917146449122]
本稿では,信号復元のための条件付きDDPMの改良を,より情報に富んだ先行手法を用いて提案する。
RestoreGradと呼ばれる提案されたフレームワークは、DDPMを可変オートエンコーダフレームワークにシームレスに統合する。
音声と画像の復元タスクにおいて、RestoreGradはより高速な収束(5~10倍のトレーニングステップ)を示し、復元信号のより良い品質を実現する。
論文 参考訳(メタデータ) (2025-02-19T09:29:46Z) - Unsupervised CP-UNet Framework for Denoising DAS Data with Decay Noise [13.466125373185399]
分散音響センサ(DAS)技術は光ファイバーケーブルを利用して音響信号を検出する。
DASは、ジオフォンよりも低い信号対雑音比(S/N)を示す。
これにより、S/Nの低減は、反転と解釈を含むデータ解析に悪影響を及ぼす。
論文 参考訳(メタデータ) (2025-02-19T03:09:49Z) - Rectified Diffusion Guidance for Conditional Generation [62.00207951161297]
CFGの背後にある理論を再検討し、組合せ係数の不適切な構成(すなわち、広く使われている和対1バージョン)が生成分布の期待シフトをもたらすことを厳密に確認する。
本稿では,誘導係数を緩和したReCFGを提案する。
このようにして、修正された係数は観測されたデータをトラバースすることで容易に事前計算でき、サンプリング速度はほとんど影響を受けない。
論文 参考訳(メタデータ) (2024-10-24T13:41:32Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - Adaptive Low-Pass Filtering using Sliding Window Gaussian Processes [71.23286211775084]
ガウス過程回帰に基づく適応型低域通過フィルタを提案する。
本研究では,提案手法の誤差が一様境界であることを示す。
論文 参考訳(メタデータ) (2021-11-05T17:06:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。