論文の概要: Feedback Guidance of Diffusion Models
- arxiv url: http://arxiv.org/abs/2506.06085v1
- Date: Fri, 06 Jun 2025 13:46:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.493793
- Title: Feedback Guidance of Diffusion Models
- Title(参考訳): 拡散モデルのフィードバック誘導
- Authors: Koulischer Felix, Handke Florian, Deleu Johannes, Demeester Thomas, Ambrogioni Luca,
- Abstract要約: Interval-Free Guidance (CFG) は, 条件付き拡散モデルにおける試料の忠実度向上の標準となっている。
本稿では,FBG(FeedBack Guidance)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Classifier-Free Guidance (CFG) has become standard for improving sample fidelity in conditional diffusion models, it can harm diversity and induce memorization by applying constant guidance regardless of whether a particular sample needs correction. We propose FeedBack Guidance (FBG), which uses a state-dependent coefficient to self-regulate guidance amounts based on need. Our approach is derived from first principles by assuming the learned conditional distribution is linearly corrupted by the unconditional distribution, contrasting with CFG's implicit multiplicative assumption. Our scheme relies on feedback of its own predictions about the conditional signal informativeness to adapt guidance dynamically during inference, challenging the view of guidance as a fixed hyperparameter. The approach is benchmarked on ImageNet512x512, where it significantly outperforms Classifier-Free Guidance and is competitive to Limited Interval Guidance (LIG) while benefitting from a strong mathematical framework. On Text-To-Image generation, we demonstrate that, as anticipated, our approach automatically applies higher guidance scales for complex prompts than for simpler ones and that it can be easily combined with existing guidance schemes such as CFG or LIG.
- Abstract(参考訳): 分類自由誘導(CFG)は, 条件付き拡散モデルにおける試料忠実度向上の標準となっているが, 特定の試料に補正が必要かどうかに関わらず, 一定のガイダンスを適用することにより, 多様性を損なうことができ, 記憶を誘導することができる。
本稿では,FBG(FeedBack Guidance)を提案する。
我々のアプローチは、CFGの暗黙の乗法的仮定とは対照的に、学習条件分布が非条件分布によって線形に破損すると仮定することで、第一原理から導かれる。
提案手法は,条件信号の伝達性に関する独自の予測のフィードバックを頼りに,推論中に動的にガイダンスを適応させ,固定されたハイパーパラメータとしてのガイダンスの考え方に挑戦する。
このアプローチはImageNet512x512でベンチマークされており、Classifier-Free Guidanceよりも大幅に優れており、強力な数学的フレームワークの恩恵を受けながら、Limited Interval Guidance (LIG)と競合する。
テキスト・ツー・イメージ・ジェネレーションでは,従来のCFGやLIGと組み合わせることが容易に可能であることを示す。
関連論文リスト
- Normalized Attention Guidance: Universal Negative Guidance for Diffusion Models [57.20761595019967]
注意空間にL1をベースとした正規化・精細化を施した,効率的かつトレーニング不要な機構である正規化注意誘導(NAG)を提案する。
NAGは、CFGが忠実性を維持しながら崩壊する効果的な負のガイダンスを復元する。
NAGはアーキテクチャ(UNet、DiT)、サンプリングレシスタンス(複数ステップ、複数ステップ)、モダリティ(イメージ、ビデオ)をまたいで一般化する
論文 参考訳(メタデータ) (2025-05-27T13:30:46Z) - Adaptive Classifier-Free Guidance via Dynamic Low-Confidence Masking [15.052244821404079]
本稿では,モデルの予測信頼度を利用して非条件入力を調整する新しい手法であるAdaptive-Free Guidance (A-CFG)を紹介する。
A-CFGは、より効果的なガイダンスにつながる曖昧さの領域に焦点を当てている。
多様な言語生成ベンチマークの実験では、A-CFGは標準CFGよりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-05-26T16:40:22Z) - Classifier-free Guidance with Adaptive Scaling [7.179513844921256]
フリーガイダンス(CFG)は、テキスト駆動拡散モデルにおいて必須のメカニズムである。
本稿では,世代誘導の影響を制御できる$beta$adaptive-CFGを提案する。
提案モデルでは,テキスト・ツー・イメージのCLIP類似度スコアを,参照CFGと類似したレベルに維持し,FIDスコアが向上した。
論文 参考訳(メタデータ) (2025-02-14T22:04:53Z) - Contrastive CFG: Improving CFG in Diffusion Models by Contrasting Positive and Negative Concepts [55.298031232672734]
As-Free Guidance (CFG) は条件拡散モデルサンプリングに有効であることが証明された。
対照的な損失を用いた負のCFG誘導を強化する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-26T03:29:27Z) - Self-regulating Prompts: Foundational Model Adaptation without
Forgetting [112.66832145320434]
本稿では,PromptSRCと呼ばれる自己正規化フレームワークを提案する。
PromptSRCはタスク固有の汎用表現とタスクに依存しない汎用表現の両方に最適化するプロンプトを導く。
論文 参考訳(メタデータ) (2023-07-13T17:59:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。