論文の概要: Token Perturbation Guidance for Diffusion Models
- arxiv url: http://arxiv.org/abs/2506.10036v1
- Date: Tue, 10 Jun 2025 21:25:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 15:37:22.330672
- Title: Token Perturbation Guidance for Diffusion Models
- Title(参考訳): 拡散モデルのためのトークン摂動誘導
- Authors: Javad Rajabi, Soroush Mehraban, Seyedmorteza Sadat, Babak Taati,
- Abstract要約: Token Perturbation Guidance (TPG) は拡散ネットワーク内の中間トークン表現に直接行列を適用する新しい手法である。
TPGは訓練が不要で、入力条件に依存しないため、条件付きおよび条件なしの両方に容易に適用できる。
- 参考スコア(独自算出の注目度): 1.511194037740325
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classifier-free guidance (CFG) has become an essential component of modern diffusion models to enhance both generation quality and alignment with input conditions. However, CFG requires specific training procedures and is limited to conditional generation. To address these limitations, we propose Token Perturbation Guidance (TPG), a novel method that applies perturbation matrices directly to intermediate token representations within the diffusion network. TPG employs a norm-preserving shuffling operation to provide effective and stable guidance signals that improve generation quality without architectural changes. As a result, TPG is training-free and agnostic to input conditions, making it readily applicable to both conditional and unconditional generation. We further analyze the guidance term provided by TPG and show that its effect on sampling more closely resembles CFG compared to existing training-free guidance techniques. Extensive experiments on SDXL and Stable Diffusion 2.1 show that TPG achieves nearly a 2$\times$ improvement in FID for unconditional generation over the SDXL baseline, while closely matching CFG in prompt alignment. These results establish TPG as a general, condition-agnostic guidance method that brings CFG-like benefits to a broader class of diffusion models. The code is available at https://github.com/TaatiTeam/Token-Perturbation-Guidance
- Abstract(参考訳): 分類器フリーガイダンス (CFG) は, 生成品質と入力条件との整合性を高めるために, 現代拡散モデルの不可欠な要素となっている。
しかし、CFGは特定の訓練手順を必要とし、条件付き生成に限られる。
これらの制約に対処するために,拡散ネットワーク内の中間トークン表現に直接摂動行列を適用する新しい手法であるToken Perturbation Guidance (TPG)を提案する。
TPGは、アーキテクチャの変更なしに生成品質を向上させる効果的な、安定したガイダンス信号を提供するために、標準保存シャッフル演算を採用している。
その結果、TPGは入力条件に非依存であり、条件生成と非条件生成の両方に容易に適用できる。
さらに、TPGが提供するガイダンス用語を分析し、既存のトレーニングフリーガイダンス手法と比較して、サンプリングに対する効果がCFGによく似ていることを示す。
SDXLとStable Diffusion 2.1の大規模な実験により、TPGはSDXLベースライン上での非条件生成のためのFIDの2$\times$の改善を達成し、高速アライメントにおいてCFGと密に一致した。
これらの結果は、より広範な拡散モデルにCFGのような利点をもたらす一般的な条件に依存しないガイダンス手法としてTPGを確立している。
コードはhttps://github.com/TaatiTeam/Token-Perturbation-Guidanceで入手できる。
関連論文リスト
- Normalized Attention Guidance: Universal Negative Guidance for Diffusion Models [57.20761595019967]
注意空間にL1をベースとした正規化・精細化を施した,効率的かつトレーニング不要な機構である正規化注意誘導(NAG)を提案する。
NAGは、CFGが忠実性を維持しながら崩壊する効果的な負のガイダンスを復元する。
NAGはアーキテクチャ(UNet、DiT)、サンプリングレシスタンス(複数ステップ、複数ステップ)、モダリティ(イメージ、ビデオ)をまたいで一般化する
論文 参考訳(メタデータ) (2025-05-27T13:30:46Z) - Adaptive Classifier-Free Guidance via Dynamic Low-Confidence Masking [15.052244821404079]
本稿では,モデルの予測信頼度を利用して非条件入力を調整する新しい手法であるAdaptive-Free Guidance (A-CFG)を紹介する。
A-CFGは、より効果的なガイダンスにつながる曖昧さの領域に焦点を当てている。
多様な言語生成ベンチマークの実験では、A-CFGは標準CFGよりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-05-26T16:40:22Z) - Nested Annealed Training Scheme for Generative Adversarial Networks [54.70743279423088]
本稿では、厳密な数学的理論的枠組みである複合機能段階GAN(CFG)に焦点を当てる。
CFGモデルとスコアベースモデルとの理論的関係を明らかにする。
CFG判別器の学習目的は最適D(x)を求めることと等価であることがわかった。
論文 参考訳(メタデータ) (2025-01-20T07:44:09Z) - Contrastive CFG: Improving CFG in Diffusion Models by Contrasting Positive and Negative Concepts [55.298031232672734]
As-Free Guidance (CFG) は条件拡散モデルサンプリングに有効であることが証明された。
対照的な損失を用いた負のCFG誘導を強化する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-26T03:29:27Z) - Rectified Diffusion Guidance for Conditional Generation [62.00207951161297]
CFGの背後にある理論を再検討し、組合せ係数の不適切な構成(すなわち、広く使われている和対1バージョン)が生成分布の期待シフトをもたらすことを厳密に確認する。
本稿では,誘導係数を緩和したReCFGを提案する。
このようにして、修正された係数は観測されたデータをトラバースすることで容易に事前計算でき、サンプリング速度はほとんど影響を受けない。
論文 参考訳(メタデータ) (2024-10-24T13:41:32Z) - Eliminating Oversaturation and Artifacts of High Guidance Scales in Diffusion Models [27.640009920058187]
CFG更新ルールを再検討し、この問題に対処するための修正を導入する。
過飽和を伴わない高品質な世代を実現するために並列成分の低重み付けを提案する。
また、この知見に基づいて、CFG更新ルールに対する新しい再スケーリングモーメント手法も導入する。
論文 参考訳(メタデータ) (2024-10-03T12:06:29Z) - No Training, No Problem: Rethinking Classifier-Free Guidance for Diffusion Models [25.301443993960277]
我々はCFGの中核となる原則を再考し、新しい方法である独立条件ガイダンス(ICG)を導入する。
ICGは特別な訓練手順を必要とせずにCFGの利点を提供する。
提案手法は条件拡散モデルの学習過程を合理化し,任意の事前学習条件モデル上での推論にも適用可能である。
論文 参考訳(メタデータ) (2024-07-02T22:04:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。