論文の概要: CFG-Ctrl: Control-Based Classifier-Free Diffusion Guidance
- arxiv url: http://arxiv.org/abs/2603.03281v1
- Date: Tue, 03 Mar 2026 18:59:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.945897
- Title: CFG-Ctrl: Control-Based Classifier-Free Diffusion Guidance
- Title(参考訳): CFG-Ctrl:制御ベース分類器フリー拡散誘導
- Authors: Hanyang Wang, Yiyang Liu, Jiawei Chi, Fangfu Liu, Ran Xue, Yueqi Duan,
- Abstract要約: スライディングモード制御CFG(SMC-CFG)を導入する。
SMC-CFGは、様々なガイダンス尺度において、セマンティックアライメントとロバストネスにおいて標準CFGを上回っている。
- 参考スコア(独自算出の注目度): 31.552164852288325
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classifier-Free Guidance (CFG) has emerged as a central approach for enhancing semantic alignment in flow-based diffusion models. In this paper, we explore a unified framework called CFG-Ctrl, which reinterprets CFG as a control applied to the first-order continuous-time generative flow, using the conditional-unconditional discrepancy as an error signal to adjust the velocity field. From this perspective, we summarize vanilla CFG as a proportional controller (P-control) with fixed gain, and typical follow-up variants develop extended control-law designs derived from it. However, existing methods mainly rely on linear control, inherently leading to instability, overshooting, and degraded semantic fidelity especially on large guidance scales. To address this, we introduce Sliding Mode Control CFG (SMC-CFG), which enforces the generative flow toward a rapidly convergent sliding manifold. Specifically, we define an exponential sliding mode surface over the semantic prediction error and introduce a switching control term to establish nonlinear feedback-guided correction. Moreover, we provide a Lyapunov stability analysis to theoretically support finite-time convergence. Experiments across text-to-image generation models including Stable Diffusion 3.5, Flux, and Qwen-Image demonstrate that SMC-CFG outperforms standard CFG in semantic alignment and enhances robustness across a wide range of guidance scales. Project Page: https://hanyang-21.github.io/CFG-Ctrl
- Abstract(参考訳): フローベース拡散モデルにおけるセマンティックアライメントを強化するための中心的なアプローチとして,CFG(Classifier-Free Guidance)が出現している。
本稿では,CFGを1次連続時間生成流に適用した制御として再解釈するCFG-Ctrlという統合フレームワークについて,条件不条件差を誤差信号として用いて検討する。
この観点から、バニラCFGを固定ゲインを持つ比例制御器(P-control)として要約し、典型的な追従変種はそれに由来する拡張制御則設計を開発する。
しかし、既存の手法は主に線形制御に依存しており、本質的には不安定性、過剰なシューティング、特に大規模な指導尺度における意味的忠実性の低下につながっている。
そこで本研究では, 高速収束型すべり多様体への生成フローを強制するスライディングモード制御CFG(SMC-CFG)を提案する。
具体的には,意味的予測誤差に対して指数的スライディングモード面を定義し,非線形フィードバック誘導補正を確立するための切り替え制御項を導入する。
さらに、有限時間収束を理論的に支持するリアプノフ安定性解析を提供する。
安定拡散3.5、Flux、Qwen-Imageなどのテキスト・画像生成モデルにおける実験により、SMC-CFGは、セマンティックアライメントにおいて標準CFGよりも優れ、広範囲のガイダンススケールで堅牢性を高めることを示した。
Project Page: https://hanyang-21.github.io/CFG-Ctrl
関連論文リスト
- Improving Classifier-Free Guidance of Flow Matching via Manifold Projection [3.6087998976768128]
最適化のレンズによるCFGの原理的解釈を提供する。
CFGサンプリングを多様体制約によるホモトピー最適化として再構成する。
提案手法は, トレーニング不要かつ一貫した生成忠実度, 迅速なアライメント, ガイダンス尺度に対するロバスト性である。
論文 参考訳(メタデータ) (2026-01-29T15:49:31Z) - Rectified-CFG++ for Flow Based Models [26.896426878221718]
本稿では,修正フローの決定論的効率を幾何学的条件付きルールと組み合わせた適応型予測器・補正器ガイダンスであるRectified-C++を提案する。
大規模なテキスト・ツー・イメージモデル(Flux, Stable Diffusion 3/3.5, Lumina)の実験では、Rectified-C++がベンチマークデータセットの標準CFGを一貫して上回っていることが示されている。
論文 参考訳(メタデータ) (2025-10-09T00:00:47Z) - Fluid Antenna System-assisted Physical Layer Secret Key Generation [64.92952968689636]
本稿では,流体アンテナシステム(FAS)を動的無線環境に適用することにより,多元系基地局システムにおける物理層生成(PLKG)について検討する。
本研究では,送信ビームフォーミングとポート選択を統合したPLKGモデルを提案する。
本論文で導入したスライディングウィンドウベースポート選択法は,動的ポート選択により,より少ないチェーンで高いKGRを実現する。
論文 参考訳(メタデータ) (2025-09-19T03:01:29Z) - Token Perturbation Guidance for Diffusion Models [6.255435016547602]
Token Perturbation Guidance (TPG) は拡散ネットワーク内の中間トークン表現に直接行列を適用する新しい手法である。
TPGは訓練が不要で、入力条件に依存しないため、条件付きおよび条件なしの両方に容易に適用できる。
論文 参考訳(メタデータ) (2025-06-10T21:25:46Z) - Normalized Attention Guidance: Universal Negative Guidance for Diffusion Models [57.20761595019967]
注意空間にL1をベースとした正規化・精細化を施した,効率的かつトレーニング不要な機構である正規化注意誘導(NAG)を提案する。
NAGは、CFGが忠実性を維持しながら崩壊する効果的な負のガイダンスを復元する。
NAGはアーキテクチャ(UNet、DiT)、サンプリングレシスタンス(複数ステップ、複数ステップ)、モダリティ(イメージ、ビデオ)をまたいで一般化する
論文 参考訳(メタデータ) (2025-05-27T13:30:46Z) - Adaptive Classifier-Free Guidance via Dynamic Low-Confidence Masking [15.052244821404079]
本稿では,モデルの予測信頼度を利用して非条件入力を調整する新しい手法であるAdaptive-Free Guidance (A-CFG)を紹介する。
A-CFGは、より効果的なガイダンスにつながる曖昧さの領域に焦点を当てている。
多様な言語生成ベンチマークの実験では、A-CFGは標準CFGよりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-05-26T16:40:22Z) - Contrastive CFG: Improving CFG in Diffusion Models by Contrasting Positive and Negative Concepts [55.298031232672734]
As-Free Guidance (CFG) は条件拡散モデルサンプリングに有効であることが証明された。
対照的な損失を用いた負のCFG誘導を強化する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-26T03:29:27Z) - Rectified Diffusion Guidance for Conditional Generation [94.83538269086613]
CFGの背後にある理論を再検討し、不適切な組合せ係数(textiti.e.)が生成分布を期待的にシフトさせることを厳密に確認する。
提案手法は, 強みを考慮すれば, textbftextitform ソリューションが有効であることを示す。
実世界のデータに関する実証的な証拠は、我々の設計と既存の最先端拡散モデルとの整合性を実証している。
論文 参考訳(メタデータ) (2024-10-24T13:41:32Z) - Eliminating Oversaturation and Artifacts of High Guidance Scales in Diffusion Models [27.640009920058187]
CFG更新ルールを再検討し、この問題に対処するための修正を導入する。
過飽和を伴わない高品質な世代を実現するために並列成分の低重み付けを提案する。
また、この知見に基づいて、CFG更新ルールに対する新しい再スケーリングモーメント手法も導入する。
論文 参考訳(メタデータ) (2024-10-03T12:06:29Z) - CFG++: Manifold-constrained Classifier Free Guidance for Diffusion Models [52.29804282879437]
CFG++は、従来のCFG固有のオフマンドの課題に取り組む新しいアプローチである。
より優れたインバージョン・ツー・イメージ生成、可逆性、ガイダンススケールの縮小、モード崩壊の削減などを提供する。
高次拡散解法に容易に統合でき、自然に蒸留拡散モデルに拡張できる。
論文 参考訳(メタデータ) (2024-06-12T10:40:10Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。