論文の概要: Information-Theoretic Classifier-Free Guidance with Adaptive Schedule Optimization
- arxiv url: http://arxiv.org/abs/2606.24025v1
- Date: Tue, 23 Jun 2026 00:04:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.714777
- Title: Information-Theoretic Classifier-Free Guidance with Adaptive Schedule Optimization
- Title(参考訳): 適応スケジュール最適化を用いた情報理論型分類器フリーガイダンス
- Authors: Haobo Chen, Xiangxiang Xu, Yuheng Bu,
- Abstract要約: 拡散モデルは、画像、テキスト・ツー・イメージ、ビデオ生成において高いパフォーマンスを達成している。
CFGスケジュール最適化のための情報理論フレームワークを提案する。
ImageNet-512、EDM-XXL、COCO、SD-XLでは、学習スケジュールは一定のガイダンスよりも競争力や改善されたトレードオフを達成する。
- 参考スコア(独自算出の注目度): 15.35957804795103
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models have achieved strong performance in image, text-to-image, and video generation, where conditional generation is often controlled by classifier-free guidance (CFG). CFG improves condition consistency by increasing a guidance weight, but stronger guidance typically reduces diversity and distributional coverage. It remains unclear how this consistency-coverage trade-off should be controlled across the reverse trajectory, since the distribution induced by CFG is not simply the fixed-time tilted distribution given by the guided score field. To address this issue, we propose an information-theoretic framework for CFG schedule optimization. Our approach uses a clean endpoint reference to specify the desired consistency-coverage trade-off, while optimizing the actual distribution induced by the guided sampler toward this reference. We derive trajectory-level formulas to estimate the objective from samples and score evaluations, avoiding explicit density estimation. On ImageNet-512 with EDM-XXL and COCO with SD-XL, the learned schedules achieve competitive or improved trade-offs over constant guidance and allocate guidance selectively across noise levels.
- Abstract(参考訳): 拡散モデルは、画像、テキスト・ツー・イメージ、ビデオ生成において強力な性能を達成しており、条件付き生成は、しばしば分類器フリーガイダンス(CFG)によって制御される。
CFGはガイダンスの重量を増やすことで条件の整合性を改善するが、より強力なガイダンスは典型的には多様性と分布範囲を減少させる。
CFGによって誘導される分布は、単に誘導されたスコアフィールドが与える固定時間傾斜分布ではないため、この整合性被覆トレードオフが逆軌道全体にわたってどのように制御されるべきかは定かではない。
そこで本研究では,CFGスケジュール最適化のための情報理論フレームワークを提案する。
提案手法では, クリーンエンドポイント参照を用いて, 所望の整合性被覆トレードオフを指定し, ガイド付きサンプリング器によって誘導される実際の分布をこの参照に最適化する。
軌道レベルの式を導出し, サンプルから目的を推定し, スコア評価を行い, 明示的な密度推定を避けた。
ImageNet-512とEDM-XXLとCOCOとSD-XLでは、学習スケジュールは一定の誘導よりも競合的あるいは改善されたトレードオフを達成し、ノイズレベルを選択的にガイダンスを割り当てる。
関連論文リスト
- PG-MAP: Joint MAP Optimization for Inference-Time Alignment of Diffusion and Flow-Matching Models [0.8594140167290097]
事前訓練されたテキスト-画像モデルの推測時間アライメントは、通常、単一の制御軸に沿って実行される。
我々は、軌道レベルのギブスマップ/近位エネルギー最適化として推論時間アライメントを定式化する、トレーニング不要のフレームワークPG-MAPを提案する。
論文 参考訳(メタデータ) (2026-06-22T07:36:36Z) - MCLR: Improving Conditional Modeling in Visual Generative Models via Inter-Class Likelihood-Ratio Maximization and Establishing the Equivalence between Classifier-Free Guidance and Alignment Objectives [26.118296609018596]
標準復調スコアマッチング(DSM)で訓練された拡散モデルにより,対象データ分布の回復が期待できる。
我々は,授業中にクラス間確率比を明示的に最大化する原理的アライメント目標であるMCLRを提案する。
MCLRで微調整されたモデルは、標準サンプリングの下でCFGライクな改善を示し、推論時ガイダンスを必要とせず、質的および定量的ゲインを同等に達成する。
論文 参考訳(メタデータ) (2026-03-23T05:01:47Z) - Diffusion Controller: Framework, Algorithms and Parameterization [54.82539154511621]
本稿では,逆拡散サンプリングを(一般化された)線形解法マルコフ決定過程における状態のみの制御として活用する統一的な制御理論的視点を提案する。
このフレームワークでは、制御はトレーニング済みのリバースタイムのトランジションカーネルを再重み付けし、端末の目的と$f$分割コストのバランスをとる。
安定拡散v1.4の実験では、選好調整の勝利率が一貫した上昇を示し、品質効率のトレードオフを改善した。
論文 参考訳(メタデータ) (2026-03-07T01:49:59Z) - Improving Classifier-Free Guidance of Flow Matching via Manifold Projection [3.6087998976768128]
最適化のレンズによるCFGの原理的解釈を提供する。
CFGサンプリングを多様体制約によるホモトピー最適化として再構成する。
提案手法は, トレーニング不要かつ一貫した生成忠実度, 迅速なアライメント, ガイダンス尺度に対するロバスト性である。
論文 参考訳(メタデータ) (2026-01-29T15:49:31Z) - Feedback Guidance of Diffusion Models [14.162420300295365]
Interval-Free Guidance (CFG) は, 条件付き拡散モデルにおける試料の忠実度向上の標準となっている。
本稿では,FBG(FeedBack Guidance)を提案する。
論文 参考訳(メタデータ) (2025-06-06T13:46:32Z) - Leveraging Robust Optimization for LLM Alignment under Distribution Shifts [51.74394601039711]
人間の値に整合した出力を生成するために、大規模言語モデルを操る上で、優先順位アライメント手法はますます重要になっている。
このようなシフトに拘わらず、好みのアライメントを改善する新しい分布対応最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-08T09:14:38Z) - Rectified Diffusion Guidance for Conditional Generation [94.83538269086613]
CFGの背後にある理論を再検討し、不適切な組合せ係数(textiti.e.)が生成分布を期待的にシフトさせることを厳密に確認する。
提案手法は, 強みを考慮すれば, textbftextitform ソリューションが有効であることを示す。
実世界のデータに関する実証的な証拠は、我々の設計と既存の最先端拡散モデルとの整合性を実証している。
論文 参考訳(メタデータ) (2024-10-24T13:41:32Z) - Adaptive Annealed Importance Sampling with Constant Rate Progress [68.8204255655161]
Annealed Importance Smpling (AIS)は、抽出可能な分布から重み付けされたサンプルを合成する。
本稿では,alpha$-divergencesに対する定数レートAISアルゴリズムとその効率的な実装を提案する。
論文 参考訳(メタデータ) (2023-06-27T08:15:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。