論文の概要: Post-Hoc Guidance for Consistency Models by Joint Flow Distribution Learning
- arxiv url: http://arxiv.org/abs/2604.08828v1
- Date: Fri, 10 Apr 2026 00:00:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.615058
- Title: Post-Hoc Guidance for Consistency Models by Joint Flow Distribution Learning
- Title(参考訳): 連立流分布学習による一貫性モデルのポストホックガイダンス
- Authors: Chia-Hong Hsu, Randall Balestriero,
- Abstract要約: Diffusion-free Guidance (CFG)は、実践者が拡散モデル(DM)の多様性に対して忠実さを交換できるようにする
既存の指導方法は、個別のDM教師からの知識蒸留を必要とする。
本稿では,事前学習型CMにおける指導を可能にする軽量アライメント手法であるジョイントフロー分散学習(JFDL)を提案する。
- 参考スコア(独自算出の注目度): 19.252159895953977
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classifier-free Guidance (CFG) lets practitioners trade-off fidelity against diversity in Diffusion Models (DMs). The practicality of CFG is however hindered by DMs sampling cost. On the other hand, Consistency Models (CMs) generate images in one or a few steps, but existing guidance methods require knowledge distillation from a separate DM teacher, limiting CFG to Consistency Distillation (CD) methods. We propose Joint Flow Distribution Learning (JFDL), a lightweight alignment method enabling guidance in a pre-trained CM. With a pre-trained CM as an ordinary differential equation (ODE) solver, we verify with normality tests that the variance-exploding noise implied by the velocity fields from unconditional and conditional distributions is Gaussian. In practice, JFDL equips CMs with the familiar adjustable guidance knob, yielding guided images with similar characteristics to CFG. Applied to an original Consistency Trained (CT) CM that could only do conditional sampling, JFDL unlocks guided generation and reduces FID on both CIFAR-10 and ImageNet 64x64 datasets. This is the first time that CMs are able to receive effective guidance post-hoc without a DM teacher, thus, bridging a key gap in current methods for CMs.
- Abstract(参考訳): 分類自由誘導(CFG)により、実践者は拡散モデル(DM)における多様性に対する忠実さをトレードオフすることができる。
しかし、CFGの実用性は、DMのサンプリングコストによって妨げられている。
一方、CM(Consistency Models)は、複数のステップで画像を生成するが、既存のガイダンス手法では、個別のDM教師からの知識蒸留を必要とし、CFGをCD(Consistency Distillation)に制限する。
本稿では,事前学習型CMにおける指導を可能にする軽量アライメント手法であるジョイントフロー分散学習(JFDL)を提案する。
事前学習したCMを通常の微分方程式(ODE)解法として、非条件分布および条件分布から速度場によって印加される分散拡散雑音がガウス的であることを正規性テストで検証する。
実際には、JFDLはCMに慣れ親しんだ調整可能な誘導ノブを装備し、CFGに類似した特徴を持つガイド画像を生成する。
条件付きサンプリングのみが可能なオリジナルのConsistency Trained (CT) CMに適用されたJFDLは、ガイド付き生成をアンロックし、CIFAR-10とImageNet 64x64データセットのFIDを削減する。
DM教師がいなければ,CMがポストホックで効果的な指導を受けられるのは今回が初めてであり,現行のCM手法における重要なギャップを埋めることになる。
関連論文リスト
- Decoupled DMD: CFG Augmentation as the Spear, Distribution Matching as the Shield [54.328202401611264]
拡散モデル蒸留は、効率的な数段・単段発生装置を作るための強力な技術として登場した。
数段蒸留の原動力は分布一致ではなく,これまで見過ごされていた成分であるCFG増量 (CFG Augmentation, CA) であることを示す。
本稿では, エンジンとレギュレータのノイズスケジュールを分離するなど, 蒸留工程の原理的な修正を提案し, 更なる性能向上を実現した。
論文 参考訳(メタデータ) (2025-11-27T18:24:28Z) - Align Your Tangent: Training Better Consistency Models via Manifold-Aligned Tangents [55.43139356528315]
一貫性モデル(CM)は、フロー常微分方程式の軌跡に一貫性があるように訓練される。
CMは典型的には、競争力のあるサンプルの品質を得るために、大きなバッチサイズで長期のトレーニングを必要とする。
本稿では,データ多様体に向いた多様体整列接点を提供する,MFDと呼ばれる新しい損失関数を提案する。
論文 参考訳(メタデータ) (2025-10-01T08:35:18Z) - Adding Additional Control to One-Step Diffusion with Joint Distribution Matching [58.37264951734603]
JDMは、画像-条件関節分布間の逆KL分散を最小化する新しいアプローチである。
トラクタブルな上限を導出することにより、JDMは条件学習から忠実度学習を分離する。
この非対称蒸留方式により,一段階の生徒が教師モデルに未知の制御を処理できるようになる。
論文 参考訳(メタデータ) (2025-03-09T15:06:50Z) - Beyond and Free from Diffusion: Invertible Guided Consistency Training [12.277762115388187]
iGCTは、DMの訓練と蒸留を必要とせず、高速でガイドされた画像生成と編集に寄与する。
CIFAR-10 と ImageNet64 を用いた実験により,iGCT はCFG と比較して FID と精度が有意に向上することが示された。
論文 参考訳(メタデータ) (2025-02-08T00:23:40Z) - Rectified Diffusion Guidance for Conditional Generation [94.83538269086613]
CFGの背後にある理論を再検討し、不適切な組合せ係数(textiti.e.)が生成分布を期待的にシフトさせることを厳密に確認する。
提案手法は, 強みを考慮すれば, textbftextitform ソリューションが有効であることを示す。
実世界のデータに関する実証的な証拠は、我々の設計と既存の最先端拡散モデルとの整合性を実証している。
論文 参考訳(メタデータ) (2024-10-24T13:41:32Z) - No Training, No Problem: Rethinking Classifier-Free Guidance for Diffusion Models [25.301443993960277]
我々はCFGの中核となる原則を再考し、新しい方法である独立条件ガイダンス(ICG)を導入する。
ICGは特別な訓練手順を必要とせずにCFGの利点を提供する。
提案手法は条件拡散モデルの学習過程を合理化し,任意の事前学習条件モデル上での推論にも適用可能である。
論文 参考訳(メタデータ) (2024-07-02T22:04:00Z) - On Reinforcement Learning and Distribution Matching for Fine-Tuning
Language Models with no Catastrophic Forgetting [5.5302127686575435]
Reward Maximization (RM) と、最近では Distribution Matching (DM) の2つのパラダイムがこの課題に取り組むために登場した。
RM用に開発されたKL制御などの手法も,DMに属するものと解釈できることを示す。
2つのパラダイム間の接続を利用して、ベースラインの概念をDMメソッドにインポートします。
論文 参考訳(メタデータ) (2022-06-01T20:54:41Z) - MMCGAN: Generative Adversarial Network with Explicit Manifold Prior [78.58159882218378]
本稿では,モード崩壊を緩和し,GANのトレーニングを安定させるために,明示的な多様体学習を採用することを提案する。
玩具データと実データの両方を用いた実験により,MMCGANのモード崩壊緩和効果,トレーニングの安定化,生成サンプルの品質向上効果が示された。
論文 参考訳(メタデータ) (2020-06-18T07:38:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。