論文の概要: Saddle-Free Guidance: Improved On-Manifold Sampling without Labels or Additional Training
- arxiv url: http://arxiv.org/abs/2511.21863v1
- Date: Wed, 26 Nov 2025 19:39:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.269605
- Title: Saddle-Free Guidance: Improved On-Manifold Sampling without Labels or Additional Training
- Title(参考訳): Saddle-free Guidance: ラベルや追加トレーニングを伴わないオンマンフォールドサンプリングの改善
- Authors: Eric Yeats, Darryl Hannan, Wilson Fearn, Timothy Doster, Henry Kvinge, Scott Mahan,
- Abstract要約: 我々は,個々のスコアベースモデルを導くために,ログ密度の最大正曲率を推定するサドルフリーガイダンス(SFG)を開発した。
実験の結果,SFGはシングルモデル ImageNet512 生成において,最先端の FID と FDDINOv2 のメトリクスを達成できることが示唆された。
- 参考スコア(独自算出の注目度): 6.807078976578283
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Score-based generative models require guidance in order to generate plausible, on-manifold samples. The most popular guidance method, Classifier-Free Guidance (CFG), is only applicable in settings with labeled data and requires training an additional unconditional score-based model. More recently, Auto-Guidance adopts a smaller, less capable version of the original model to guide generation. While each method effectively promotes the fidelity of generated data, each requires labeled data or the training of additional models, making it challenging to guide score-based models when (labeled) training data are not available or training new models is not feasible. We make the surprising discovery that the positive curvature of log density estimates in saddle regions provides strong guidance for score-based models. Motivated by this, we develop saddle-free guidance (SFG) which maintains estimates of maximal positive curvature of the log density to guide individual score-based models. SFG has the same computational cost of classifier-free guidance, does not require additional training, and works with off-the-shelf diffusion and flow matching models. Our experiments indicate that SFG achieves state-of-the-art FID and FD-DINOv2 metrics in single-model unconditional ImageNet-512 generation. When SFG is combined with Auto-Guidance, its unconditional samples achieve general state-of-the-art in FD-DINOv2 score. Our experiments with FLUX.1-dev and Stable Diffusion v3.5 indicate that SFG boosts the diversity of output images compared to CFG while maintaining excellent prompt adherence and image fidelity.
- Abstract(参考訳): スコアベースの生成モデルは、プラウシブルなオンマンフォールドサンプルを生成するためにガイダンスを必要とする。
最も一般的なガイダンス手法であるCFG(Classifier-Free Guidance)はラベル付きデータの設定にのみ適用でき、追加の無条件スコアベースモデルをトレーニングする必要がある。
最近では、Auto-Guidanceは、生成をガイドするためにオリジナルのモデルのより小さく、能力の低いバージョンを採用しています。
それぞれの手法は、生成されたデータの忠実さを効果的に促進するが、ラベル付きデータや追加モデルのトレーニングが必要であるため、(ラベル付き)トレーニングデータが入手できない場合や、新しいモデルをトレーニングできない場合、スコアベースのモデルをガイドすることは困難である。
我々は,サドル地域でのログ密度推定の正の曲率が,スコアベースモデルに強いガイダンスを与えるという驚くべき発見を行う。
そこで我々は,個々のスコアベースモデルを導くために,ログ密度の最大正曲率の推定値を維持するサドルフリーガイダンス(SFG)を開発した。
SFGは分類器なし指導の計算コストが同じであり、追加の訓練を必要とせず、既製の拡散とフローマッチングモデルで動作する。
実験の結果,SFGはFIDとFD-DINOv2のメトリクスを単一モデル無条件 ImageNet-512 生成で達成できることがわかった。
SFGとAuto-Guidanceを組み合わせると、その非条件サンプルはFD-DINOv2スコアの一般的な最先端が得られる。
FLUX.1-devとStable Diffusion v3.5を用いて行った実験は、SFGがCFGと比較して出力画像の多様性を向上し、優れた即効性および画像忠実性を維持していることを示している。
関連論文リスト
- Diffusion Models without Classifier-free Guidance [41.59396565229466]
モデルガイダンス(MG)は拡散モデルアドレスを訓練するための新しい目的であり、よく使われるガイダンス(CFG)を除去する。
我々の革新的なアプローチは、標準モデリングを超越し、条件の後方確率を組み込む。
提案手法は,CFGを用いた並列拡散モデルにおいても,学習過程を著しく加速し,推論速度を2倍にし,並列拡散モデルでさえ並列に超える異常な品質を実現する。
論文 参考訳(メタデータ) (2025-02-17T18:59:50Z) - Visual Generation Without Guidance [54.556375372833685]
我々はサンプリングガイドのないビジュアルモデルを構築することを提案する。
得られたアルゴリズムである Guidance-Free Training (GFT) は、CFGの性能と一致し、サンプリングを1つのモデルに減らし、コストを半減する。
論文 参考訳(メタデータ) (2025-01-26T06:48:05Z) - Gradient-Free Classifier Guidance for Diffusion Model Sampling [4.450496470631169]
Gradient-free Guidance (GFCG) 法はクラス予測精度を一貫して改善する。
ImageNet 512$times$512では、記録的な$FD_textDINOv2$23.09を達成すると同時に、ATG (90.2%) と比較して高い分類精度 (94.3%) を達成する。
論文 参考訳(メタデータ) (2024-11-23T00:22:21Z) - Guided Score identity Distillation for Data-Free One-Step Text-to-Image Generation [62.30570286073223]
拡散に基づくテキスト・画像生成モデルは、テキスト記述と整合した画像を生成する能力を実証している。
本研究では, 実データにアクセスすることなく, 事前学習した拡散モデルの効率的な蒸留を可能にする, データフリーガイド蒸留法を提案する。
データフリー蒸留法は, 1ステップ生成装置で生成した合成画像のみをトレーニングすることにより, FIDとCLIPのスコアを急速に向上させ, 競争力のあるCLIPスコアを維持しつつ, 最先端のFID性能を実現する。
論文 参考訳(メタデータ) (2024-06-03T17:44:11Z) - Exploring Beyond Logits: Hierarchical Dynamic Labeling Based on Embeddings for Semi-Supervised Classification [49.09505771145326]
モデル予測に依存しない階層型動的ラベル付け(HDL)アルゴリズムを提案し,画像埋め込みを用いてサンプルラベルを生成する。
本手法は,半教師付き学習における擬似ラベル生成のパラダイムを変える可能性がある。
論文 参考訳(メタデータ) (2024-04-26T06:00:27Z) - Discrete Diffusion Modeling by Estimating the Ratios of the Data Distribution [67.9215891673174]
離散空間に対するスコアマッチングを自然に拡張する新たな損失として,スコアエントロピーを提案する。
標準言語モデリングタスク上で,Score Entropy Discrete Diffusionモデルをテストする。
論文 参考訳(メタデータ) (2023-10-25T17:59:12Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Consistent Diffusion Models: Mitigating Sampling Drift by Learning to be
Consistent [97.64313409741614]
本稿では, モデルが生成したデータ上での予測が時間とともに一定であることを示す, 両立性特性を強制することを提案する。
CIFAR-10の条件および非条件生成とAFHQとFFHQのベースライン改良について,本研究の新たな訓練目標が得られた。
論文 参考訳(メタデータ) (2023-02-17T18:45:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。