論文の概要: Enhancing Diffusion Model Guidance through Calibration and Regularization
- arxiv url: http://arxiv.org/abs/2511.05844v2
- Date: Wed, 12 Nov 2025 01:20:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 16:10:52.772677
- Title: Enhancing Diffusion Model Guidance through Calibration and Regularization
- Title(参考訳): キャリブレーションと正規化による拡散モデルガイダンスの強化
- Authors: Seyed Alireza Javid, Amirhossein Bagheri, Nuria González-Prelcic,
- Abstract要約: 本稿では,この問題に対処するための2つの補完的貢献を紹介する。
まず,Smooth expected Error(Smooth ECE)に基づく微分可能なキャリブレーション目標を提案する。
第2に,再訓練を必要とせず,市販の分類器で動作可能なサンプリング誘導手法を開発した。
- 参考スコア(独自算出の注目度): 9.22066257345387
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classifier-guided diffusion models have emerged as a powerful approach for conditional image generation, but they suffer from overconfident predictions during early denoising steps, causing the guidance gradient to vanish. This paper introduces two complementary contributions to address this issue. First, we propose a differentiable calibration objective based on the Smooth Expected Calibration Error (Smooth ECE), which improves classifier calibration with minimal fine-tuning and yields measurable improvements in Frechet Inception Distance (FID). Second, we develop enhanced sampling guidance methods that operate on off-the-shelf classifiers without requiring retraining. These include tilted sampling with batch-level reweighting, adaptive entropy-regularized sampling to preserve diversity, and a novel f-divergence-based sampling strategy that strengthens class-consistent guidance while maintaining mode coverage. Experiments on ImageNet 128x128 demonstrate that our divergence-regularized guidance achieves an FID of 2.13 using a ResNet-101 classifier, improving upon existing classifier-guided diffusion methods while requiring no diffusion model retraining. The results show that principled calibration and divergence-aware sampling provide practical and effective improvements for classifier-guided diffusion.
- Abstract(参考訳): 分類器誘導拡散モデルが条件付き画像生成の強力なアプローチとして登場したが、初期の認知段階における過度な予測に悩まされ、誘導勾配が消滅する。
本稿では,この問題に対処するための2つの補完的貢献を紹介する。
まず,Frechet Inception Distance(FID)において,最小限の微調整で分類器の校正を改善するSmooth Preciped Calibration Error(Smooth ECE)に基づく識別可能な校正目標を提案する。
第2に,再訓練を必要とせず,市販の分類器で動作可能なサンプリング誘導手法を開発した。
これらには、バッチレベルの再重み付けによる傾きサンプリング、多様性を維持するための適応エントロピー正規化サンプリング、モードカバレッジを維持しながらクラス一貫性のガイダンスを強化する新しいf分割型サンプリング戦略が含まれる。
ImageNet 128x128の実験では,ResNet-101分類器を用いた2.13のFIDを実現し,拡散モデルの再学習を必要とせず,既存の分類器誘導拡散法を改善した。
その結果, キャリブレーションと分散認識サンプリングは, 分類器誘導拡散の実用的, 効果的な改善をもたらすことがわかった。
関連論文リスト
- Test-Time Anchoring for Discrete Diffusion Posterior Sampling [38.507644561076894]
後方サンプリングは、事前訓練された離散拡散基礎モデルにとって難しい問題である。
マスク拡散基礎モデルのためのAnchored Posterior Smpling (APS) を提案する。
本手法は線形および非線形逆問題に対する離散拡散サンプリング器の最先端性能を実現する。
論文 参考訳(メタデータ) (2025-10-02T17:58:37Z) - Advancing Reliable Test-Time Adaptation of Vision-Language Models under Visual Variations [67.35596444651037]
視覚言語モデル(VLM)は、素晴らしいゼロショット機能を示すが、ラベル付きデータが利用できない場合、下流タスクの分散シフトに苦慮する。
本稿では,信頼性を両面から高めるReliable Test-Time Adaptation (ReTA)法を提案する。
論文 参考訳(メタデータ) (2025-07-13T05:37:33Z) - Training-Free Stein Diffusion Guidance: Posterior Correction for Sampling Beyond High-Density Regions [46.59494117137471]
自由拡散誘導の訓練は、追加の訓練なしに既成の分類器を活用する柔軟な方法を提供する。
本稿では,SOC を対象とする新たなトレーニングフリーフレームワークである Stein Diffusion Guidance (SDG) を紹介する。
分子低密度サンプリングタスクの実験は、SDGが標準のトレーニングフリーガイダンス手法を一貫して上回っていることを示唆している。
論文 参考訳(メタデータ) (2025-07-07T21:14:27Z) - Solving Inverse Problems with FLAIR [68.87167940623318]
本稿では,フローベース生成モデルを逆問題に先立って活用する学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - One-Step Diffusion Model for Image Motion-Deblurring [85.76149042561507]
本稿では,脱臭過程を1段階に短縮する新しいフレームワークである脱臭拡散モデル(OSDD)を提案する。
拡散モデルにおける忠実度損失に対処するために,構造復元を改善する改良された変分オートエンコーダ(eVAE)を導入する。
提案手法は,実測値と非参照値の両方で高い性能を達成する。
論文 参考訳(メタデータ) (2025-03-09T09:39:57Z) - Informed Correctors for Discrete Diffusion Models [27.295990499157814]
離散拡散モデルに対する予測・相関型サンプリング手法を提案する。
情報補正器は,誤差が少なく,FIDスコアが向上した優れたサンプルを連続的に生成することを示す。
本結果は,離散拡散を用いた高速かつ高忠実な生成のための情報補正器の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2024-07-30T23:29:29Z) - Characteristic Guidance: Non-linear Correction for Diffusion Model at Large Guidance Scale [0.0]
そこで本研究では,一元的非線形補正法である特徴ガイダンスを提案する。
実験により,特徴誘導は画像生成におけるプロンプトのセマンティックな特徴と不規則性を高めることが示された。
論文 参考訳(メタデータ) (2023-12-11T02:40:40Z) - (Certified!!) Adversarial Robustness for Free! [116.6052628829344]
逆方向の摂動が0.5の2ノルム以内であることに制約された場合,ImageNetでは71%の精度が証明された。
これらの結果は,モデルパラメータの微調整や再学習を必要とせず,事前学習した拡散モデルと画像分類器のみを用いて得られる。
論文 参考訳(メタデータ) (2022-06-21T17:27:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。