論文の概要: Inference-Time Alignment for Diffusion Models via Doob's Matching
- arxiv url: http://arxiv.org/abs/2601.06514v1
- Date: Sat, 10 Jan 2026 10:28:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.85516
- Title: Inference-Time Alignment for Diffusion Models via Doob's Matching
- Title(参考訳): Doobのマッチングによる拡散モデルの推測時間アライメント
- Authors: Jinyuan Chang, Chenguang Duan, Yuling Jiao, Yi Xu, Jerry Zhijian Yang,
- Abstract要約: 拡散モデルの推論時間アライメントは,ベーススコアネットワークを再学習することなく,事前学習した拡散モデルを目標分布に適応することを目的としている。
本稿では,Doobの$h$-transformをベースとしたガイダンス推定フレームワークであるDoobのマッチングについて紹介する。
2-ワッサーシュタイン距離における生成分布の非漸近収束を保証する。
- 参考スコア(独自算出の注目度): 16.416975860645724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inference-time alignment for diffusion models aims to adapt a pre-trained diffusion model toward a target distribution without retraining the base score network, thereby preserving the generative capacity of the base model while enforcing desired properties at the inference time. A central mechanism for achieving such alignment is guidance, which modifies the sampling dynamics through an additional drift term. In this work, we introduce Doob's matching, a novel framework for guidance estimation grounded in Doob's $h$-transform. Our approach formulates guidance as the gradient of logarithm of an underlying Doob's $h$-function and employs gradient-penalized regression to simultaneously estimate both the $h$-function and its gradient, resulting in a consistent estimator of the guidance. Theoretically, we establish non-asymptotic convergence rates for the estimated guidance. Moreover, we analyze the resulting controllable diffusion processes and prove non-asymptotic convergence guarantees for the generated distributions in the 2-Wasserstein distance.
- Abstract(参考訳): 拡散モデルの推論時間アライメントは,ベーススコアネットワークをトレーニングすることなく,事前学習した拡散モデルを目標分布に適応させることを目的としている。
このようなアライメントを達成するための中心的なメカニズムは、追加のドリフト項を通じてサンプリングダイナミクスを変更するガイダンスである。
本稿では,Doobの$h$-transformに基づくガイダンス推定のための新しいフレームワークであるDoobのマッチングを紹介する。
提案手法は,基礎となるDoobの$h$関数の対数勾配として導出を定式化し,この導出を同時に推定することにより,導出を一貫した推定を行う。
理論的には、推定誘導のための非漸近収束率を確立する。
さらに、制御可能な拡散過程を解析し、2-ワッサーシュタイン距離における生成分布の非漸近収束を保証する。
関連論文リスト
- Diffusion Models: A Mathematical Introduction [3.8673630752805437]
本稿では拡散に基づく生成モデルの自己完結型導出について述べる。
第一原理から拡散確率モデルを構築する。
読者はこの理論に従い、実際に対応するアルゴリズムを実装することができる。
論文 参考訳(メタデータ) (2025-11-13T16:20:52Z) - Effective Test-Time Scaling of Discrete Diffusion through Iterative Refinement [51.54933696252104]
離散拡散に適した新しいテスト時間スケーリング手法であるイテレーティブ・リワードガイドリファインメント(IterRef)を導入する。
我々は、このプロセスをMultiple-Try Metropolisフレームワークで形式化し、報酬整合分布への収束を証明した。
IterRefは計算予算の低さで大幅に上昇し、最先端のベースラインをはるかに超えている。
論文 参考訳(メタデータ) (2025-11-04T02:33:23Z) - TAG:Tangential Amplifying Guidance for Hallucination-Resistant Diffusion Sampling [53.61290359948953]
タンジェンシャル増幅誘導(TAG)は、下層の拡散モデルを変更することなく、軌道信号のみで動作する。
この誘導過程を1次テイラー展開を利用して定式化する。
TAGは、最小限の計算加算で拡散サンプリング忠実度を改善する、プラグアンドプレイのアーキテクチャに依存しないモジュールである。
論文 参考訳(メタデータ) (2025-10-06T06:53:29Z) - Semantically-Guided Inference for Conditional Diffusion Models: Enhancing Covariate Consistency in Time Series Forecasting [6.716179859091235]
SemGuideは条件付き拡散モデルにおける共変量一貫性を高めるプラグイン・アンド・プレイの推論時間法である。
本稿では,中間拡散状態と将来の共変量とのセマンティックアライメントを評価するためのスコアリングネットワークを提案する。
論文 参考訳(メタデータ) (2025-08-03T14:04:04Z) - Training-Free Stein Diffusion Guidance: Posterior Correction for Sampling Beyond High-Density Regions [46.59494117137471]
自由拡散誘導の訓練は、追加の訓練なしに既成の分類器を活用する柔軟な方法を提供する。
本稿では,SOC を対象とする新たなトレーニングフリーフレームワークである Stein Diffusion Guidance (SDG) を紹介する。
分子低密度サンプリングタスクの実験は、SDGが標準のトレーニングフリーガイダンス手法を一貫して上回っていることを示唆している。
論文 参考訳(メタデータ) (2025-07-07T21:14:27Z) - Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
一般のスコアミスマッチ拡散サンプリング器に対する明示的な次元依存性を持つ最初の性能保証を示す。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Gradient Guidance for Diffusion Models: An Optimization Perspective [45.6080199096424]
本稿では,ユーザ特定目的の最適化に向けて,事前学習した拡散モデルを適用するための勾配ガイダンスの形式について検討する。
我々は,その最適化理論とアルゴリズム設計を体系的に研究するために,誘導拡散の数学的枠組みを確立する。
論文 参考訳(メタデータ) (2024-04-23T04:51:02Z) - Convergence Analysis of Flow Matching in Latent Space with Transformers [7.069772598731282]
本稿では,ODEに基づく生成モデル,特にフローマッチングに関する理論的収束保証について述べる。
トレーニング済みのオートエンコーダネットワークを用いて、高次元の原入力を低次元の潜在空間にマッピングし、トランスフォーマーネットワークをトレーニングし、標準正規分布から目標潜在分布への変換速度場を予測する。
論文 参考訳(メタデータ) (2024-04-03T07:50:53Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。