論文の概要: A unified perspective on fine-tuning and sampling with diffusion and flow models
- arxiv url: http://arxiv.org/abs/2605.00229v1
- Date: Thu, 30 Apr 2026 21:06:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.754125
- Title: A unified perspective on fine-tuning and sampling with diffusion and flow models
- Title(参考訳): 拡散流モデルによる微調整・サンプリングの統一的視点
- Authors: Carles Domingo-Enrich, Yuanqi Du, Michael S. Albergo,
- Abstract要約: 本研究では, ベース密度の指数傾傾きによって定義されるターゲット密度から, トレーニング拡散モデルとフロー生成モデルを抽出する問題について検討する。
この問題は最適制御(SOC)の観点から、随伴法またはスコアマッチング法を用いて、あるいは非平衡熱力学の観点からアプローチすることができる。
- 参考スコア(独自算出の注目度): 22.218023926601106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of training diffusion and flow generative models to sample from target distributions defined by an exponential tilting of a base density; a formulation that subsumes both sampling from unnormalized densities and reward fine-tuning of pre-trained models. This problem can be approached from a stochastic optimal control (SOC) perspective, using adjoint-based or score matching methods, or from a non-equilibrium thermodynamics perspective. We provide a unified framework encompassing these approaches and make three main contributions: (i) bias-variance decompositions revealing that Adjoint Matching/Sampling and Novel Score Matching have finite gradient variance, while Target and Conditional Score Matching do not; (ii) norm bounds on the lean adjoint ODE that theoretically support the effectiveness of adjoint-based methods; and (iii) adaptations of the CMCD and NETS loss functions, along with novel Crooks and Jarzynski identities, to the exponential tilting setting. We validate our analysis with reward fine-tuning experiments on Stable Diffusion 1.5 and 3.
- Abstract(参考訳): ベース密度の指数傾傾傾きによって定義される対象分布から,非正規化密度からのサンプリングと事前学習モデルの微調整の両方を仮定した定式化を学習拡散とフロー生成モデルで行うことの課題について検討する。
この問題は確率的最適制御(SOC)の観点から、随伴法やスコアマッチング法を用いて、あるいは非平衡熱力学の観点から、アプローチすることができる。
これらのアプローチを包含する統一されたフレームワークを提供し、3つの主要な貢献をする。
(i)Adjoint Matching/Sampling とnew Score Matching が有限勾配分散を持つ一方、Target と Conditional Score Matching はそうでないことを示すバイアス分散分解。
(ii) 随伴法の有効性を理論的に支持するリーン随伴ODE上のノルム
3)CMCDとNETSの損失関数,および新しいクルックとジャジンスキーのアイデンティティを指数傾斜条件に適応させる。
安定拡散1.5および3。
関連論文リスト
- Variance-Reduced Diffusion Sampling via Target Score Identity [0.0]
クリーンな(ターゲット)スコアが利用可能か,あるいは近似可能な設定において,スコア推定と拡散に基づくサンプリングの分散化について検討した。
我々は、標準の逆時間解法と互換性のあるプラグアンドプレイ非パラメトリックな自己正規化重要度サンプリング推定器を開発した。
PDE-Governed Inverse問題と合成ターゲット実験により, 固定シミュレーション予算に対する試料品質の改善が示された。
論文 参考訳(メタデータ) (2026-01-04T16:46:31Z) - Score Distillation of Flow Matching Models [67.86066177182046]
我々は、Score Identity Distillation (SiD) を事前訓練されたテキスト対画像フローマッチングモデルに拡張する。
SiDは、データフリーとデータアシストの両方の設定で、これらのモデルですぐに使える。
これは、スコア蒸留がテキストと画像のフローマッチングモデルに広く適用されるという最初の体系的な証拠を提供する。
論文 参考訳(メタデータ) (2025-09-29T17:45:48Z) - NETS: A Non-Equilibrium Transport Sampler [15.58993313831079]
我々は、Non-Equilibrium Transport Sampler (NETS)と呼ばれるアルゴリズムを提案する。
NETSはJarzynskiの平等に基づいて、重要サンプリング(AIS)の亜種と見なすことができる。
このドリフトは、様々な目的関数の最小化であり、全て偏りのない方法で推定できることを示す。
論文 参考訳(メタデータ) (2024-10-03T17:35:38Z) - Theoretical Insights for Diffusion Guidance: A Case Study for Gaussian
Mixture Models [59.331993845831946]
拡散モデルは、所望の特性に向けてサンプル生成を操るために、スコア関数にタスク固有の情報を注入することの恩恵を受ける。
本稿では,ガウス混合モデルの文脈における拡散モデルに対する誘導の影響を理解するための最初の理論的研究を提供する。
論文 参考訳(メタデータ) (2024-03-03T23:15:48Z) - A Geometric Perspective on Diffusion Models [57.27857591493788]
本稿では,人気のある分散拡散型SDEのODEに基づくサンプリングについて検討する。
我々は、最適なODEベースのサンプリングと古典的な平均シフト(モード探索)アルゴリズムの理論的関係を確立する。
論文 参考訳(メタデータ) (2023-05-31T15:33:16Z) - The Score-Difference Flow for Implicit Generative Modeling [1.1929584800629673]
Inlicit Generative Modelingは、対象データ分布と一致する合成データのサンプルを作成することを目的としている。
最近の研究は、合成音源データをターゲット分布へプッシュする観点から、IGG問題にアプローチしている。
任意のターゲット分布とソース分布のスコア差を,Kulback-Leibler分散を最適に低減するフローとして提示する。
論文 参考訳(メタデータ) (2023-04-25T15:21:12Z) - Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。
提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文 参考訳(メタデータ) (2023-04-10T17:54:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。