論文の概要: Iterative Tilting for Diffusion Fine-Tuning
- arxiv url: http://arxiv.org/abs/2512.03234v1
- Date: Tue, 02 Dec 2025 21:07:46 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 12:17:36.353742
- Title: Iterative Tilting for Diffusion Fine-Tuning
- Title(参考訳): 拡散微細加工における繰り返しティルティング
- Authors: Jean Pachebat, Giovanni Conforti, Alain Durmus, Yazid Janati,
- Abstract要約: 反復傾きは、報酬型分布に対する微調整拡散モデルのための勾配のない方法である。
線形報酬を伴う2次元ガウス混合に対して、正確な傾き分布を閉形式で得ることを検証した。
- 参考スコア(独自算出の注目度): 14.620291917371937
- License:
- Abstract: We introduce iterative tilting, a gradient-free method for fine-tuning diffusion models toward reward-tilted distributions. The method decomposes a large reward tilt $\exp(λr)$ into $N$ sequential smaller tilts, each admitting a tractable score update via first-order Taylor expansion. This requires only forward evaluations of the reward function and avoids backpropagating through sampling chains. We validate on a two-dimensional Gaussian mixture with linear reward, where the exact tilted distribution is available in closed form.
- Abstract(参考訳): 報奨型分布に対する微調整拡散モデルのための勾配のない反復傾き法を提案する。
この方法は、大きな報酬の傾きを$\exp(λr)$から$N$の連続的な小さな傾きに分解し、それぞれ1階テイラー展開による引き分け可能なスコアの更新を認める。
これにより、報酬関数の前方評価のみが必要となり、サンプリングチェーンによるバックプロパゲートを回避することができる。
線形報酬を伴う2次元ガウス混合に対して、正確な傾き分布を閉形式で得ることを検証した。
関連論文リスト
- Effective Test-Time Scaling of Discrete Diffusion through Iterative Refinement [51.54933696252104]
離散拡散に適した新しいテスト時間スケーリング手法であるイテレーティブ・リワードガイドリファインメント(IterRef)を導入する。
我々は、このプロセスをMultiple-Try Metropolisフレームワークで形式化し、報酬整合分布への収束を証明した。
IterRefは計算予算の低さで大幅に上昇し、最先端のベースラインをはるかに超えている。
論文 参考訳(メタデータ) (2025-11-04T02:33:23Z) - Learn to Guide Your Diffusion Model [84.82855046749657]
本研究では,条件付き拡散モデルによる試料の品質向上手法について検討する。
誘導ウェイトは$omega_c,(s,t)$で、条件付き$c$、飾る時間$t$、飾る時間$s$の関数です。
我々は,モデルが報酬関数によって傾いた分布を目標にすることができるように,フレームワークを拡張して報酬付きサンプリングを行う。
論文 参考訳(メタデータ) (2025-10-01T12:21:48Z) - Generalized Gradient Norm Clipping & Non-Euclidean $(L_0,L_1)$-Smoothness [51.302674884611335]
本研究は、急勾配と条件勾配のアプローチを組み合わせることでノルムクリッピングを一般化するハイブリッド非ユークリッド最適化手法を提案する。
本稿では、ディープラーニングのためのアルゴリズムのインスタンス化について論じ、画像分類と言語モデリングにおけるそれらの特性を実証する。
論文 参考訳(メタデータ) (2025-06-02T17:34:29Z) - A Stein Gradient Descent Approach for Doubly Intractable Distributions [5.63014864822787]
そこで本研究では,2重に抽出可能な分布を推定するために,モンテカルロ・スタイン変分勾配勾配(MC-SVGD)法を提案する。
提案手法は,後続分布に匹敵する推論性能を提供しながら,既存のアルゴリズムよりもかなりの計算ゲインを達成する。
論文 参考訳(メタデータ) (2024-10-28T13:42:27Z) - Amortized Posterior Sampling with Diffusion Prior Distillation [55.03585818289934]
Amortized Posterior Smplingは、逆問題における効率的な後方サンプリングのための新しい変分推論手法である。
本手法は,拡散モデルにより暗黙的に定義された変動分布と後続分布とのばらつきを最小限に抑えるために条件付き流れモデルを訓練する。
既存の手法とは異なり、我々のアプローチは教師なしであり、ペア化されたトレーニングデータを必要としておらず、ユークリッドと非ユークリッドの両方のドメインに適用できる。
論文 参考訳(メタデータ) (2024-07-25T09:53:12Z) - Improving Diffusion Models for Inverse Problems Using Optimal Posterior Covariance [52.093434664236014]
近年の拡散モデルは、特定の逆問題に対して再訓練することなく、ノイズの多い線形逆問題に対する有望なゼロショット解を提供する。
この発見に触発されて、我々は、最大推定値から決定されるより原理化された共分散を用いて、最近の手法を改善することを提案する。
論文 参考訳(メタデータ) (2024-02-03T13:35:39Z) - Nearly $d$-Linear Convergence Bounds for Diffusion Models via Stochastic
Localization [40.808942894229325]
データ次元において線形である第1収束境界を提供する。
拡散モデルは任意の分布を近似するために少なくとも$tilde O(fracd log2(1/delta)varepsilon2)$ stepsを必要とすることを示す。
論文 参考訳(メタデータ) (2023-08-07T16:01:14Z) - Fluctuation without dissipation: Microcanonical Langevin Monte Carlo [0.0]
ランゲヴィン・モンテカルロサンプリングアルゴリズムは熱浴中の物理系にインスパイアされている。
フル位相空間分布ではなく、構成空間分布のみを正準化する必要があるため、揺らぎ散逸定理は不要であることを示す。
微分方程式の散逸のないシステム(SDE)として連続時間マイクロカノニカルLangevin Monte Carlo(MCLMC)を提案する。
論文 参考訳(メタデータ) (2023-03-31T17:24:33Z) - Fast Margin Maximization via Dual Acceleration [52.62944011696364]
指数関数的尾の損失を持つ線形分類器を訓練するための運動量に基づく手法を提案し,解析する。
この運動量に基づく法は、最大マルジン問題の凸双対、特にこの双対にネステロフ加速度を適用することによって導出される。
論文 参考訳(メタデータ) (2021-07-01T16:36:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。