論文の概要: Simple Approximation and Derivative Free Inference-Time Scaling for Diffusion Models via Sequential Monte Carlo on Path Measures
- arxiv url: http://arxiv.org/abs/2605.17850v1
- Date: Mon, 18 May 2026 04:45:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.812254
- Title: Simple Approximation and Derivative Free Inference-Time Scaling for Diffusion Models via Sequential Monte Carlo on Path Measures
- Title(参考訳): 逐次モンテカルロ法による拡散モデルの簡易近似と導出自由時間スケーリング
- Authors: Chenyang Wang, Weizhong Wang, Yinuo Ren, Jose Blanchet, Yiping Lu,
- Abstract要約: textttURGEはデリバティブフリーな推論時間スケーリングアルゴリズムで、測定値の変更によって経路的に重要な再重み付けを行う。
我々はパスワイドSMCとパーティクルワイドSMCの等価性を確立する。
- 参考スコア(独自算出の注目度): 13.41132148962756
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: iffusion-based generative models increasingly rely on inference-time guidance, adding a drift term or reweighting mixture of experts, to improve sample quality on task-specific objectives. However, most existing techniques require repeated score or gradient evaluations, introducing bias, high computational overhead, or both. We introduce \texttt{URGE}, Unbiased Resampling via Girsanov Estimation, a derivative-free inference-time scaling algorithm that performs path-wise importance reweighting via a Girsanov change of measure. Instead of computing gradient-based particle weights in previous work, \texttt{URGE} attaches a simple multiplicative weight to each simulated trajectory and periodically resamples. No score, no Hessian, and no PDE evaluation is required. We establish an equivalence between path-wise and particle-wise SMC: the Girsanov path weight admits a backward conditional expectation that recovers the previous particle-level weights, guaranteeing that both schemes produce the same unbiased terminal law. Empirically, \texttt{URGE} outperforms existing inference-time guidance baselines on synthetic tests and diffusion-model benchmarks, achieving better generation quality, while being significantly simpler to implement and fully gradient-free.
- Abstract(参考訳): iffusionベースの生成モデルは、タスク固有の目的のサンプル品質を改善するために、推論時のガイダンスに頼り、ドリフト項を追加したり、専門家の混合物を再重み付けしたりする。
しかし、既存の技術の多くは、繰り返しスコアや勾配の評価、バイアスの導入、高い計算オーバーヘッド、あるいはその両方を必要とする。
本稿では、Girsanov EstimationによるUnbiased Resamplingである‘texttt{URGE}, Unbiased Resampling’を導入する。
以前の研究で勾配に基づく粒子重量を計算する代わりに、 texttt{URGE} はシミュレーションされた軌道と周期的な再サンプリングに単純な乗法的重みを付加する。
スコアもヘッセンもPDE評価も不要。
我々は、経路ワイドと粒子ワイドSMCの等価性を確立する: ジルサノフパスウェイトは、以前の粒子レベルウェイトを回復する後方条件付き期待を許容し、両方のスキームが同じ偏りのない終端法則を生成することを保証する。
経験的に、‘texttt{URGE} は、合成テストと拡散モデルベンチマークにおける既存の推論時ガイダンスベースラインを上回り、より優れた生成品質を実現し、実装が非常に簡単で、完全に勾配なしである。
関連論文リスト
- SURGE: Approximation-free Training Free Particle Filter for Diffusion Surrogate [10.190682562038047]
拡散に基づく生成モデルは、推測時間のガイダンスにますます依存し、ドリフト項や専門家の混合を追加する。
パラメータ変更によるパスワイズ重要度再重み付けを行う,微分自由推論時間スケーリングアルゴリズムである textttURGE を導入する。
論文 参考訳(メタデータ) (2026-05-18T17:59:00Z) - Temporal Pair Consistency for Variance-Reduced Flow Matching [13.328987133593154]
TPC(Temporal Pair Consistency)は、同じ確率経路に沿ってペア化された時間ステップで速度予測を結合する軽量な分散還元原理である。
フローマッチング内で確立されたTPCは、複数の解像度でCIFAR-10とImageNetのサンプル品質と効率を改善する。
論文 参考訳(メタデータ) (2026-02-04T00:05:21Z) - Stein-Rule Shrinkage for Stochastic Gradient Estimation in High Dimensions [0.0]
勾配法は大規模学習の中心であるが、古典的決定理論が高次元において許容できないことを示す非バイアス推定器としてミニバッチ勾配を扱う。
本稿では, 歴史運動量から導かれる安定な推定器に対して, ミニバッチ勾配を適応的に調整する勾配推定器を構築する。
CIFAR10とCIFAR100の実験的評価は、大型バッチ方式におけるAdamよりも一貫した改善を示した。
論文 参考訳(メタデータ) (2026-02-02T08:01:13Z) - From Noisy Traces to Stable Gradients: Bias-Variance Optimized Preference Optimization for Aligning Large Reasoning Models [90.45197506653341]
大規模推論モデルは最終回答を生成する前に中間的推論トレースを生成する。
LRMと人間の好みの整合性は、モデルデプロイメントにとって重要な前提条件であり、まだ過小評価されていない。
共通の回避策は1つのサンプル軌道を最適化し、トレースサンプリングからかなり勾配のばらつきをもたらす。
論文 参考訳(メタデータ) (2025-10-06T17:58:01Z) - Inference-Time Scaling of Diffusion Language Models with Particle Gibbs Sampling [70.8832906871441]
我々は、モデルを再訓練することなく、所望の報酬に向けて世代を操る方法を研究する。
従来の手法では、通常は1つの認知軌道内でサンプリングやフィルタを行い、軌道レベルの改善なしに報酬をステップバイステップで最適化する。
本稿では,拡散言語モデル(PG-DLM)の粒子ギブスサンプリングについて紹介する。
論文 参考訳(メタデータ) (2025-07-11T08:00:47Z) - Feynman-Kac Correctors in Diffusion: Annealing, Guidance, and Product of Experts [64.34482582690927]
事前学習したスコアベースモデルから得られた熱処理, 幾何平均, 製品分布の配列から, 効率的かつ原理的に抽出する方法を提供する。
本稿では,サンプリング品質を向上させるために,推論時間スケーリングを利用する逐次モンテカルロ(SMC)再サンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-03-04T17:46:51Z) - Low-Rank Tensor Completion via Novel Sparsity-Inducing Regularizers [30.920908325825668]
低ランクテンソル完備化問題において、l1-ノルムを緩和するため、非ランクサロゲート/正則化器が提案されている。
これらの正則化器は核ランク復元に適用され,乗算器法に基づく効率的なアルゴリズムが提案されている。
論文 参考訳(メタデータ) (2023-10-10T01:00:13Z) - Sampling from Gaussian Process Posteriors using Stochastic Gradient
Descent [43.097493761380186]
勾配アルゴリズムは線形系を解くのに有効な方法である。
最適値に収束しない場合であっても,勾配降下は正確な予測を導出することを示す。
実験的に、勾配降下は十分に大規模または不条件の回帰タスクにおいて最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-06-20T15:07:37Z) - Path Sample-Analytic Gradient Estimators for Stochastic Binary Networks [78.76880041670904]
二進的アクティベーションや二進的重みを持つニューラルネットワークでは、勾配降下によるトレーニングは複雑である。
そこで本研究では,サンプリングと解析近似を併用した新しい推定法を提案する。
勾配推定において高い精度を示し、深部畳み込みモデルにおいてより安定かつ優れた訓練を行うことを示す。
論文 参考訳(メタデータ) (2020-06-04T21:51:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。