Fugu-MT 論文翻訳(概要): SURGE: Approximation-free Training Free Particle Filter for Diffusion Surrogate

論文の概要: SURGE: Approximation-free Training Free Particle Filter for Diffusion Surrogate

arxiv url: http://arxiv.org/abs/2605.18745v1
Date: Mon, 18 May 2026 17:59:00 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-19 17:57:50.227946
Title: SURGE: Approximation-free Training Free Particle Filter for Diffusion Surrogate
Title（参考訳）: SURGE:拡散サロゲート用無近似自由粒子フィルタ
Authors: Lifu Wei, Yinuo Ren, Naichen Shi, Yiping Lu,
Abstract要約: 拡散に基づく生成モデルは、推測時間のガイダンスにますます依存し、ドリフト項や専門家の混合を追加する。パラメータ変更によるパスワイズ重要度再重み付けを行う,微分自由推論時間スケーリングアルゴリズムである textttURGE を導入する。
参考スコア（独自算出の注目度）: 10.190682562038047
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Diffusion-based generative models increasingly rely on inference-time guidance, adding a drift term or reweighting mixture of experts, to improve sample quality on task-specific objectives. However, most existing techniques require repeated score or gradient evaluations, introducing bias, high computational overhead, or both. We introduce \texttt{URGE}, Unbiased Resampling via Girsanov Estimation, a derivative-free inference-time scaling algorithm that performs path-wise importance reweighting via a Girsanov change of measure. Instead of computing gradient-based particle weights in previous work, \texttt{URGE} attaches a simple multiplicative weight to each simulated trajectory and periodically resamples. No score, no Hessian, and no PDE evaluation is required. We establish an equivalence between path-wise and particle-wise SMC: the Girsanov path weight admits a backward conditional expectation that recovers the previous particle-level weights, guaranteeing that both schemes produce the same unbiased terminal law. Empirically, \texttt{URGE} outperforms existing inference-time guidance baselines on synthetic tests and diffusion-model benchmarks, achieving better generation quality, while being significantly simpler to implement and fully gradient-free.
Abstract（参考訳）: 拡散に基づく生成モデルは、タスク固有の目的のサンプル品質を改善するために、推論時ガイダンスに頼りやすくなり、ドリフト項や専門家の再重み付けが加えられる。しかし、既存の技術の多くは、繰り返しスコアや勾配の評価、バイアスの導入、高い計算オーバーヘッド、あるいはその両方を必要とする。本稿では、Girsanov EstimationによるUnbiased Resamplingである‘texttt{URGE}, Unbiased Resampling’を導入する。以前の研究で勾配に基づく粒子重量を計算する代わりに、 texttt{URGE} はシミュレーションされた軌道と周期的な再サンプリングに単純な乗法的重みを付加する。スコアもヘッセンもPDE評価も不要。我々は、経路ワイドと粒子ワイドSMCの等価性を確立する: ジルサノフパスウェイトは、以前の粒子レベルウェイトを回復する後方条件付き期待を許容し、両方のスキームが同じ偏りのない終端法則を生成することを保証する。経験的に、‘texttt{URGE} は、合成テストと拡散モデルベンチマークにおける既存の推論時ガイダンスベースラインを上回り、より優れた生成品質を実現し、実装が非常に簡単で、完全に勾配なしである。

関連論文リスト

Simple Approximation and Derivative Free Inference-Time Scaling for Diffusion Models via Sequential Monte Carlo on Path Measures [13.41132148962756]
textttURGEはデリバティブフリーな推論時間スケーリングアルゴリズムで、測定値の変更によって経路的に重要な再重み付けを行う。我々はパスワイドSMCとパーティクルワイドSMCの等価性を確立する。
論文参考訳（メタデータ） (2026-05-18T04:45:33Z)
Tempered Guided Diffusion [1.7778609937758325]
拡散前の条件付きトレーニング不要な条件付きサンプリングのためのシーケンシャルなモンテカルロフレームワークを提案する。 TGDは、ノイズ拡散状態のみを補助変数として、クリーン信号上の誘電後部分布を標的とする。高価な復元作業のために、TGDは初期の粒子探査を継続するが、サンプリングを通して1つの高軌道の軌道の一部にプルーネを配置する。
論文参考訳（メタデータ） (2026-05-05T13:00:15Z)
Sharp Convergence Rates for Masked Diffusion Models [53.117058231393834]
制約を克服するオイラー法に対する全変分に基づく解析法を開発した。その結果、スコア推定の仮定を緩和し、パラメータ依存性を改善し、収束保証を確立する。全体としては,CTMC軌道に沿った直接テレビによる誤り分解と,FHSのためのデカップリングに基づく経路解析を導入している。
論文参考訳（メタデータ） (2026-02-26T00:47:51Z)
Neural Backward Filtering Forward Guiding [2.676349883103404]
木上の非線形連続過程における推論は、観測が疎(リーフのみ)であり、トポロジーが複雑であるときに困難である。離散遷移と連続拡散の両方のための統一的なフレームワークであるニューラル・バックワード・フィルタリング・フォワード・ガイド(NBFFG)を提案する。
論文参考訳（メタデータ） (2026-01-30T14:39:50Z)
From Noisy Traces to Stable Gradients: Bias-Variance Optimized Preference Optimization for Aligning Large Reasoning Models [90.45197506653341]
大規模推論モデルは最終回答を生成する前に中間的推論トレースを生成する。 LRMと人間の好みの整合性は、モデルデプロイメントにとって重要な前提条件であり、まだ過小評価されていない。共通の回避策は1つのサンプル軌道を最適化し、トレースサンプリングからかなり勾配のばらつきをもたらす。
論文参考訳（メタデータ） (2025-10-06T17:58:01Z)
G$^2$RPO: Granular GRPO for Precise Reward in Flow Models [74.21206048155669]
本稿では,サンプリング方向の高精度かつ包括的な報酬評価を実現する新しいグラニュラー-GRPO(G$2$RPO)フレームワークを提案する。複数の拡散スケールで計算された利点を集約するマルチグラニュラリティ・アドバンテージ・インテグレーション・モジュールを導入する。 G$2$RPOは既存のフローベースGRPOベースラインを著しく上回る。
論文参考訳（メタデータ） (2025-10-02T12:57:12Z)
Inference-Time Scaling of Diffusion Language Models with Particle Gibbs Sampling [70.8832906871441]
我々は、モデルを再訓練することなく、所望の報酬に向けて世代を操る方法を研究する。従来の手法では、通常は1つの認知軌道内でサンプリングやフィルタを行い、軌道レベルの改善なしに報酬をステップバイステップで最適化する。本稿では,拡散言語モデル(PG-DLM)の粒子ギブスサンプリングについて紹介する。
論文参考訳（メタデータ） (2025-07-11T08:00:47Z)
Low-Rank Tensor Completion via Novel Sparsity-Inducing Regularizers [30.920908325825668]
低ランクテンソル完備化問題において、l1-ノルムを緩和するため、非ランクサロゲート/正則化器が提案されている。これらの正則化器は核ランク復元に適用され,乗算器法に基づく効率的なアルゴリズムが提案されている。
論文参考訳（メタデータ） (2023-10-10T01:00:13Z)
Sampling from Gaussian Process Posteriors using Stochastic Gradient Descent [43.097493761380186]
勾配アルゴリズムは線形系を解くのに有効な方法である。最適値に収束しない場合であっても,勾配降下は正確な予測を導出することを示す。実験的に、勾配降下は十分に大規模または不条件の回帰タスクにおいて最先端の性能を達成する。
論文参考訳（メタデータ） (2023-06-20T15:07:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。