論文の概要: Slowly Annealed Langevin Dynamics: Theory and Applications to Training-Free Guided Generation
- arxiv url: http://arxiv.org/abs/2605.07950v1
- Date: Fri, 08 May 2026 16:17:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.193431
- Title: Slowly Annealed Langevin Dynamics: Theory and Applications to Training-Free Guided Generation
- Title(参考訳): ゆっくりと焼成されたランゲヴィンダイナミクス:学習自由誘導生成の理論と応用
- Authors: Atsushi Nitanda, Dake Bu, Yueming Lyu, Tanya Veeravalli,
- Abstract要約: Slowly Annealed Langevin Dynamics (SALD) について検討した。
我々は,KL差分不等式による非漸近収束保証を確立することにより,中間目標の収縮による追尾速度の低下が向上することを示す。
- 参考スコア(独自算出の注目度): 19.610922300879764
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study Slowly Annealed Langevin Dynamics (SALD), a sampler for tracking a path of moving target distributions and approximating the terminal target through time slowdown. We establish non-asymptotic convergence guarantees via a KL differential inequality, showing that slowdown improves tracking through contraction of intermediate targets and the complexity of the path. Motivated by training-free guided generation with pretrained score-based generative models, we further introduce Velocity-Aware SALD (VA-SALD), which explicitly incorporates the underlying marginal distributions of the pretrained model and uses slowdown to correct the additional deviation induced by guidance. This yields a principled framework for training-free guided generation for diffusion-based and related generative model families, together with convergence guarantees that clarify the roles of intermediate functional inequalities and guidance bias. Code is available at https://github.com/anitan0925/sald.
- Abstract(参考訳): Slowly Annealed Langevin Dynamics (SALD) は,移動対象分布の経路を追尾し,時間的減速による終端目標の近似を行うサンプルである。
我々は,KL差分不等式による非漸近収束保証を確立することにより,中間目標の縮小と経路の複雑さによる追従性の向上を示す。
事前学習したスコアベース生成モデルを用いた学習自由誘導モデルにより動機付けされたVelocity-Aware SALD(VA-SALD)をさらに導入する。
これにより、拡散に基づくおよび関連する生成モデルファミリーのための学習自由誘導生成の原則的枠組みと、中間機能的不等式と誘導バイアスの役割を明らかにする収束保証が得られる。
コードはhttps://github.com/anitan0925/sald.comで入手できる。
関連論文リスト
- Inference-Time Alignment for Diffusion Models via Doob's Matching [16.416975860645724]
拡散モデルの推論時間アライメントは,ベーススコアネットワークを再学習することなく,事前学習した拡散モデルを目標分布に適応することを目的としている。
本稿では,Doobの$h$-transformをベースとしたガイダンス推定フレームワークであるDoobのマッチングについて紹介する。
2-ワッサーシュタイン距離における生成分布の非漸近収束を保証する。
論文 参考訳(メタデータ) (2026-01-10T10:28:06Z) - TAG:Tangential Amplifying Guidance for Hallucination-Resistant Diffusion Sampling [53.61290359948953]
タンジェンシャル増幅誘導(TAG)は、下層の拡散モデルを変更することなく、軌道信号のみで動作する。
この誘導過程を1次テイラー展開を利用して定式化する。
TAGは、最小限の計算加算で拡散サンプリング忠実度を改善する、プラグアンドプレイのアーキテクチャに依存しないモジュールである。
論文 参考訳(メタデータ) (2025-10-06T06:53:29Z) - STARec: An Efficient Agent Framework for Recommender Systems via Autonomous Deliberate Reasoning [54.28691219536054]
我々は、自律的な熟考的推論機能を備えたレコメンデータシステムを支援する、ゆっくり考えられた拡張エージェントフレームワークSTARecを紹介する。
我々は,先進的推論モデルと嗜好整合型報酬形成から構造化知識の蒸留を組み合わせた2段階のパラダイムであるアンカー強化訓練を開発する。
MovieLens 1MとAmazon CDsベンチマークの実験では、STARecは最先端のベースラインと比較して、大幅なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-08-26T08:47:58Z) - RAAG: Ratio Aware Adaptive Guidance [9.525432706814675]
フローベースの生成モデルは驚くべき進歩を遂げた。
推論全体を通じて強力な、固定されたガイダンススケールを適用することは、現代的なアプリケーションに必要な、迅速な、数ステップのサンプリングには適していない。
本稿では,進化率に基づいて早期段階の指導尺度を自動的に減衰させる,シンプルな,理論的に基礎付けられた適応型指導スケジュールを提案する。
論文 参考訳(メタデータ) (2025-08-05T13:41:05Z) - Training-Free Stein Diffusion Guidance: Posterior Correction for Sampling Beyond High-Density Regions [46.59494117137471]
自由拡散誘導の訓練は、追加の訓練なしに既成の分類器を活用する柔軟な方法を提供する。
本稿では,SOC を対象とする新たなトレーニングフリーフレームワークである Stein Diffusion Guidance (SDG) を紹介する。
分子低密度サンプリングタスクの実験は、SDGが標準のトレーニングフリーガイダンス手法を一貫して上回っていることを示唆している。
論文 参考訳(メタデータ) (2025-07-07T21:14:27Z) - Prior-Guided Diffusion Planning for Offline Reinforcement Learning [5.819784482811376]
Prior Guidance(PG)は、行動閉ざされた拡散モデルに先立って標準ガウスを置き換えた新しいサンプリングフレームワークである。
我々は,潜時空間における行動規則化を適用した効率的なトレーニング戦略を提案し,PGが多種多種多種多種多種多種多様オフラインRLベンチマークにおいて最先端拡散ポリシーやプランナーより優れていることを実証的に示す。
論文 参考訳(メタデータ) (2025-05-16T05:39:02Z) - Diffusion Generative Flow Samplers: Improving learning signals through
partial trajectory optimization [87.21285093582446]
Diffusion Generative Flow Samplers (DGFS) はサンプルベースのフレームワークであり、学習プロセスを短い部分的軌道セグメントに分解することができる。
生成フローネットワーク(GFlowNets)のための理論から着想を得た。
論文 参考訳(メタデータ) (2023-10-04T09:39:05Z) - Training Generative Adversarial Networks by Solving Ordinary
Differential Equations [54.23691425062034]
GANトレーニングによって引き起こされる連続時間ダイナミクスについて検討する。
この観点から、GANのトレーニングにおける不安定性は積分誤差から生じると仮定する。
本研究では,有名なODEソルバ(Runge-Kutta など)がトレーニングを安定化できるかどうかを実験的に検証する。
論文 参考訳(メタデータ) (2020-10-28T15:23:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。