論文の概要: Langevin Monte Carlo Beyond Lipschitz Gradient Continuity
- arxiv url: http://arxiv.org/abs/2412.09698v1
- Date: Thu, 12 Dec 2024 19:25:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-16 15:04:07.207011
- Title: Langevin Monte Carlo Beyond Lipschitz Gradient Continuity
- Title(参考訳): ランゲヴィン・モンテ・カルロ氏:リプシッツの緩やかな継続性
- Authors: Matej Benko, Iwona Chlebicka, Jørgen Endal, Błażej Miasojedow,
- Abstract要約: Inexact Proximal Langevin Algorithm (IPLA) を導入する。
IPLAは、制御された計算コストを維持しながら、LCCが効果的に対処できる問題の範囲を広げる。
我々は、IPLAの超二次ポテンシャルへの適用性を拡張し、既存のアルゴリズムに対する収束率を改善した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: We present a significant advancement in the field of Langevin Monte Carlo (LMC) methods by introducing the Inexact Proximal Langevin Algorithm (IPLA). This novel algorithm broadens the scope of problems that LMC can effectively address while maintaining controlled computational costs. IPLA extends LMC's applicability to potentials that are convex, strongly convex in the tails, and exhibit polynomial growth, beyond the conventional $L$-smoothness assumption. Moreover, we extend LMC's applicability to super-quadratic potentials and offer improved convergence rates over existing algorithms. Additionally, we provide bounds on all moments of the Markov chain generated by IPLA, enhancing its analytical robustness.
- Abstract(参考訳): Inexact Proximal Langevin Algorithm (IPLA)を導入することで,Langevin Monte Carlo法(LMC)の分野で大きな進歩を示す。
このアルゴリズムは、制御された計算コストを維持しながら、LCCが効果的に対処できる問題の範囲を広げる。
IPLA は LMC の適用性を、従来の$L$-smoothness の仮定を超えて、凸であり、尾部の強い凸であり、多項式成長を示すポテンシャルに拡張する。
さらに, LMCの超二次ポテンシャルへの適用性を拡張し, 既存のアルゴリズムに対する収束率を向上させる。
さらに、IPLAによって生成されるマルコフ連鎖のすべてのモーメントに境界を与え、解析的ロバスト性を高める。
関連論文リスト
- Provably Efficient RL under Episode-Wise Safety in Constrained MDPs with Linear Function Approximation [24.299769025346368]
制約決定過程(CMDP)における強化学習問題について検討する。
本稿では,リニアCMDPに対するRLアルゴリズムを提案する。
その結果,近年の線形CMDPアルゴリズムでは,制約に違反するか,指数計算コストに悪影響を及ぼす結果が得られた。
論文 参考訳(メタデータ) (2025-02-14T13:07:25Z) - Estimating Multi-chirp Parameters using Curvature-guided Langevin Monte Carlo [7.832209959041259]
本稿では, チャープの雑音混合によるパラメータの問題について考察する。
目的関数の平均曲率を利用する改良型Langevin Monte Carlo (LMC) サンプリング器を提案する。
論文 参考訳(メタデータ) (2025-01-30T07:15:38Z) - Mixing Times and Privacy Analysis for the Projected Langevin Algorithm under a Modulus of Continuity [7.318997639507269]
我々は、予測ランゲヴィンアルゴリズム(LA)の混合時間とノイズグラディエントDescent(SGD)のプライバシー曲線について検討する。
具体的には、射影LAに対する新しい混合時間境界を導出するが、これはいくつかの重要な場合において、次元自由かつ多対数的である。
サブサンプルノイズSGDアルゴリズムのプライバシー曲線の上限を新たに設定する。
論文 参考訳(メタデータ) (2025-01-07T20:46:59Z) - Directed Exploration in Reinforcement Learning from Linear Temporal Logic [59.707408697394534]
リニア時間論理(LTL)は強化学習におけるタスク仕様のための強力な言語である。
合成された報酬信号は基本的に疎結合であり,探索が困難であることを示す。
我々は、仕様をさらに活用し、それに対応するリミット決定性B"uchi Automaton(LDBA)をマルコフ報酬プロセスとしてキャストすることで、よりよい探索を実現することができることを示す。
論文 参考訳(メタデータ) (2024-08-18T14:25:44Z) - Value-Biased Maximum Likelihood Estimation for Model-based Reinforcement
Learning in Discounted Linear MDPs [16.006893624836554]
本稿では,VBMLE (Value-Biased Maximum Likelihood Estimation) のレンズによる線形MDPの解法を提案する。
VBMLEは、各時間ステップで1つの最適化問題だけを解決する必要があるため、計算的により効率的である。
後悔する解析では、線形MDPにおけるMLEの一般収束結果が、新しいスーパーマーチンゲール構造を通して提供される。
論文 参考訳(メタデータ) (2023-10-17T18:27:27Z) - Convergence of mean-field Langevin dynamics: Time and space
discretization, stochastic gradient, and variance reduction [49.66486092259376]
平均場ランゲヴィンダイナミクス(英: mean-field Langevin dynamics、MFLD)は、分布依存のドリフトを含むランゲヴィン力学の非線形一般化である。
近年の研究では、MFLDは測度空間で機能するエントロピー規則化された凸関数を地球規模で最小化することが示されている。
有限粒子近似,時間分散,勾配近似による誤差を考慮し,MFLDのカオスの均一時間伝播を示す枠組みを提供する。
論文 参考訳(メタデータ) (2023-06-12T16:28:11Z) - Learning to Optimize with Stochastic Dominance Constraints [103.26714928625582]
本稿では,不確実量を比較する問題に対して,単純かつ効率的なアプローチを開発する。
我々はラグランジアンの内部最適化をサロゲート近似の学習問題として再考した。
提案したライト-SDは、ファイナンスからサプライチェーン管理に至るまで、いくつかの代表的な問題において優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-14T21:54:31Z) - Lower Bounds on Metropolized Sampling Methods for Well-Conditioned
Distributions [29.314919044203926]
我々は、実際に最もポピュラーなサンプリング手法であるランゲヴィンアルゴリズム(MALA)とマルチステップのハミルトンモンテカルロ(HMC)の2つの性能に低い限界を与える。
我々の主な結果は、指数的に暖かい開始からMALAの混合時間における$widetildeOmega(kappa d)$のほぼ28の低い境界である。
論文 参考訳(メタデータ) (2021-06-10T03:47:39Z) - A Dynamical Systems Approach for Convergence of the Bayesian EM
Algorithm [59.99439951055238]
我々は、(離散時間)リアプノフ安定性理論が、必ずしも勾配ベースではない最適化アルゴリズムの分析(および潜在的な設計)において、いかに強力なツールとして役立つかを示す。
本稿では,不完全データベイズフレームワークにおけるパラメータ推定を,MAP-EM (maximum a reari expectation-maximization) と呼ばれる一般的な最適化アルゴリズムを用いて行うことに着目したML問題について述べる。
高速収束(線形あるいは二次的)が達成され,S&Cアプローチを使わずに発表することが困難であった可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-23T01:34:18Z) - Kernel-Based Reinforcement Learning: A Finite-Time Analysis [53.47210316424326]
モデルに基づく楽観的アルゴリズムであるKernel-UCBVIを導入する。
スパース報酬を伴う連続MDPにおける我々のアプローチを実証的に検証する。
論文 参考訳(メタデータ) (2020-04-12T12:23:46Z) - Upper Confidence Primal-Dual Reinforcement Learning for CMDP with
Adversarial Loss [145.54544979467872]
マルコフ決定過程(CMDP)に対するオンライン学習の検討
本稿では,遷移モデルから標本化した軌跡のみを必要とする,新しいEmphupper confidence primal-dualアルゴリズムを提案する。
我々の分析では、ラグランジュ乗算過程の新たな高確率ドリフト解析を、高信頼強化学習の記念後悔解析に組み入れている。
論文 参考訳(メタデータ) (2020-03-02T05:02:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。