論文の概要: Logsmooth Gradient Concentration and Tighter Runtimes for Metropolized
Hamiltonian Monte Carlo
- arxiv url: http://arxiv.org/abs/2002.04121v3
- Date: Sun, 14 Jun 2020 02:12:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 08:49:15.475721
- Title: Logsmooth Gradient Concentration and Tighter Runtimes for Metropolized
Hamiltonian Monte Carlo
- Title(参考訳): メトポライズされたハミルトンモンテカルロの対流勾配濃度とタイターランタイム
- Authors: Yin Tat Lee, Ruoqi Shen, Kevin Tian
- Abstract要約: これは1次関数情報のみを用いたログコンケーブ分布に対する最初の高精度混合時間結果である。
我々は、$kappa$への依存が標準のMetropolized firstorderメソッドであることを示す。
- 参考スコア(独自算出の注目度): 23.781520510778716
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We show that the gradient norm $\|\nabla f(x)\|$ for $x \sim \exp(-f(x))$,
where $f$ is strongly convex and smooth, concentrates tightly around its mean.
This removes a barrier in the prior state-of-the-art analysis for the
well-studied Metropolized Hamiltonian Monte Carlo (HMC) algorithm for sampling
from a strongly logconcave distribution. We correspondingly demonstrate that
Metropolized HMC mixes in $\tilde{O}(\kappa d)$ iterations, improving upon the
$\tilde{O}(\kappa^{1.5}\sqrt{d} + \kappa d)$ runtime of (Dwivedi et. al. '18,
Chen et. al. '19) by a factor $(\kappa/d)^{1/2}$ when the condition number
$\kappa$ is large. Our mixing time analysis introduces several techniques which
to our knowledge have not appeared in the literature and may be of independent
interest, including restrictions to a nonconvex set with good conductance
behavior, and a new reduction technique for boosting a constant-accuracy total
variation guarantee under weak warmness assumptions. This is the first
high-accuracy mixing time result for logconcave distributions using only
first-order function information which achieves linear dependence on $\kappa$;
we also give evidence that this dependence is likely to be necessary for
standard Metropolized first-order methods.
- Abstract(参考訳): 勾配ノルム $\|\nabla f(x)\|$ for $x \sim \exp(-f(x))$ ここで、$f$ は強凸かつ滑らかであり、その平均付近で密集する。
条件数 $\kappa$ が大きければ$(\kappa/d)^{1/2}$ という係数で (dwivedi et. al. '18, chen et. al. '19) の$\tilde{o}(\kappa d)$ のランタイムを改善して、metropolized hmc が$\tilde{o}(\kappa d)$ で混合することを示す。
これは、$\kappa$に線形依存する1次関数情報のみを用いて、ログ凹分布に対する最初の高精度混合時間結果であり、標準のMetropolized 1次法には、この依存が必須であることを示す。
- Regularized Dikin Walks for Sampling Truncated Logconcave Measures, Mixed Isoperimetry and Beyond Worst-Case Analysis [3.399289369740637]
論文 参考訳(メタデータ) (2024-12-15T20:43:51Z) - Convergence Rate Analysis of LION [54.28350823319057]
LION は、勾配カルシュ=クーン=T (sqrtdK-)$で測定された $cal(sqrtdK-)$ の反復を収束する。
論文 参考訳(メタデータ) (2024-11-12T11:30:53Z) - Provable Benefit of Annealed Langevin Monte Carlo for Non-log-concave Sampling [28.931489333515618]
簡単なアンニール型Langevin Monte Carloアルゴリズムに対して$widetildeOleft(fracdbeta2cal A2varepsilon6right)のオラクル複雑性を確立する。
例えば、$cal A$ は対象分布 $pi$ と容易にサンプリング可能な分布を補間する確率測度の曲線の作用を表す。
論文 参考訳(メタデータ) (2024-07-24T02:15:48Z) - On the $O(\frac{\sqrt{d}}{T^{1/4}})$ Convergence Rate of RMSProp and Its Momentum Extension Measured by $\ell_1$ Norm [59.65871549878937]
論文 参考訳(メタデータ) (2024-02-01T07:21:32Z) - When does Metropolized Hamiltonian Monte Carlo provably outperform
Metropolis-adjusted Langevin algorithm? [4.657614491309671]
本研究では, 磁化ハミルトン・モンテカルロ (HMC) と跳躍フロッグ積分器の混合時間について解析した。
連続HMC力学の離散化における位置と速度変数の結合分布は, ほぼ不変であることを示す。
論文 参考訳(メタデータ) (2023-04-10T17:35:57Z) - Hamiltonian Monte Carlo for efficient Gaussian sampling: long and random
steps [0.0]
Hamiltonian Monte Carlo (HMC) は密度$e-f(x)$の高次元分布からサンプリングするマルコフ連鎖アルゴリズムである。
HMCは,$widetildeO(sqrtkappa d1/4 log(1/varepsilon)$グラデーションクエリを用いて,全変動距離で$varepsilon$-closeの分布からサンプリングできることを示す。
論文 参考訳(メタデータ) (2022-09-26T15:29:29Z) - Mean-Square Analysis with An Application to Optimal Dimension Dependence
of Langevin Monte Carlo [60.785586069299356]
論文 参考訳(メタデータ) (2021-09-08T18:00:05Z) - A New Framework for Variance-Reduced Hamiltonian Monte Carlo [88.84622104944503]
分散還元型ハミルトン・モンテカルロ法 (HMC) の新たなフレームワークを提案し,$L$-smooth および $m$-strongly log-concave 分布からサンプリングする。
論文 参考訳(メタデータ) (2021-02-09T02:44:24Z) - Convergence of Langevin Monte Carlo in Chi-Squared and Renyi Divergence [8.873449722727026]
論文 参考訳(メタデータ) (2020-07-22T18:18:28Z) - Sample Complexity of Asynchronous Q-Learning: Sharper Analysis and
Variance Reduction [63.41789556777387]
Q-関数の入出力$varepsilon$-正確な推定に必要なサンプルの数は、少なくとも$frac1mu_min (1-gamma)5varepsilon2+ fract_mixmu_min (1-gamma)$の順である。
論文 参考訳(メタデータ) (2020-06-04T17:51:00Z) - Curse of Dimensionality on Randomized Smoothing for Certifiable
Robustness [151.67113334248464]
論文 参考訳(メタデータ) (2020-02-08T22:02:14Z)