論文の概要: An Introduction to Hamiltonian Monte Carlo Method for Sampling
- arxiv url: http://arxiv.org/abs/2108.12107v1
- Date: Fri, 27 Aug 2021 03:28:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-30 14:20:02.013715
- Title: An Introduction to Hamiltonian Monte Carlo Method for Sampling
- Title(参考訳): サンプリングのためのハミルトンモンテカルロ法入門
- Authors: Nisheeth K. Vishnoi
- Abstract要約: Hamiltonian Monte Carlo (HMC) は、Gibs密度$pi(x)propto e-f(x)$からサンプリングするハミルトン力学に着想を得たアルゴリズムである。
理想化された HMC は$pi$ を保持し、$f$ が強く凸かつ滑らかなときにその収束を確立する。
- 参考スコア(独自算出の注目度): 26.555110725656963
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of this article is to introduce the Hamiltonian Monte Carlo (HMC)
method -- a Hamiltonian dynamics-inspired algorithm for sampling from a Gibbs
density $\pi(x) \propto e^{-f(x)}$. We focus on the "idealized" case, where one
can compute continuous trajectories exactly. We show that idealized HMC
preserves $\pi$ and we establish its convergence when $f$ is strongly convex
and smooth.
- Abstract(参考訳): 本稿の目的は、Gibs密度$\pi(x) \propto e^{-f(x)}$からサンプリングするハミルトン力学に着想を得たアルゴリズムであるハミルトン・モンテカルロ法(HMC)を導入することである。
連続的な軌跡を正確に計算できる"理想化"のケースに焦点を当てています。
理想化された HMC は$\pi$ を保ち、f$ が強く凸かつ滑らかであるときにその収束を確立する。
関連論文リスト
- Provable Benefit of Annealed Langevin Monte Carlo for Non-log-concave Sampling [28.931489333515618]
簡単なアニール型Langevin Monte Carloアルゴリズムに対して$widetildeOleft(fracdbeta2cal A2varepsilon6right)のオラクル複雑性を確立する。
例えば、$cal A$ は対象分布 $pi$ と容易にサンプリング可能な分布を補間する確率測度の曲線の作用を表す。
論文 参考訳(メタデータ) (2024-07-24T02:15:48Z) - von Mises Quasi-Processes for Bayesian Circular Regression [57.88921637944379]
円値ランダム関数上の表現的および解釈可能な分布の族を探索する。
結果の確率モデルは、統計物理学における連続スピンモデルと関係を持つ。
後続推論のために、高速マルコフ連鎖モンテカルロサンプリングに寄与するストラトノビッチのような拡張を導入する。
論文 参考訳(メタデータ) (2024-06-19T01:57:21Z) - Provable and Practical: Efficient Exploration in Reinforcement Learning via Langevin Monte Carlo [104.9535542833054]
我々は、強化学習のためのトンプソンサンプリングに基づくスケーラブルで効果的な探索戦略を提案する。
代わりに、Langevin Monte Carlo を用いて、Q 関数をその後部分布から直接サンプリングする。
提案手法は,Atari57スイートからのいくつかの挑戦的な探索課題において,最先端の深部RLアルゴリズムと比較して,より優れた,あるいは類似した結果が得られる。
論文 参考訳(メタデータ) (2023-05-29T17:11:28Z) - Hamiltonian Monte Carlo for efficient Gaussian sampling: long and random
steps [0.0]
Hamiltonian Monte Carlo (HMC) は密度$e-f(x)$の高次元分布からサンプリングするマルコフ連鎖アルゴリズムである。
HMCは,$widetildeO(sqrtkappa d1/4 log(1/varepsilon)$グラデーションクエリを用いて,全変動距離で$varepsilon$-closeの分布からサンプリングできることを示す。
論文 参考訳(メタデータ) (2022-09-26T15:29:29Z) - Langevin Monte Carlo for Contextual Bandits [72.00524614312002]
Langevin Monte Carlo Thompson Sampling (LMC-TS) が提案されている。
提案アルゴリズムは,文脈的帯域幅の特別な場合において,最高のトンプソンサンプリングアルゴリズムと同じサブ線形残差を達成できることを示す。
論文 参考訳(メタデータ) (2022-06-22T17:58:23Z) - Hamiltonian Monte Carlo Particle Swarm Optimizer [0.0]
Hamiltonian Particle Swarm (HMCPSO) は、指数平均サンプリングとHMC位置と速度の両方の利点を享受する最適化アルゴリズムである。
論文 参考訳(メタデータ) (2022-05-08T04:47:34Z) - A Proximal Algorithm for Sampling from Non-smooth Potentials [10.980294435643398]
非滑らかなポテンシャルからのサンプリングのための新しいMCMCアルゴリズムを提案する。
本手法は, 近似バンドル法と交互サンプリングフレームワークに基づく。
この研究の重要な貢献は、任意の凸非滑らかポテンシャルに対して制限されたガウスオラクルを実現する高速アルゴリズムである。
論文 参考訳(メタデータ) (2021-10-09T15:26:07Z) - Mean-Square Analysis with An Application to Optimal Dimension Dependence
of Langevin Monte Carlo [60.785586069299356]
この研究は、2-ワッサーシュタイン距離におけるサンプリング誤差の非同相解析のための一般的な枠組みを提供する。
我々の理論解析は数値実験によってさらに検証される。
論文 参考訳(メタデータ) (2021-09-08T18:00:05Z) - Truncated Log-concave Sampling with Reflective Hamiltonian Monte Carlo [0.0]
HMCベースのアルゴリズムであるReflective Hamiltonian Monte Carlo(ReHMC)を,凸ポリトープに制限されたログ凹分布からサンプリングする。
暖かいスタートから始まり、よく周されたポリトープのステップを$widetilde O(kappa d2 ell2 log (1 / varepsilon))$で混ぜることを証明する。
実験により、ReHMCは独立したサンプルを作成する必要がある時間に関して、Hit-and-RunとCoordinate-and-Runより優れていることが示唆された。
論文 参考訳(メタデータ) (2021-02-25T18:34:45Z) - Sampling in Combinatorial Spaces with SurVAE Flow Augmented MCMC [83.48593305367523]
ハイブリッドモンテカルロ(Hybrid Monte Carlo)は、複素連続分布からサンプリングする強力なマルコフ連鎖モンテカルロ法である。
本稿では,SurVAEフローを用いたモンテカルロ法の拡張に基づく新しい手法を提案する。
本稿では,統計学,計算物理学,機械学習など,様々な分野におけるアルゴリズムの有効性を実証し,代替アルゴリズムと比較した改良点を考察する。
論文 参考訳(メタデータ) (2021-02-04T02:21:08Z) - Sample Complexity of Asynchronous Q-Learning: Sharper Analysis and
Variance Reduction [63.41789556777387]
非同期Q-ラーニングはマルコフ決定過程(MDP)の最適行動値関数(またはQ-関数)を学習することを目的としている。
Q-関数の入出力$varepsilon$-正確な推定に必要なサンプルの数は、少なくとも$frac1mu_min (1-gamma)5varepsilon2+ fract_mixmu_min (1-gamma)$の順である。
論文 参考訳(メタデータ) (2020-06-04T17:51:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。