論文の概要: Policy Gradients for Optimal Parallel Tempering MCMC
- arxiv url: http://arxiv.org/abs/2409.01574v1
- Date: Tue, 3 Sep 2024 03:12:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 03:06:29.151584
- Title: Policy Gradients for Optimal Parallel Tempering MCMC
- Title(参考訳): 最適並列テンパリングMCMCの政策勾配
- Authors: Daniel Zhao, Natesh S. Pillai,
- Abstract要約: 並列テンパリング(英: Parallel tempering)は、マルコフ・チェイン・モンテカルロ(Markov Chain Monte Carlo)のメタアルゴリズムである。
本稿では,政策勾配法を用いてサンプリング中の温度を動的に調整する適応温度選択アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 0.276240219662896
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Parallel tempering is meta-algorithm for Markov Chain Monte Carlo that uses multiple chains to sample from tempered versions of the target distribution, enhancing mixing in multi-modal distributions that are challenging for traditional methods. The effectiveness of parallel tempering is heavily influenced by the selection of chain temperatures. Here, we present an adaptive temperature selection algorithm that dynamically adjusts temperatures during sampling using a policy gradient approach. Experiments demonstrate that our method can achieve lower integrated autocorrelation times compared to traditional geometrically spaced temperatures and uniform acceptance rate schemes on benchmark distributions.
- Abstract(参考訳): 並列のテンパリングは、マルコフ・チェイン・モンテカルロ(英語版)のメタアルゴリズムであり、ターゲット分布のテンパリングされたバージョンから複数の連鎖をサンプリングし、従来の方法では難しいマルチモーダル分布の混合を強化する。
並列加熱の有効性は,チェーン温度の選択によって大きく影響される。
本稿では,政策勾配法を用いてサンプリング中の温度を動的に調整する適応温度選択アルゴリズムを提案する。
実験により,従来の幾何学的空間温度とベンチマーク分布の均一な受容率スキームと比較して,統合的自己相関時間(自己相関時間)が低いことを示す。
関連論文リスト
- Optimization of Discrete Parameters Using the Adaptive Gradient Method
and Directed Evolution [49.1574468325115]
最適解の探索は、個人の集団によって行われる。
適応していない個体は死に、最適な個体は交配し、結果として進化力学が導かれた。
論文 参考訳(メタデータ) (2024-01-12T15:45:56Z) - A connection between Tempering and Entropic Mirror Descent [8.775514582692795]
テンパリングSMCは,逆Kulback-Leibler分散に適用されるエントロピーミラー降下に対応することが確認された。
文献における他のベンチマークよりも優れた適応的テンパリングルールを導出する。
論文 参考訳(メタデータ) (2023-10-18T12:06:47Z) - Adaptive Annealed Importance Sampling with Constant Rate Progress [68.8204255655161]
Annealed Importance Smpling (AIS)は、抽出可能な分布から重み付けされたサンプルを合成する。
本稿では,alpha$-divergencesに対する定数レートAISアルゴリズムとその効率的な実装を提案する。
論文 参考訳(メタデータ) (2023-06-27T08:15:28Z) - Differentiating Metropolis-Hastings to Optimize Intractable Densities [51.16801956665228]
我々はメトロポリス・ハスティングス検層の自動識別アルゴリズムを開発した。
難解な対象密度に対する期待値として表現された目的に対して勾配に基づく最適化を適用する。
論文 参考訳(メタデータ) (2023-06-13T17:56:02Z) - Sampling with Mollified Interaction Energy Descent [57.00583139477843]
モーフィファイド相互作用エネルギー降下(MIED)と呼ばれる新しい最適化に基づくサンプリング手法を提案する。
MIEDは、モル化相互作用エネルギー(MIE)と呼ばれる確率測度に関する新しいクラスのエネルギーを最小化する
我々は,制約のないサンプリング問題に対して,我々のアルゴリズムがSVGDのような既存の粒子ベースアルゴリズムと同等に動作することを示す。
論文 参考訳(メタデータ) (2022-10-24T16:54:18Z) - AdaAnn: Adaptive Annealing Scheduler for Probability Density
Approximation [3.1370892256881255]
アニーリングは、高幾何学的複雑性の領域における確率分布の近似を容易にするために用いられる。
適応型スケジューラであるAdaAnnを導入し,Kulback-Leibler分散の予測変化に基づいて温度インクリメントを自動的に調整する。
AdaAnnは実装が容易で、変分推論のためのフローの正規化やマルコフ連鎖モンテカルロのような既存のサンプリングアプローチに統合することができる。
論文 参考訳(メタデータ) (2022-02-01T22:26:18Z) - Renormalization group for open quantum systems using environment
temperature as flow parameter [0.0]
本稿では,オープン量子系の密度-演算的進化のためにメモリカーネルを演算する$T$-flow再正規化グループ法を提案する。
我々は、結合の順序以上の電圧に対して、リアルタイムに容易にアクセス可能な定常限界をベンチマークする。
局所観測と非局所観測の両方の短時間のダイナミクスは、普遍的な温度非依存性の挙動に従うことを解析的に示す。
論文 参考訳(メタデータ) (2021-11-14T11:52:27Z) - Sampling from high-dimensional, multimodal distributions using automatically tuned, tempered Hamiltonian Monte Carlo [0.0]
ハミルトニアン・モンテカルロ (HMC) は確率密度が比例的に知られている高次元対象分布のサンプリングに広く用いられている。
伝統的テンパリング法は、特に高次元においてチューニングが困難である。
本研究では,高次元の強いマルチモーダル分布からの効率的なサンプリングを可能にするため,テンパリング戦略をハミルトンモンテカルロと組み合わせる手法を提案する。
論文 参考訳(メタデータ) (2021-11-12T18:48:36Z) - Sampling in Combinatorial Spaces with SurVAE Flow Augmented MCMC [83.48593305367523]
ハイブリッドモンテカルロ(Hybrid Monte Carlo)は、複素連続分布からサンプリングする強力なマルコフ連鎖モンテカルロ法である。
本稿では,SurVAEフローを用いたモンテカルロ法の拡張に基づく新しい手法を提案する。
本稿では,統計学,計算物理学,機械学習など,様々な分野におけるアルゴリズムの有効性を実証し,代替アルゴリズムと比較した改良点を考察する。
論文 参考訳(メタデータ) (2021-02-04T02:21:08Z) - Adaptive Correlated Monte Carlo for Contextual Categorical Sequence
Generation [77.7420231319632]
我々は,モンテカルロ (MC) ロールアウトの集合を分散制御のために評価する政策勾配推定器に,カテゴリー列の文脈的生成を適用する。
また,二分木ソフトマックスモデルに相関したMCロールアウトを用いることで,大語彙シナリオにおける高生成コストを低減できることを示す。
論文 参考訳(メタデータ) (2019-12-31T03:01:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。