論文の概要: Explicit Mean-Square Error Bounds for Monte-Carlo and Linear Stochastic
Approximation
- arxiv url: http://arxiv.org/abs/2002.02584v1
- Date: Fri, 7 Feb 2020 01:52:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 04:44:22.597562
- Title: Explicit Mean-Square Error Bounds for Monte-Carlo and Linear Stochastic
Approximation
- Title(参考訳): モンテカルロおよび線形確率近似のための平均二乗誤差境界
- Authors: Shuhang Chen, Adithya M. Devraj, Ana Bu\v{s}i\'c, Sean Meyn
- Abstract要約: 基礎となるマルコフ連鎖が可逆で幾何学的にエルゴードである場合でも、誤差列に有界なホーフディングを得ることはできない。
平均二乗誤差は、ステップサイズシーケンスの条件の下で、$O(1/n)$の最適率を達成する。
- 参考スコア(独自算出の注目度): 4.817429789586127
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper concerns error bounds for recursive equations subject to Markovian
disturbances. Motivating examples abound within the fields of Markov chain
Monte Carlo (MCMC) and Reinforcement Learning (RL), and many of these
algorithms can be interpreted as special cases of stochastic approximation
(SA). It is argued that it is not possible in general to obtain a Hoeffding
bound on the error sequence, even when the underlying Markov chain is
reversible and geometrically ergodic, such as the M/M/1 queue. This is
motivation for the focus on mean square error bounds for parameter estimates.
It is shown that mean square error achieves the optimal rate of $O(1/n)$,
subject to conditions on the step-size sequence. Moreover, the exact constants
in the rate are obtained, which is of great value in algorithm design.
- Abstract(参考訳): 本稿ではマルコフ乱を受ける再帰方程式の誤差境界について述べる。
マルコフ連鎖モンテカルロ (mcmc) と強化学習 (rl) の分野におけるモチベーションの例が多く、これらのアルゴリズムの多くは確率近似 (sa) の特別な場合として解釈できる。
基本となるマルコフ連鎖が可逆であり、m/m/1 キューのような幾何学的にエルゴードである場合でも、一般にエラーシーケンスにホッフディングバウンドを得ることは不可能である。
これはパラメータ推定の平均二乗誤差境界にフォーカスする動機である。
平均二乗誤差はステップサイズ列の条件に従えば,$o(1/n)$の最適値が得られることを示した。
さらに、そのレートの正確な定数が得られ、アルゴリズム設計において大きな価値がある。
関連論文リスト
- Maximum a Posteriori Inference for Factor Graphs via Benders' Decomposition [0.38233569758620056]
一般ベイズ因子モデルにおける最大a-ポストペリオーリ推定法を提案する。
ベイジアン・ガウス混合モデルと潜在ディリクレ割り当てに対するMAP推定アルゴリズムを導出する。
論文 参考訳(メタデータ) (2024-10-24T19:57:56Z) - Randomized Physics-Informed Machine Learning for Uncertainty
Quantification in High-Dimensional Inverse Problems [49.1574468325115]
本研究では,高次元逆問題における不確実性定量化のための物理インフォームド機械学習手法を提案する。
我々は解析的に、そして、ハミルトン・モンテカルロとの比較を通して、rPICKLE はベイズ則によって与えられる真の後続に収束することを示す。
論文 参考訳(メタデータ) (2023-12-11T07:33:16Z) - Interfacing branching random walks with Metropolis sampling: constraint
release in auxiliary-field quantum Monte Carlo [8.618234453116251]
マルコフ連鎖モンテカルロサンプリングを用いた分岐ランダムウォークのインタフェースを提案する。
一般化されたメトロポリスアルゴリズムを用いて、分岐ランダムウォークによって生成された想像時間経路の選択部分をサンプリングする。
論文 参考訳(メタデータ) (2023-05-16T16:12:56Z) - Optimal variance-reduced stochastic approximation in Banach spaces [114.8734960258221]
可分バナッハ空間上で定義された収縮作用素の定点を推定する問題について検討する。
演算子欠陥と推定誤差の両方に対して漸近的でない境界を確立する。
論文 参考訳(メタデータ) (2022-01-21T02:46:57Z) - Asymptotic bias of inexact Markov Chain Monte Carlo methods in high
dimension [0.7614628596146599]
例えば、未調整ランゲヴィン (ULA) や非調整ハミルトンモンテカルロ (uHMC) がある。
ULA と uHMC の双方に対して、このバイアスは、目標分布またはスキームの定常確率測定に関連する鍵量に依存することを示す。
論文 参考訳(メタデータ) (2021-08-02T07:34:09Z) - Spectral clustering under degree heterogeneity: a case for the random
walk Laplacian [83.79286663107845]
本稿では,ランダムウォークラプラシアンを用いたグラフスペクトル埋め込みが,ノード次数に対して完全に補正されたベクトル表現を生成することを示す。
次数補正ブロックモデルの特別な場合、埋め込みはK個の異なる点に集中し、コミュニティを表す。
論文 参考訳(メタデータ) (2021-05-03T16:36:27Z) - Benign Overfitting of Constant-Stepsize SGD for Linear Regression [122.70478935214128]
帰納バイアスは 経験的に過剰フィットを防げる中心的存在です
この研究は、この問題を最も基本的な設定として考慮している: 線形回帰に対する定数ステップサイズ SGD。
我々は、(正規化されていない)SGDで得られるアルゴリズム正則化と、通常の最小二乗よりも多くの顕著な違いを反映する。
論文 参考訳(メタデータ) (2021-03-23T17:15:53Z) - Parallel Stochastic Mirror Descent for MDPs [72.75921150912556]
無限水平マルコフ決定過程(MDP)における最適政策学習の問題を考える。
リプシッツ連続関数を用いた凸プログラミング問題に対してミラー・ディクセントの変種が提案されている。
このアルゴリズムを一般の場合において解析し,提案手法の動作中に誤差を蓄積しない収束率の推定値を得る。
論文 参考訳(メタデータ) (2021-02-27T19:28:39Z) - Amortized Conditional Normalized Maximum Likelihood: Reliable Out of
Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。
提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。
我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文 参考訳(メタデータ) (2020-11-05T08:04:34Z) - Stochastic Learning for Sparse Discrete Markov Random Fields with
Controlled Gradient Approximation Error [10.381976180143328]
離散マルコフ確率場(MRF)に対する$L_$正規化極大推定器(MLE)問題について検討する。
これらの課題に対処するために、近位勾配(SPG)と呼ばれる検証可能な学習フレームワークを検討する。
勾配近似の品質を検査し、制御するための新しい検証可能な境界を提供する。
論文 参考訳(メタデータ) (2020-05-12T22:48:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。