論文の概要: Batch Stationary Distribution Estimation
- arxiv url: http://arxiv.org/abs/2003.00722v1
- Date: Mon, 2 Mar 2020 09:10:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 03:54:57.315601
- Title: Batch Stationary Distribution Estimation
- Title(参考訳): バッチ定常分布推定
- Authors: Junfeng Wen, Bo Dai, Lihong Li, Dale Schuurmans
- Abstract要約: サンプル遷移の組を与えられたエルゴードマルコフ鎖の定常分布を近似する問題を考える。
与えられたデータに対する補正比関数の復元に基づく一貫した推定器を提案する。
- 参考スコア(独自算出の注目度): 98.18201132095066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of approximating the stationary distribution of an
ergodic Markov chain given a set of sampled transitions. Classical
simulation-based approaches assume access to the underlying process so that
trajectories of sufficient length can be gathered to approximate stationary
sampling. Instead, we consider an alternative setting where a fixed set of
transitions has been collected beforehand, by a separate, possibly unknown
procedure. The goal is still to estimate properties of the stationary
distribution, but without additional access to the underlying system. We
propose a consistent estimator that is based on recovering a correction ratio
function over the given data. In particular, we develop a variational power
method (VPM) that provides provably consistent estimates under general
conditions. In addition to unifying a number of existing approaches from
different subfields, we also find that VPM yields significantly better
estimates across a range of problems, including queueing, stochastic
differential equations, post-processing MCMC, and off-policy evaluation.
- Abstract(参考訳): サンプル化された遷移の集合が与えられたエルゴードマルコフ鎖の定常分布を近似する問題を考える。
古典的なシミュレーションに基づくアプローチは、十分な長さの軌道が定常サンプリングに近似するように、基礎となるプロセスへのアクセスを前提としている。
代わりに、固定されたトランジションセットが事前に収集された代替設定を、別々に、おそらく未知の手順で検討する。
目標はまだ定常分布の性質を推定することであるが、基礎となるシステムへの追加アクセスは行わない。
与えられたデータに対する補正比関数の復元に基づく一貫した推定器を提案する。
特に,一般条件下での確率的一貫した推定を行う変分電力法(VPM)を開発した。
異なるサブフィールドからの既存アプローチを統一することに加え、VPMは待ち行列、確率微分方程式、後処理MCMC、政治外評価など、様々な問題において、はるかに優れた推定値が得られることも見出した。
関連論文リスト
- DistPred: A Distribution-Free Probabilistic Inference Method for Regression and Forecasting [14.390842560217743]
本稿では、回帰予測タスクのためのDistPredという新しい手法を提案する。
予測分布と対象分布の差分を測定するための適切なスコアリングルールを、微分可能な離散形式に変換する。
これにより、モデルは単一のフォワードパスで多数のサンプルをサンプリングし、応答変数の潜在的分布を推定することができる。
論文 参考訳(メタデータ) (2024-06-17T10:33:00Z) - Positive definite nonparametric regression using an evolutionary
algorithm with application to covariance function estimation [0.0]
定常過程の共分散関数を推定するための新しい非パラメトリック回帰フレームワークを提案する。
提案手法は, 正定性, 等方性, 単調性を推定者に課すことができる。
提案手法は,長距離依存に対する信頼性の高い推定値を提供する。
論文 参考訳(メタデータ) (2023-04-25T22:01:14Z) - A Tale of Sampling and Estimation in Discounted Reinforcement Learning [50.43256303670011]
割引平均推定問題に対して最小値の最小値を求める。
マルコフ過程の割引されたカーネルから直接サンプリングすることで平均を推定すると、説得力のある統計的性質が得られることを示す。
論文 参考訳(メタデータ) (2023-04-11T09:13:17Z) - Bayesian Hierarchical Models for Counterfactual Estimation [12.159830463756341]
本稿では,多種多様なカウンターファクトの集合を推定する確率的パラダイムを提案する。
摂動を事前分布関数によるランダム変数として扱う。
収束特性の優れた勾配ベースサンプリング器は、後方サンプルを効率的に計算する。
論文 参考訳(メタデータ) (2023-01-21T00:21:11Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Variational Refinement for Importance Sampling Using the Forward
Kullback-Leibler Divergence [77.06203118175335]
変分推論(VI)はベイズ推論における正確なサンプリングの代替として人気がある。
重要度サンプリング(IS)は、ベイズ近似推論手順の推定を微調整し、偏りを逸脱するためにしばしば用いられる。
近似ベイズ推論のための最適化手法とサンプリング手法の新たな組み合わせを提案する。
論文 参考訳(メタデータ) (2021-06-30T11:00:24Z) - Universal Off-Policy Evaluation [64.02853483874334]
ユニバーサルオフ政治推定器(UnO)への第一歩を踏み出す
我々は, 平均, 分散, 分位数/中間数, 分位数範囲, cvar, および累積分布全体の推定と同時結合に uno を用いる。
論文 参考訳(メタデータ) (2021-04-26T18:54:31Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。