論文の概要: State and parameter learning with PaRIS particle Gibbs
- arxiv url: http://arxiv.org/abs/2301.00900v1
- Date: Mon, 2 Jan 2023 23:27:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 15:08:19.923774
- Title: State and parameter learning with PaRIS particle Gibbs
- Title(参考訳): PaRIS粒子ギブを用いた状態とパラメータ学習
- Authors: Gabriel Cardoso, Yazid Janati El Idrissi, Sylvain Le Corff, Eric
Moulines, Jimmy Olsson
- Abstract要約: 非線形状態空間モデルは統計機械学習においてユビキタスである。
PaRISはモンテカルロのシーケンシャルな手法であり、加算関数の期待値の効率的なオンライン近似を可能にする。
我々はパリの粒子Gibbs PPGサンプリングアルゴリズムを,条件付きSMC移動によって駆動されるPaRISアルゴリズムとして設計する。
- 参考スコア(独自算出の注目度): 11.290331898505594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Non-linear state-space models, also known as general hidden Markov models,
are ubiquitous in statistical machine learning, being the most classical
generative models for serial data and sequences in general. The particle-based,
rapid incremental smoother PaRIS is a sequential Monte Carlo (SMC) technique
allowing for efficient online approximation of expectations of additive
functionals under the smoothing distribution in these models. Such expectations
appear naturally in several learning contexts, such as likelihood estimation
(MLE) and Markov score climbing (MSC). PARIS has linear computational
complexity, limited memory requirements and comes with non-asymptotic bounds,
convergence results and stability guarantees. Still, being based on
self-normalised importance sampling, the PaRIS estimator is biased. Our first
contribution is to design a novel additive smoothing algorithm, the Parisian
particle Gibbs PPG sampler, which can be viewed as a PaRIS algorithm driven by
conditional SMC moves, resulting in bias-reduced estimates of the targeted
quantities. We substantiate the PPG algorithm with theoretical results,
including new bounds on bias and variance as well as deviation inequalities.
Our second contribution is to apply PPG in a learning framework, covering MLE
and MSC as special examples. In this context, we establish, under standard
assumptions, non-asymptotic bounds highlighting the value of bias reduction and
the implicit Rao--Blackwellization of PPG. These are the first non-asymptotic
results of this kind in this setting. We illustrate our theoretical results
with numerical experiments supporting our claims.
- Abstract(参考訳): 一般隠れマルコフモデルとしても知られる非線形状態空間モデルは、統計機械学習においてユビキタスであり、シリアルデータやシーケンスの最も古典的な生成モデルである。
素粒子ベースの高速増進スムーズなPaRISは連続モンテカルロ法(SMC)であり、これらのモデルにおける滑らかな分布の下で加法関数の期待を効率的にオンライン近似することができる。
このような期待は、確率推定(MLE)やマルコフスコアクライミング(MSC)など、いくつかの学習文脈で自然に現れる。
PARISは線形計算複雑性、メモリ要件の制限、非漸近境界、収束結果、安定性保証を備える。
それでも、自己正規化された重要度サンプリングに基づいて、PaRIS推定器は偏りがある。
我々の最初の貢献はパリの粒子ギブスPSGサンプリングアルゴリズムを設計することであり、これは条件付きSMCの動きによって駆動されるPaRISアルゴリズムと見なされる。
PPGアルゴリズムは, 偏差と分散の新たな境界や偏差の不等式を含む理論的な結果で検証する。
第2のコントリビューションは PPG を学習フレームワークに適用することであり,特に MLE と MSC を取り上げている。
この文脈では、標準的な仮定の下で、非漸近的境界はバイアス低減の値と PPG の暗黙的ラオ-ブラックウェル化の値を強調する。
これらはこの種の非漸近的な結果である。
我々は,我々の主張を裏付ける数値実験を行い,理論的な結果を示す。
関連論文リスト
- Polynomial Chaos Expanded Gaussian Process [2.287415292857564]
複雑で未知のプロセスでは、大域的モデルは最初実験空間全体にわたって生成される。
本研究では,グローバルな実験空間とローカルな実験空間の両方を効果的に表現するモデルの必要性に対処する。
論文 参考訳(メタデータ) (2024-05-02T07:11:05Z) - Online Variational Sequential Monte Carlo [49.97673761305336]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。
オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文 参考訳(メタデータ) (2023-12-19T21:45:38Z) - Model-Based Reparameterization Policy Gradient Methods: Theory and
Practical Algorithms [88.74308282658133]
Reization (RP) Policy Gradient Methods (PGM) は、ロボット工学やコンピュータグラフィックスにおける連続的な制御タスクに広く採用されている。
近年の研究では、長期強化学習問題に適用した場合、モデルベースRP PGMはカオス的かつ非滑らかな最適化環境を経験する可能性があることが示されている。
本稿では,長期モデルアンロールによる爆発的分散問題を緩和するスペクトル正規化法を提案する。
論文 参考訳(メタデータ) (2023-10-30T18:43:21Z) - Algebraic and Statistical Properties of the Ordinary Least Squares Interpolator [3.4320157633663064]
我々は最小$ell$-norm OLS補間器について結果を提供する。
ガウス・マルコフの定理の拡張のような統計的結果を示す。
我々はOLS補間器の特性をさらに探求するシミュレーションを行う。
論文 参考訳(メタデータ) (2023-09-27T16:41:10Z) - PAPAL: A Provable PArticle-based Primal-Dual ALgorithm for Mixed Nash Equilibrium [58.26573117273626]
2プレイヤゼロサム連続ゲームにおける非AL平衡非漸近目的関数について考察する。
連続分布戦略のための粒子ベースアルゴリズムに関する新しい知見を述べる。
論文 参考訳(メタデータ) (2023-03-02T05:08:15Z) - GEC: A Unified Framework for Interactive Decision Making in MDP, POMDP,
and Beyond [101.5329678997916]
対話型意思決定の一般的な枠組みの下で, サンプル高能率強化学習(RL)について検討した。
本稿では,探索とエクスプロイトの基本的なトレードオフを特徴付ける,新しい複雑性尺度である一般化エルダー係数(GEC)を提案する。
低 GEC の RL 問題は非常にリッチなクラスであり、これは低ベルマン楕円体次元問題、双線型クラス、低証人ランク問題、PO-双線型クラス、一般化正規PSR を仮定する。
論文 参考訳(メタデータ) (2022-11-03T16:42:40Z) - Learning Graphical Factor Models with Riemannian Optimization [70.13748170371889]
本稿では,低ランク構造制約下でのグラフ学習のためのフレキシブルなアルゴリズムフレームワークを提案する。
この問題は楕円分布のペナルティ化された最大推定値として表される。
楕円モデルによく適合する正定行列と定ランクの正半定行列のジオメトリを利用する。
論文 参考訳(メタデータ) (2022-10-21T13:19:45Z) - Optimal Estimation of Generic Dynamics by Path-Dependent Neural Jump ODEs [3.74142789780782]
本稿では,NJ-ODE(Neural Jump ODE)フレームワークの経路依存拡張を用いた一般プロセスの予測問題について検討する。
PD-NJ-ODEは古典的なフィルタリング問題や順序帳(LOB)データにうまく適用可能であることを示す。
論文 参考訳(メタデータ) (2022-06-28T20:50:14Z) - Optimal regularizations for data generation with probabilistic graphical
models [0.0]
経験的に、よく調和された正規化スキームは、推論されたモデルの品質を劇的に改善する。
生成的ペアワイドグラフィカルモデルの最大Aポストエリオーリ(MAP)推論におけるL2とL1の正規化について検討する。
論文 参考訳(メタデータ) (2021-12-02T14:45:16Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Hierarchical Gaussian Process Models for Regression Discontinuity/Kink
under Sharp and Fuzzy Designs [0.0]
回帰不連続/リンク(RD/RK)を用いた因果推論のための非パラメトリックベイズ推定器を提案する。
これらの推定器は、中間ベイズニューラルネットワーク層を持つ階層型GPモデルに拡張される。
モンテカルロシミュレーションにより、我々の推定器は、精度、カバレッジ、間隔長の点で競合する推定器よりもよく、しばしばよく機能することを示した。
論文 参考訳(メタデータ) (2021-10-03T04:23:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。