論文の概要: Maximum likelihood smoothing estimation in state-space models: An
incomplete-information based approach
- arxiv url: http://arxiv.org/abs/2303.16364v1
- Date: Wed, 29 Mar 2023 00:08:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-30 16:34:57.909293
- Title: Maximum likelihood smoothing estimation in state-space models: An
incomplete-information based approach
- Title(参考訳): 状態空間モデルにおける最大確率滑らか化推定:不完全情報に基づくアプローチ
- Authors: Budhi Arta Surya
- Abstract要約: 状態空間システムの不完全な情報/データから推定する新しい手法を開発した。
逐次モンテカルロ法によるスコア関数と観測情報行列の評価法を開発した。
線形系の場合、Ruch-Tung-Striebel (RTS) のスムース化は、完全に効率的なスムースな状態推定器であることが示される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper revisits classical works of Rauch (1963, et al. 1965) and develops
a novel method for maximum likelihood (ML) smoothing estimation from incomplete
information/data of stochastic state-space systems. Score function and
conditional observed information matrices of incomplete data are introduced and
their distributional identities are established. Using these identities, the ML
smoother $\widehat{x}_{k\vert n}^s =\argmax_{x_k} \log
f(x_k,\widehat{x}_{k+1\vert n}^s, y_{0:n}\vert\theta)$, $k\leq n-1$, is
presented. The result shows that the ML smoother gives an estimate of state
$x_k$ with more adherence of loglikehood having less standard errors than that
of the ML state estimator $\widehat{x}_k=\argmax_{x_k} \log
f(x_k,y_{0:k}\vert\theta)$, with $\widehat{x}_{n\vert n}^s=\widehat{x}_n$.
Recursive estimation is given in terms of an EM-gradient-particle algorithm
which extends the work of \cite{Lange} for ML smoothing estimation. The
algorithm has an explicit iteration update which lacks in (\cite{Ramadan})
EM-algorithm for smoothing. A sequential Monte Carlo method is developed for
valuation of the score function and observed information matrices. A recursive
equation for the covariance matrix of estimation error is developed to
calculate the standard errors. In the case of linear systems, the method shows
that the Rauch-Tung-Striebel (RTS) smoother is a fully efficient smoothing
state-estimator whose covariance matrix coincides with the Cram\'er-Rao lower
bound, the inverse of expected information matrix. Furthermore, the RTS
smoother coincides with the Kalman filter having less covariance matrix.
Numerical studies are performed, confirming the accuracy of the main results.
- Abstract(参考訳): 本稿では、rauch (1963, et al. 1965) の古典的著作を再検討し、確率的状態空間システムの不完全情報/データから推定を平滑化する新しい手法を開発した。
不完全なデータのスコア関数と条件付き観測情報行列を導入し、その分布的アイデンティティを確立する。
これらの同一性を用いて、ml smoother $\widehat{x}_{k\vert n}^s =\argmax_{x_k} \log f(x_k,\widehat{x}_{k+1\vert n}^s, y_{0:n}\vert\theta)$, $k\leq n-1$ を示す。
その結果、mlのスムース化により、ml状態推定器である$\widehat{x}_k=\argmax_{x_k} \log f(x_k,y_{0:k}\vert\theta)$が$\widehat{x}_{n\vert n}^s=\widehat{x}_n$よりも低い標準誤差を持つloglikehoodの支持度が高い状態$x_k$の推定が得られる。
再帰的推定は、ML平滑化推定のために \cite{Lange} の作業を拡張する EM-勾配粒子アルゴリズムによって与えられる。
このアルゴリズムは(\cite{ramadan})em-algorithmでスムース化ができない明示的な反復更新がある。
逐次モンテカルロ法によるスコア関数と観測情報行列の評価法を開発した。
推定誤差の共分散行列に対する再帰方程式を開発し、標準誤差を算出する。
線形系の場合、ラウチ・タング・ストリーベル(rts)は、期待情報行列の逆行列であるクイック・ラオ下界と共分散行列が一致する完全効率的な平滑化状態推定器であることを示す。
さらに、RTSスムーズ化は、共分散行列の少ないカルマンフィルタと一致する。
主な結果の正確性を確認するため、数値研究が行なわれる。
関連論文リスト
- Inverting the Leverage Score Gradient: An Efficient Approximate Newton Method [10.742859956268655]
本稿では,レバレッジスコア勾配から固有モデルパラメータを復元することを目的とする。
具体的には、レバレッジスコア勾配の逆転を$g(x)$として精査する。
論文 参考訳(メタデータ) (2024-08-21T01:39:42Z) - An Oblivious Stochastic Composite Optimization Algorithm for Eigenvalue
Optimization Problems [76.2042837251496]
相補的な合成条件に基づく2つの難解なミラー降下アルゴリズムを導入する。
注目すべきは、どちらのアルゴリズムも、目的関数のリプシッツ定数や滑らかさに関する事前の知識なしで機能する。
本稿では,大規模半確定プログラム上での手法の効率性とロバスト性を示す。
論文 参考訳(メタデータ) (2023-06-30T08:34:29Z) - Refined Regret for Adversarial MDPs with Linear Function Approximation [50.00022394876222]
我々は,損失関数が約1,300ドル以上のエピソードに対して任意に変化するような,敵対的決定過程(MDP)の学習を検討する。
本稿では,同じ設定で$tildemathcal O(K2/3)$に対する後悔を改善する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-30T14:37:21Z) - Statistical Inference of Constrained Stochastic Optimization via Sketched Sequential Quadratic Programming [53.63469275932989]
制約付き非線形最適化問題のオンライン統計的推測を考察する。
これらの問題を解決するために、逐次二次計画法(StoSQP)を適用する。
論文 参考訳(メタデータ) (2022-05-27T00:34:03Z) - Computationally Efficient Horizon-Free Reinforcement Learning for Linear
Mixture MDPs [111.75736569611159]
線形混合MDPのための計算効率のよい初めての地平線フリーアルゴリズムを提案する。
我々のアルゴリズムは、未知の遷移力学に対する重み付き最小二乗推定器に適応する。
これにより、$sigma_k2$'sが知られているときに、この設定で最もよく知られたアルゴリズムも改善される。
論文 参考訳(メタデータ) (2022-05-23T17:59:18Z) - Noise Regularizes Over-parameterized Rank One Matrix Recovery, Provably [42.427869499882206]
階数 1 の行列 $Y*$ by $XXtop$ をパラメータ化します。
次に,2乗損失関数を用いたランダムな摂動勾配降下法により得られた推定値の平均2乗誤差が$O(sigma2/d)$であることを示す。
対照的に、ランダムな摂動を伴わない勾配降下から得られる推定器は、平均2乗誤差が$O(sigma2)$となる。
論文 参考訳(メタデータ) (2022-02-07T21:53:51Z) - Coordinate Methods for Matrix Games [41.821881312775496]
我々は,MathcalX max_yinmathY ytop A x$ の $min_x 形式の双線形サドル点問題を解くための主対座標法を開発した。
提案手法は,既存のサブ線形手法を,各項目の複雑性とサンプルの複雑さの観点から限界に推し進める。
論文 参考訳(メタデータ) (2020-09-17T17:55:03Z) - Truncated Linear Regression in High Dimensions [26.41623833920794]
truncated linear regression において、従属変数 $(A_i, y_i)_i$ は $y_i= A_irm T cdot x* + eta_i$ は固定された未知の興味ベクトルである。
目標は、$A_i$とノイズ分布に関するいくつかの好ましい条件の下で$x*$を回復することである。
我々は、$k$-sparse $n$-dimensional vectors $x*$ from $m$ truncated sample。
論文 参考訳(メタデータ) (2020-07-29T00:31:34Z) - Piecewise Linear Regression via a Difference of Convex Functions [50.89452535187813]
本稿では,データに対する凸関数(DC関数)の差を利用した線形回帰手法を提案する。
実際に実装可能であることを示すとともに,実世界のデータセット上で既存の回帰/分類手法に匹敵する性能を有することを実証的に検証した。
論文 参考訳(メタデータ) (2020-07-05T18:58:47Z) - Least Squares Regression with Markovian Data: Fundamental Limits and
Algorithms [69.45237691598774]
マルコフ連鎖からデータポイントが依存しサンプリングされる最小二乗線形回帰問題について検討する。
この問題を$tau_mathsfmix$という観点から、鋭い情報理論のミニマックス下限を確立する。
本稿では,経験的リプレイに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-16T04:26:50Z) - Phase retrieval in high dimensions: Statistical and computational phase
transitions [27.437775143419987]
我々は$mathbfXstar$を$m$(おそらくノイズの多い)観測から再構成する問題を考察する。
特に、フルランク行列に対する情報理論上の完全回復への遷移は、$alpha=1$と$alpha=2$である。
我々の研究は、高次元位相探索における統計的およびアルゴリズム的しきい値の広範な分類を提供する。
論文 参考訳(メタデータ) (2020-06-09T13:03:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。