論文の概要: When is Particle Filtering Efficient for Planning in Partially Observed
Linear Dynamical Systems?
- arxiv url: http://arxiv.org/abs/2006.05975v2
- Date: Fri, 9 Jul 2021 01:28:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 05:16:43.689444
- Title: When is Particle Filtering Efficient for Planning in Partially Observed
Linear Dynamical Systems?
- Title(参考訳): 部分観測線形力学系における粒子フィルタリングは計画に有効か?
- Authors: Simon S. Du, Wei Hu, Zhiyuan Li, Ruoqi Shen, Zhao Song, Jiajun Wu
- Abstract要約: 本稿では, 逐次計画における粒子フィルタリングの効率性について検討する。
我々は、粒子フィルタリングに基づくポリシーの長期報酬が正確な推測に基づいてそれに近いように、必要な粒子の数に縛り付けることができる。
このテクニックは、他のシーケンシャルな意思決定問題に有効であると考えています。
- 参考スコア(独自算出の注目度): 60.703816720093016
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Particle filtering is a popular method for inferring latent states in
stochastic dynamical systems, whose theoretical properties have been well
studied in machine learning and statistics communities. In many control
problems, e.g., partially observed linear dynamical systems (POLDS), oftentimes
the inferred latent state is further used for planning at each step. This paper
initiates a rigorous study on the efficiency of particle filtering for
sequential planning, and gives the first particle complexity bounds. Though
errors in past actions may affect the future, we are able to bound the number
of particles needed so that the long-run reward of the policy based on particle
filtering is close to that based on exact inference. In particular, we show
that, in stable systems, polynomially many particles suffice. Key in our proof
is a coupling of the ideal sequence based on the exact planning and the
sequence generated by approximate planning based on particle filtering. We
believe this technique can be useful in other sequential decision-making
problems.
- Abstract(参考訳): 粒子フィルタリングは確率力学系の潜在状態を推定する一般的な方法であり、その理論的性質は機械学習や統計コミュニティでよく研究されている。
多くの制御問題、例えば、部分的に観測された線形力学系(POLDS)では、推論された潜在状態が各ステップの計画にさらに使用される。
本稿では,逐次計画のための粒子フィルタリングの効率に関する厳密な研究を開始し,最初の粒子複雑性境界を与える。
過去の行動の誤りは未来に影響を与えるかもしれないが、粒子フィルタリングに基づく政策の長期的報酬が正確な推測に基づいてそれに近いように、必要な粒子の数を制限できる。
特に、安定系では、多項式的に多くの粒子が十分であることを示す。
我々の証明の鍵は、正確な計画と、粒子フィルタリングに基づく近似計画によって生成されるシーケンスに基づく理想的なシーケンスのカップリングである。
このテクニックは、他の逐次的な意思決定問題にも有用だと考えています。
関連論文リスト
- Learning Optimal Filters Using Variational Inference [0.3749861135832072]
本稿では,パラメータ化解析マップを学習するためのフレームワークを提案する。
この手法は線形および非線形力学系をフィルタリングするゲイン行列の学習に利用できることを示す。
今後、このフレームワークを新しいフィルタリングアルゴリズムの学習に適用する予定である。
論文 参考訳(メタデータ) (2024-06-26T04:51:14Z) - Closed-form Filtering for Non-linear Systems [83.91296397912218]
我々は密度近似と計算効率の面でいくつかの利点を提供するガウスPSDモデルに基づく新しいフィルタのクラスを提案する。
本研究では,遷移や観測がガウスPSDモデルである場合,フィルタリングを効率的にクローズド形式で行うことができることを示す。
提案する推定器は, 近似の精度に依存し, 遷移確率の正則性に適応する推定誤差を伴って, 高い理論的保証を享受する。
論文 参考訳(メタデータ) (2024-02-15T08:51:49Z) - Nonlinear Filtering with Brenier Optimal Transport Maps [4.745059103971596]
本稿では,非線形フィルタリング,すなわち動的システムの状態の条件分布の計算の問題について述べる。
従来の逐次重要再サンプリング(SIR)粒子フィルタは、縮退確率や高次元状態を含むシナリオにおいて、基本的な制限に悩まされる。
本稿では,Brenier 最適輸送 (OT) マップを,現在の状態の分布から次のステップにおける後部分布へ推定する手法について検討する。
論文 参考訳(メタデータ) (2023-10-21T01:34:30Z) - An overview of differentiable particle filters for data-adaptive
sequential Bayesian inference [19.09640071505051]
粒子フィルタ(PF)は非線形逐次状態推定問題を解くための効率的なメカニズムを提供する。
新たなトレンドは、ニューラルネットワークを使用して粒子フィルタのコンポーネントを構築し、勾配降下によって最適化することである。
微分可能な粒子フィルタは複雑な高次元タスクにおいて逐次データに対する推論を行うための有望な計算ツールである。
論文 参考訳(メタデータ) (2023-02-19T18:03:53Z) - Monte Carlo Neural PDE Solver for Learning PDEs via Probabilistic Representation [59.45669299295436]
教師なしニューラルソルバのトレーニングのためのモンテカルロPDEソルバを提案する。
我々は、マクロ現象をランダム粒子のアンサンブルとみなすPDEの確率的表現を用いる。
対流拡散, アレン・カーン, ナヴィエ・ストークス方程式に関する実験により, 精度と効率が著しく向上した。
論文 参考訳(メタデータ) (2023-02-10T08:05:19Z) - Particle-Based Score Estimation for State Space Model Learning in
Autonomous Driving [62.053071723903834]
マルチオブジェクト状態推定はロボットアプリケーションの基本的な問題である。
粒子法を用いて最大形パラメータを学習することを検討する。
自動運転車から収集した実データに本手法を適用した。
論文 参考訳(メタデータ) (2022-12-14T01:21:05Z) - Continuous-time Particle Filtering for Latent Stochastic Differential
Equations [37.51802583388233]
本稿では,粒子フィルタを連続時間領域に拡張した連続潜時粒子フィルタを提案する。
本研究では, 連続潜時粒子フィルタが, 学習した変動後部に依存した推論手法の汎用的なプラグイン代替として利用できることを示す。
論文 参考訳(メタデータ) (2022-09-01T01:05:31Z) - Computational Doob's h-transforms for Online Filtering of Discretely
Observed Diffusions [65.74069050283998]
本研究では,Doobの$h$-transformsを近似する計算フレームワークを提案する。
提案手法は、最先端粒子フィルタよりも桁違いに効率的である。
論文 参考訳(メタデータ) (2022-06-07T15:03:05Z) - Deep Learning for the Benes Filter [91.3755431537592]
本研究では,メッシュのないニューラルネットワークによるベンズモデルの解の密度の表現に基づく新しい数値計算法を提案する。
ニューラルネットワークの領域選択におけるフィルタリングモデル方程式における非線形性の役割について論じる。
論文 参考訳(メタデータ) (2022-03-09T14:08:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。