論文の概要: When is Particle Filtering Efficient for Planning in Partially Observed
Linear Dynamical Systems?
- arxiv url: http://arxiv.org/abs/2006.05975v2
- Date: Fri, 9 Jul 2021 01:28:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 05:16:43.689444
- Title: When is Particle Filtering Efficient for Planning in Partially Observed
Linear Dynamical Systems?
- Title(参考訳): 部分観測線形力学系における粒子フィルタリングは計画に有効か?
- Authors: Simon S. Du, Wei Hu, Zhiyuan Li, Ruoqi Shen, Zhao Song, Jiajun Wu
- Abstract要約: 本稿では, 逐次計画における粒子フィルタリングの効率性について検討する。
我々は、粒子フィルタリングに基づくポリシーの長期報酬が正確な推測に基づいてそれに近いように、必要な粒子の数に縛り付けることができる。
このテクニックは、他のシーケンシャルな意思決定問題に有効であると考えています。
- 参考スコア(独自算出の注目度): 60.703816720093016
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Particle filtering is a popular method for inferring latent states in
stochastic dynamical systems, whose theoretical properties have been well
studied in machine learning and statistics communities. In many control
problems, e.g., partially observed linear dynamical systems (POLDS), oftentimes
the inferred latent state is further used for planning at each step. This paper
initiates a rigorous study on the efficiency of particle filtering for
sequential planning, and gives the first particle complexity bounds. Though
errors in past actions may affect the future, we are able to bound the number
of particles needed so that the long-run reward of the policy based on particle
filtering is close to that based on exact inference. In particular, we show
that, in stable systems, polynomially many particles suffice. Key in our proof
is a coupling of the ideal sequence based on the exact planning and the
sequence generated by approximate planning based on particle filtering. We
believe this technique can be useful in other sequential decision-making
problems.
- Abstract(参考訳): 粒子フィルタリングは確率力学系の潜在状態を推定する一般的な方法であり、その理論的性質は機械学習や統計コミュニティでよく研究されている。
多くの制御問題、例えば、部分的に観測された線形力学系(POLDS)では、推論された潜在状態が各ステップの計画にさらに使用される。
本稿では,逐次計画のための粒子フィルタリングの効率に関する厳密な研究を開始し,最初の粒子複雑性境界を与える。
過去の行動の誤りは未来に影響を与えるかもしれないが、粒子フィルタリングに基づく政策の長期的報酬が正確な推測に基づいてそれに近いように、必要な粒子の数を制限できる。
特に、安定系では、多項式的に多くの粒子が十分であることを示す。
我々の証明の鍵は、正確な計画と、粒子フィルタリングに基づく近似計画によって生成されるシーケンスに基づく理想的なシーケンスのカップリングである。
このテクニックは、他の逐次的な意思決定問題にも有用だと考えています。
関連論文リスト
- An overview of differentiable particle filters for data-adaptive
sequential Bayesian inference [12.161649672131286]
粒子フィルタは非線形逐次状態推定問題を解くための効率的なメカニズムを提供する。
粒子フィルタの設計における新たなトレンドは、微分可能な粒子フィルタ(DPF)である。
論文 参考訳(メタデータ) (2023-02-19T18:03:53Z) - Particle-Based Score Estimation for State Space Model Learning in
Autonomous Driving [62.053071723903834]
マルチオブジェクト状態推定はロボットアプリケーションの基本的な問題である。
粒子法を用いて最大形パラメータを学習することを検討する。
自動運転車から収集した実データに本手法を適用した。
論文 参考訳(メタデータ) (2022-12-14T01:21:05Z) - Continuous-time Particle Filtering for Latent Stochastic Differential
Equations [37.51802583388233]
本稿では,粒子フィルタを連続時間領域に拡張した連続潜時粒子フィルタを提案する。
本研究では, 連続潜時粒子フィルタが, 学習した変動後部に依存した推論手法の汎用的なプラグイン代替として利用できることを示す。
論文 参考訳(メタデータ) (2022-09-01T01:05:31Z) - Transformer with Implicit Edges for Particle-based Physics Simulation [135.77656965678196]
Implicit Edges (TIE) を用いたトランスフォーマーは、素粒子相互作用のリッチなセマンティクスをエッジフリーでキャプチャする。
様々な複雑さと素材の多様な領域におけるモデルの評価を行った。
論文 参考訳(メタデータ) (2022-07-22T03:45:29Z) - Computational Doob's $h$-transforms for Online Filtering of Discretely
Observed Diffusions [65.74069050283998]
本稿では,離散的に観察された非線形拡散過程のオンラインフィルタリングについて述べる。
本研究では,Doobの$h$-transformsを近似する計算フレームワークを提案する。
数値実験により、提案手法はブートストラップ粒子フィルタよりも桁違いに効率的であることが示されている。
論文 参考訳(メタデータ) (2022-06-07T15:03:05Z) - Deep Learning for the Benes Filter [91.3755431537592]
本研究では,メッシュのないニューラルネットワークによるベンズモデルの解の密度の表現に基づく新しい数値計算法を提案する。
ニューラルネットワークの領域選択におけるフィルタリングモデル方程式における非線形性の役割について論じる。
論文 参考訳(メタデータ) (2022-03-09T14:08:38Z) - POMDPs in Continuous Time and Discrete Spaces [28.463792234064805]
このような離散状態と行動空間系における最適決定の問題は、部分的可観測性の下で考慮する。
連続時間部分観測可能なマルコフ決定過程(POMDP)の数学的記述を与える。
本稿では,価値関数の近似を学習することで,決定問題をオフラインで解く手法と,深層強化学習を用いた信念空間の解を提供するオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-10-02T14:04:32Z) - Approximating Posterior Predictive Distributions by Averaging Output
From Many Particle Filters [0.0]
本稿では, it Particle Swarm filter(粒子群最適化と混同しないように)を紹介する。
多くの粒子フィルタからの予測近似を平均化することにより、後続の予測分布の列への近似を目標とする。
大数の法則と中心極限定理、およびボラティリティモデルからのシミュレーションデータの数値的研究が提供される。
論文 参考訳(メタデータ) (2020-06-27T16:14:02Z) - Dependency Aware Filter Pruning [74.69495455411987]
重要でないフィルタを割ることは、推論コストを軽減するための効率的な方法である。
以前の作業は、その重み基準やそれに対応するバッチノームスケーリング要因に従ってフィルタをプルークする。
所望の空間性を達成するために,空間性誘導正規化を動的に制御する機構を提案する。
論文 参考訳(メタデータ) (2020-05-06T07:41:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。