論文の概要: Filter-Based Abstractions with Correctness Guarantees for Planning under
Uncertainty
- arxiv url: http://arxiv.org/abs/2103.02398v1
- Date: Wed, 3 Mar 2021 13:46:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-04 14:49:48.328353
- Title: Filter-Based Abstractions with Correctness Guarantees for Planning under
Uncertainty
- Title(参考訳): 不確実性下における計画の整合性保証付きフィルタに基づく抽象
- Authors: Thom S. Badings, Nils Jansen, Hasan A. Poonawala, Marielle Stoelinga
- Abstract要約: 測定およびプロセスノイズに起因する不確実性を有する連続制御システムの計画問題について検討する。
ゴール状態に到達する確率を最大化する計画を効率的に計算するために最先端のモデルチェック技術を用いる。
- 参考スコア(独自算出の注目度): 3.6007829804814673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study planning problems for continuous control systems with uncertainty
caused by measurement and process noise. The goal is to find an optimal plan
that guarantees that the system reaches a desired goal state within finite
time. Measurement noise causes limited observability of system states, and
process noise causes uncertainty in the outcome of a given plan. These factors
render the problem undecidable in general. Our key contribution is a novel
abstraction scheme that employs Kalman filtering as a state estimator to obtain
a finite-state model, which we formalize as a Markov decision process (MDP).
For this MDP, we employ state-of-the-art model checking techniques to
efficiently compute plans that maximize the probability of reaching goal
states. Moreover, we account for numerical imprecision in computing the
abstraction by extending the MDP with intervals of probabilities as a more
robust model. We show the correctness of the abstraction and provide several
optimizations that aim to balance the quality of the plan and the scalability
of the approach. We demonstrate that our method can handle systems that result
in MDPs with thousands of states and millions of transitions.
- Abstract(参考訳): 測定およびプロセスノイズに起因する不確実性を有する連続制御システムの計画問題について検討する。
目標は、システムが有限時間以内に望ましいゴール状態に達することを保証する最適な計画を見つけることである。
測定ノイズはシステム状態の可観測性が制限され、プロセスノイズは特定の計画の結果に不確実性を引き起こす。
これらの要因により、問題は一般に決定不能となる。
我々の重要な貢献は、マルコフ決定過程(MDP)として形式化された有限状態モデルを得るための状態推定器としてカルマンフィルタを用いる新しい抽象スキームである。
このMDPでは,ゴール状態に到達する確率を最大化するプランを効率的に計算するために,最先端のモデル検査技術を採用している。
さらに,より頑健なモデルとして,mdpを確率間隔で拡張することで,抽象度を計算する際の数値的不正確性も考慮する。
抽象化の正確性を示し、計画の質とアプローチのスケーラビリティのバランスを狙ったいくつかの最適化を提供します。
本手法は、数千の状態と数百万の遷移を持つMDPを生じるシステムを扱うことができることを実証する。
関連論文リスト
- Robust Control for Dynamical Systems With Non-Gaussian Noise via Formal
Abstractions [59.605246463200736]
雑音分布の明示的な表現に依存しない新しい制御器合成法を提案する。
まず、連続制御系を有限状態モデルに抽象化し、離散状態間の確率的遷移によってノイズを捕捉する。
我々は最先端の検証技術を用いてマルコフ決定プロセスの間隔を保証し、これらの保証が元の制御システムに受け継がれるコントローラを演算する。
論文 参考訳(メタデータ) (2023-01-04T10:40:30Z) - Formal Controller Synthesis for Markov Jump Linear Systems with
Uncertain Dynamics [64.72260320446158]
マルコフジャンプ線形系に対する制御器の合成法を提案する。
本手法は,MJLSの離散(モードジャンピング)と連続(確率線形)の両方の挙動を捉える有限状態抽象化に基づいている。
本手法を複数の現実的なベンチマーク問題,特に温度制御と航空機の配送問題に適用する。
論文 参考訳(メタデータ) (2022-12-01T17:36:30Z) - Sampling-Based Robust Control of Autonomous Systems with Non-Gaussian
Noise [59.47042225257565]
雑音分布の明示的な表現に依存しない新しい計画法を提案する。
まず、連続系を離散状態モデルに抽象化し、状態間の確率的遷移によってノイズを捕捉する。
いわゆる区間マルコフ決定過程(iMDP)の遷移確率区間におけるこれらの境界を捉える。
論文 参考訳(メタデータ) (2021-10-25T06:18:55Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Formal Verification of Stochastic Systems with ReLU Neural Network
Controllers [22.68044012584378]
reluニューラルネットワーク(nn)コントローラを備えたサイバーフィジカルシステムの形式的安全性検証の問題に対処する。
私たちの目標は、所定の自信を持って、システムが安全でない構成に達しない初期状態のセットを見つけることです。
論文 参考訳(メタデータ) (2021-03-08T23:53:13Z) - Control of Stochastic Quantum Dynamics with Differentiable Programming [0.0]
微分可能プログラミングに基づく制御スキームの自動設計のためのフレームワークを提案する。
このアプローチを、ホモジエン検出を受けるクビットの状態準備と安定化に適用する。
その結果、信号と雑音の比が低いにもかかわらず、平均忠実度が約85%の目標状態へのキュービットの準備と安定化をコントローラに教えることができる。
論文 参考訳(メタデータ) (2021-01-04T19:00:03Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。