論文の概要: Correct-by-construction reach-avoid control of partially observable
linear stochastic systems
- arxiv url: http://arxiv.org/abs/2103.02398v4
- Date: Tue, 12 Sep 2023 07:48:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 18:31:24.459222
- Title: Correct-by-construction reach-avoid control of partially observable
linear stochastic systems
- Title(参考訳): 部分観測可能な線形確率システムの構成による到達回避制御
- Authors: Thom Badings, Hasan A. Poonawala, Marielle Stoelinga, Nils Jansen
- Abstract要約: 離散時間線形時間不変系のリーチエイド制御のための頑健なフィードバックコントローラを定式化する。
問題は、必要となる証明状態の抽象化問題を満たすコントローラを計算することである。
- 参考スコア(独自算出の注目度): 7.912008109232803
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study feedback controller synthesis for reach-avoid control of
discrete-time, linear time-invariant (LTI) systems with Gaussian process and
measurement noise. The problem is to compute a controller such that, with at
least some required probability, the system reaches a desired goal state in
finite time while avoiding unsafe states. Due to stochasticity and
nonconvexity, this problem does not admit exact algorithmic or closed-form
solutions in general. Our key contribution is a correct-by-construction
controller synthesis scheme based on a finite-state abstraction of a Gaussian
belief over the unmeasured state, obtained using a Kalman filter. We formalize
this abstraction as a Markov decision process (MDP). To be robust against
numerical imprecision in approximating transition probabilities, we use MDPs
with intervals of transition probabilities. By construction, any policy on the
abstraction can be refined into a piecewise linear feedback controller for the
LTI system. We prove that the closed-loop LTI system under this controller
satisfies the reach-avoid problem with at least the required probability. The
numerical experiments show that our method is able to solve reach-avoid
problems for systems with up to 6D state spaces, and with control input
constraints that cannot be handled by methods such as the rapidly-exploring
random belief trees (RRBT).
- Abstract(参考訳): ガウス過程と測定ノイズを有する離散時間線形時間不変(lti)系の到達回避制御のためのフィードバック制御器の合成について検討した。
問題は、少なくともある程度の確率で、システムは安全でない状態を避けながら、有限時間で所望のゴール状態に達するようにコントローラを計算することである。
確率性と非凸性のため、この問題はアルゴリズム的あるいは閉形式な解を一般に認めない。
我々の鍵となる貢献は、カルマンフィルタを用いて得られた非測定状態上のガウス的信念の有限状態抽象に基づく構成的制御合成スキームである。
我々はこの抽象概念をマルコフ決定過程(MDP)として定式化する。
遷移確率を近似する数値的不規則に対して頑健であるためには、遷移確率の間隔を持つmdpを用いる。
構成により、抽象に関する任意のポリシーをltiシステムのための分割線形フィードバックコントローラに洗練することができる。
この制御器の閉ループ LTI システムは,少なくとも必要な確率で到達可能な問題を満たすことを証明した。
数値実験により,本手法は最大6次元状態空間を持つシステムの到達回避問題を解くことができ,高速に探索するランダム信念木 (rrbt) のような手法では処理できない入力制約を制御できることを示した。
関連論文リスト
- Robust Control for Dynamical Systems With Non-Gaussian Noise via Formal
Abstractions [59.605246463200736]
雑音分布の明示的な表現に依存しない新しい制御器合成法を提案する。
まず、連続制御系を有限状態モデルに抽象化し、離散状態間の確率的遷移によってノイズを捕捉する。
我々は最先端の検証技術を用いてマルコフ決定プロセスの間隔を保証し、これらの保証が元の制御システムに受け継がれるコントローラを演算する。
論文 参考訳(メタデータ) (2023-01-04T10:40:30Z) - Formal Controller Synthesis for Markov Jump Linear Systems with
Uncertain Dynamics [64.72260320446158]
マルコフジャンプ線形系に対する制御器の合成法を提案する。
本手法は,MJLSの離散(モードジャンピング)と連続(確率線形)の両方の挙動を捉える有限状態抽象化に基づいている。
本手法を複数の現実的なベンチマーク問題,特に温度制御と航空機の配送問題に適用する。
論文 参考訳(メタデータ) (2022-12-01T17:36:30Z) - Sampling-Based Robust Control of Autonomous Systems with Non-Gaussian
Noise [59.47042225257565]
雑音分布の明示的な表現に依存しない新しい計画法を提案する。
まず、連続系を離散状態モデルに抽象化し、状態間の確率的遷移によってノイズを捕捉する。
いわゆる区間マルコフ決定過程(iMDP)の遷移確率区間におけるこれらの境界を捉える。
論文 参考訳(メタデータ) (2021-10-25T06:18:55Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Formal Verification of Stochastic Systems with ReLU Neural Network
Controllers [22.68044012584378]
reluニューラルネットワーク(nn)コントローラを備えたサイバーフィジカルシステムの形式的安全性検証の問題に対処する。
私たちの目標は、所定の自信を持って、システムが安全でない構成に達しない初期状態のセットを見つけることです。
論文 参考訳(メタデータ) (2021-03-08T23:53:13Z) - Control of Stochastic Quantum Dynamics with Differentiable Programming [0.0]
微分可能プログラミングに基づく制御スキームの自動設計のためのフレームワークを提案する。
このアプローチを、ホモジエン検出を受けるクビットの状態準備と安定化に適用する。
その結果、信号と雑音の比が低いにもかかわらず、平均忠実度が約85%の目標状態へのキュービットの準備と安定化をコントローラに教えることができる。
論文 参考訳(メタデータ) (2021-01-04T19:00:03Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。