論文の概要: Safety-Critical Online Control with Adversarial Disturbances
- arxiv url: http://arxiv.org/abs/2009.09511v1
- Date: Sun, 20 Sep 2020 19:59:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 13:15:12.128882
- Title: Safety-Critical Online Control with Adversarial Disturbances
- Title(参考訳): 敵対的外乱を伴う安全クリティカルオンライン制御
- Authors: Bhaskar Ramasubramanian, Baicen Xiao, Linda Bushnell, Radha Poovendran
- Abstract要約: 我々は、乱れによって生じるコストを最小限に抑えるために、状態フィードバックコントローラを合成することを模索する。
我々は、当時のコントローラが選択された後のみ、各時点のコストが明らかにされるオンライン環境について検討する。
これらのコストの差として定義される後悔関数は、時間的地平線と対数的に異なることを示す。
- 参考スコア(独自算出の注目度): 8.633140051496408
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies the control of safety-critical dynamical systems in the
presence of adversarial disturbances. We seek to synthesize state-feedback
controllers to minimize a cost incurred due to the disturbance, while
respecting a safety constraint. The safety constraint is given by a bound on an
H-inf norm, while the cost is specified as an upper bound on the H-2 norm of
the system. We consider an online setting where costs at each time are revealed
only after the controller at that time is chosen. We propose an iterative
approach to the synthesis of the controller by solving a modified discrete-time
Riccati equation. Solutions of this equation enforce the safety constraint. We
compare the cost of this controller with that of the optimal controller when
one has complete knowledge of disturbances and costs in hindsight. We show that
the regret function, which is defined as the difference between these costs,
varies logarithmically with the time horizon. We validate our approach on a
process control setup that is subject to two kinds of adversarial attacks.
- Abstract(参考訳): 本稿では,敵対的障害の存在下での安全臨界力学系の制御について検討する。
安全制約を尊重しつつ、外乱に起因するコストを最小限に抑えるために、状態フィードバックコントローラを合成することを目指す。
安全性制約はH-infノルム上のバウンドによって与えられるが、コストはシステムのH-2ノルム上の上限として指定される。
我々は、各時点のコストが、その時点のコントローラが選択された後にのみ明らかにされるオンライン環境を考える。
修正離散時間リカティ方程式を解くことにより,制御器の合成を反復的に行う手法を提案する。
この方程式の解は安全制約を強制する。
我々は,この制御器のコストと最適制御器のコストを比較する。
これらのコストの差として定義される後悔関数は、時間的地平線と対数的に異なることを示す。
我々は,2種類の敵の攻撃を受けるプロセス制御設定において,我々のアプローチを検証する。
関連論文リスト
- Safe Neural Control for Non-Affine Control Systems with Differentiable
Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。
制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。
我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文 参考訳(メタデータ) (2023-09-06T05:35:48Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Stable Online Control of Linear Time-Varying Systems [49.41696101740271]
COCO-LQは、大規模なLTVシステムの入出力安定性を保証する効率的なオンライン制御アルゴリズムである。
COCO-LQの性能を実証実験とパワーシステム周波数制御の両例で実証した。
論文 参考訳(メタデータ) (2021-04-29T06:18:49Z) - Non-stationary Online Learning with Memory and Non-stochastic Control [71.14503310914799]
我々は,過去の決定に依拠する損失関数を許容するメモリを用いたオンライン凸最適化(OCO)の問題について検討する。
本稿では,非定常環境に対してロバストなアルゴリズムを設計するための性能指標として,動的ポリシーの後悔を紹介する。
我々は,時間的地平線,非定常度,メモリ長といった面で,最適な動的ポリシーの後悔を確実に享受するメモリ付きOCOの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-07T09:45:15Z) - Meta-Learning Guarantees for Online Receding Horizon Learning Control [0.0]
本稿では,オンラインメタ学習遅延水平方向制御アルゴリズムを反復制御設定で証明可能な後悔の保証を提供する。
イテレーション内で学ぶことの最悪の後悔は、より多くのイテレーションの経験によって改善されることを示します。
論文 参考訳(メタデータ) (2020-10-21T21:57:04Z) - A Meta-Learning Control Algorithm with Provable Finite-Time Guarantees [0.0]
オンラインメタ学習制御アルゴリズムを反復制御設定で証明可能な後悔の保証を提供する。
イテレーション内での学習に対する最悪の後悔は、より多くのイテレーションの経験を積んで継続的に改善することを示しています。
論文 参考訳(メタデータ) (2020-08-30T20:30:40Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Improper Learning for Non-Stochastic Control [78.65807250350755]
逆方向の摂動, 逆方向に選択された凸損失関数, 部分的に観察された状態を含む, 未知の線形力学系を制御することの問題点を考察する。
このパラメトリゼーションにオンライン降下を適用することで、大規模なクローズドループポリシーに対してサブリニア後悔を実現する新しいコントローラが得られる。
我々の境界は、線形力学コントローラの安定化と競合する非確率的制御設定における最初のものである。
論文 参考訳(メタデータ) (2020-01-25T02:12:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。