論文の概要: Generating Adversarial Disturbances for Controller Verification
- arxiv url: http://arxiv.org/abs/2012.06695v1
- Date: Sat, 12 Dec 2020 01:31:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 05:20:43.941036
- Title: Generating Adversarial Disturbances for Controller Verification
- Title(参考訳): 制御者検証のための逆乱の発生
- Authors: Udaya Ghai, David Snyder, Anirudha Majumdar, Elad Hazan
- Abstract要約: ブラックボックスアクセスのみを前提として、所定の制御器に対して最大対向障害を発生させる問題を考える。
コントローラが選択する制御入力に基づいて,適応的に障害を発生させるオンライン学習手法を提案する。
- 参考スコア(独自算出の注目度): 40.83622484979694
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of generating maximally adversarial disturbances for
a given controller assuming only blackbox access to it. We propose an online
learning approach to this problem that adaptively generates disturbances based
on control inputs chosen by the controller. The goal of the disturbance
generator is to minimize regret versus a benchmark disturbance-generating
policy class, i.e., to maximize the cost incurred by the controller as well as
possible compared to the best possible disturbance generator in hindsight
(chosen from a benchmark policy class). In the setting where the dynamics are
linear and the costs are quadratic, we formulate our problem as an online trust
region (OTR) problem with memory and present a new online learning algorithm
(MOTR) for this problem. We prove that this method competes with the best
disturbance generator in hindsight (chosen from a rich class of benchmark
policies that includes linear-dynamical disturbance generating policies). We
demonstrate our approach on two simulated examples: (i) synthetically generated
linear systems, and (ii) generating wind disturbances for the popular PX4
controller in the AirSim simulator. On these examples, we demonstrate that our
approach outperforms several baseline approaches, including $H_{\infty}$
disturbance generation and gradient-based methods.
- Abstract(参考訳): ブラックボックスアクセスのみを前提として、所定のコントローラに対して最大対向障害を発生させる問題を考える。
本稿では,コントローラが選択した制御入力に基づいて適応的に外乱を生成するオンライン学習手法を提案する。
乱れ発生器の目標は、ベンチマーク乱れ発生ポリシークラスに対する後悔を最小限に抑えることであり、例えば、後ろ向きの最良の乱れ発生器(ベンチマークポリシークラスからの調味料)と比較して、コントローラが生み出すコストを可能な限り最大化することである。
動的に線形でコストが2次となる環境では,メモリのオンライン信頼領域(OTR)問題として問題を定式化し,この問題に対する新しいオンライン学習アルゴリズム(MOTR)を提案する。
本手法は, 線形動的外乱生成ポリシーを含むベンチマークポリシーの豊富なクラスから得られる) における最良の外乱発生器と競合することを示す。
本研究では, (i) 合成線形系と (ii) エアシムシミュレータで有名なPX4コントローラの風乱を発生させる2つの模擬例について実演する。
これらの例では、$h_{\infty}$外乱生成や勾配に基づく手法など、我々のアプローチがいくつかのベースラインアプローチを上回っていることを実証する。
関連論文リスト
- Neural Port-Hamiltonian Models for Nonlinear Distributed Control: An Unconstrained Parametrization Approach [0.0]
ニューラルネットワーク(NN)は、優れたパフォーマンスをもたらす制御ポリシのパラメータ化に利用することができる。
NNの小さな入力変更に対する感度は、クローズドループシステムの不安定化のリスクを引き起こす。
これらの問題に対処するために、ポート・ハミルトンシステムのフレームワークを活用して、連続時間分散制御ポリシーを設計する。
提案する分散コントローラの有効性は,非ホロノミック移動ロボットのコンセンサス制御によって実証される。
論文 参考訳(メタデータ) (2024-11-15T10:44:29Z) - Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。
システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文 参考訳(メタデータ) (2023-10-07T15:07:10Z) - Data-Driven Adversarial Online Control for Unknown Linear Systems [17.595231077524467]
このオンライン制御問題に対処する新しいデータ駆動型オンライン適応制御アルゴリズムを提案する。
我々のアルゴリズムは、高い確率で有界な$tmO(T2/3)の後悔勾配を保証し、この問題の最もよく知られた後悔勾配と一致する。
論文 参考訳(メタデータ) (2023-08-16T04:05:22Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Regret Analysis of Learning-Based MPC with Partially-Unknown Cost
Function [5.601217969637838]
探索/探索のトレードオフは、データ駆動および適応制御において固有の課題である。
本稿では、最適制御動作の基準として、全てのシステムパラメータの完全な知識を持つ有限水平オラクルコントローラを提案する。
我々は,このオラクル有限ホライゾンコントローラに関して,低後悔を達成できる学習ベースのポリシーを開発する。
論文 参考訳(メタデータ) (2021-08-04T22:43:51Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Improper Learning for Non-Stochastic Control [78.65807250350755]
逆方向の摂動, 逆方向に選択された凸損失関数, 部分的に観察された状態を含む, 未知の線形力学系を制御することの問題点を考察する。
このパラメトリゼーションにオンライン降下を適用することで、大規模なクローズドループポリシーに対してサブリニア後悔を実現する新しいコントローラが得られる。
我々の境界は、線形力学コントローラの安定化と競合する非確率的制御設定における最初のものである。
論文 参考訳(メタデータ) (2020-01-25T02:12:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。