論文の概要: Recurrent Neural Network Controllers Synthesis with Stability Guarantees
for Partially Observed Systems
- arxiv url: http://arxiv.org/abs/2109.03861v1
- Date: Wed, 8 Sep 2021 18:21:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-11 10:40:17.359087
- Title: Recurrent Neural Network Controllers Synthesis with Stability Guarantees
for Partially Observed Systems
- Title(参考訳): 部分観測システムに対する安定性保証付き再帰的ニューラルネットワーク制御系
- Authors: Fangda Gu, He Yin, Laurent El Ghaoui, Murat Arcak, Peter Seiler, Ming
Jin
- Abstract要約: 本稿では、不確実な部分観測システムのための動的制御系として、リカレントニューラルネットワーク(RNN)の重要なクラスを考える。
本稿では、再パラメータ化空間における安定性条件を反復的に強制する計画的ポリシー勾配法を提案する。
数値実験により,本手法は,より少ないサンプルを用いて制御器の安定化を学習し,政策勾配よりも高い最終性能を達成することを示す。
- 参考スコア(独自算出の注目度): 6.234005265019845
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural network controllers have become popular in control tasks thanks to
their flexibility and expressivity. Stability is a crucial property for
safety-critical dynamical systems, while stabilization of partially observed
systems, in many cases, requires controllers to retain and process long-term
memories of the past. We consider the important class of recurrent neural
networks (RNN) as dynamic controllers for nonlinear uncertain
partially-observed systems, and derive convex stability conditions based on
integral quadratic constraints, S-lemma and sequential convexification. To
ensure stability during the learning and control process, we propose a
projected policy gradient method that iteratively enforces the stability
conditions in the reparametrized space taking advantage of mild additional
information on system dynamics. Numerical experiments show that our method
learns stabilizing controllers while using fewer samples and achieving higher
final performance compared with policy gradient.
- Abstract(参考訳): ニューラルネットワークコントローラは、柔軟性と表現性のおかげで、制御タスクで人気を博している。
安定性は安全クリティカルな力学システムにとって重要な特性であるが、部分的に観測されたシステムの安定化には、多くの場合、コントローラが過去の長期記憶を保持し、処理する必要がある。
本稿では,非線形不確定部分観測システムに対する動的制御としてrnn(recurrent neural network)の重要なクラスを考察し,積分二次制約,s補題,逐次凸化に基づく凸安定性条件を導出する。
学習・制御過程における安定性を確保するため,システムダイナミクスに関する軽度追加情報を利用して,再パラメータ空間における安定条件を反復的に実施する予測型ポリシー勾配法を提案する。
数値実験により,本手法は,より少ないサンプルを用いて制御器の安定化を学習し,政策勾配よりも高い最終性能を達成することを示す。
関連論文リスト
- Learning to Boost the Performance of Stable Nonlinear Systems [0.0]
クローズドループ安定性保証による性能ブースティング問題に対処する。
本手法は,安定な非線形システムのための性能ブースティング制御器のニューラルネットワーククラスを任意に学習することを可能にする。
論文 参考訳(メタデータ) (2024-05-01T21:11:29Z) - Lyapunov-stable Neural Control for State and Output Feedback: A Novel Formulation [67.63756749551924]
学習ベースのニューラルネットワーク(NN)制御ポリシは、ロボット工学と制御の幅広いタスクにおいて、印象的な経験的パフォーマンスを示している。
非線形力学系を持つNNコントローラのトラクション領域(ROA)に対するリアプノフ安定性の保証は困難である。
我々は、高速な経験的ファルシフィケーションと戦略的正則化を用いて、Lyapunov証明書とともにNNコントローラを学習するための新しいフレームワークを実証する。
論文 参考訳(メタデータ) (2024-04-11T17:49:15Z) - Data-Driven Control with Inherent Lyapunov Stability [3.695480271934742]
本研究では,非線形力学モデルと安定化制御器のパラメトリック表現をデータから共同学習する手法として,インヒーレント・リャプノフ安定度制御(CoILS)を提案する。
新たな構成によって保証される学習力学の安定化性に加えて、学習した制御器は学習力学の忠実性に関する特定の仮定の下で真の力学を安定化することを示す。
論文 参考訳(メタデータ) (2023-03-06T14:21:42Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - KCRL: Krasovskii-Constrained Reinforcement Learning with Guaranteed
Stability in Nonlinear Dynamical Systems [66.9461097311667]
形式的安定性を保証するモデルに基づく強化学習フレームワークを提案する。
提案手法は,特徴表現を用いて信頼区間までシステムダイナミクスを学習する。
我々は、KCRLが、基礎となる未知のシステムとの有限数の相互作用において安定化ポリシーを学ぶことが保証されていることを示す。
論文 参考訳(メタデータ) (2022-06-03T17:27:04Z) - Stability Verification in Stochastic Control Systems via Neural Network
Supermartingales [17.558766911646263]
2つの新しい側面を持つ一般非線形制御問題に対するアプローチを提案する。
我々は、A.s.asymptotic stabilityの証明にランキング・スーパーガレス(RSM)を使用し、ニューラルネットワークの学習方法を提案する。
論文 参考訳(メタデータ) (2021-12-17T13:05:14Z) - Stabilizing Dynamical Systems via Policy Gradient Methods [32.88312419270879]
完全に観察された力学系を安定化するためのモデルフリーなアルゴリズムを提案する。
本研究では,線形システムの安定化制御を効率よく行うことを証明する。
我々は,共通制御ベンチマークにおけるアプローチの有効性を実証的に評価した。
論文 参考訳(メタデータ) (2021-10-13T00:58:57Z) - Robust Stability of Neural-Network Controlled Nonlinear Systems with
Parametric Variability [2.0199917525888895]
ニューラルネットワーク制御非線形システムの安定性と安定化性の理論を考案する。
このような頑健な安定化NNコントローラの計算には、安定性保証トレーニング(SGT)も提案されている。
論文 参考訳(メタデータ) (2021-09-13T05:09:30Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。