論文の概要: Neural Network Optimal Feedback Control with Guaranteed Local Stability
- arxiv url: http://arxiv.org/abs/2205.00394v1
- Date: Sun, 1 May 2022 04:23:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 16:31:03.696524
- Title: Neural Network Optimal Feedback Control with Guaranteed Local Stability
- Title(参考訳): 局所安定性を保証したニューラルネットワーク最適フィードバック制御
- Authors: Tenavi Nakamura-Zimmerer and Qi Gong and Wei Kang
- Abstract要約: テスト精度の高いニューラルネットワーク(NN)コントローラでは,動的システムを局所的に安定化させることができないことを示す。
提案するNNアーキテクチャは,最適化されたフィードバックポリシを学習するための半言語近似能力を維持しながら,局所的な安定性を保証する。
- 参考スコア(独自算出の注目度): 2.8725913509167156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent research shows that deep learning can be an effective tool for
designing optimal feedback controllers for high-dimensional nonlinear dynamic
systems. But the behavior of these neural network (NN) controllers is still not
well understood. In particular, some NNs with high test accuracy can fail to
even locally stabilize the dynamic system. To address this challenge we propose
several novel NN architectures, which we show guarantee local stability while
retaining the semi-global approximation capacity to learn the optimal feedback
policy. The proposed architectures are compared against standard NN feedback
controllers through numerical simulations of two high-dimensional nonlinear
optimal control problems (OCPs): stabilization of an unstable Burgers-type
partial differential equation (PDE), and altitude and course tracking for a six
degree-of-freedom (6DoF) unmanned aerial vehicle (UAV). The simulations
demonstrate that standard NNs can fail to stabilize the dynamics even when
trained well, while the proposed architectures are always at least locally
stable. Moreover, the proposed controllers are found to be near-optimal in
testing.
- Abstract(参考訳): 近年の研究では、高次元非線形力学系のための最適フィードバックコントローラの設計にディープラーニングが有効であることが示されている。
しかし、これらのニューラルネットワーク(NN)コントローラの挙動はまだよく理解されていない。
特に、テスト精度の高いいくつかのNNは、動的システムを局所的に安定化させることができない。
この課題に対処するために,我々は,準グローバル近似容量を保持しながら局所安定性を保証し,最適フィードバックポリシーを学習する,いくつかの新しいnnアーキテクチャを提案する。
提案手法は,不安定なバーガース型偏微分方程式 (pde) の安定化と,6自由度 (6dof) 無人航空機 (uav) の高度・コース追跡という2つの高次元非線形最適制御問題の数値シミュレーションにより,標準nnフィードバックコントローラと比較した。
シミュレーションにより,提案アーキテクチャは少なくとも局所的に安定しているのに対して,標準NNは十分に訓練しても動的に安定できないことが示された。
さらに、提案するコントローラは、テストにおいてほぼ最適であることが判明した。
関連論文リスト
- Safety Filter Design for Neural Network Systems via Convex Optimization [35.87465363928146]
ニューラルネットワーク(NN)システムの安全性を確保するために,凸最適化に依存する新しい安全フィルタを提案する。
非線形振り子システムにおいて,提案手法の有効性を数値的に示す。
論文 参考訳(メタデータ) (2023-08-16T01:30:13Z) - Backward Reachability Analysis of Neural Feedback Loops: Techniques for
Linear and Nonlinear Systems [59.57462129637796]
本稿では,ニューラルネットワークを用いた閉ループシステムの安全性検証のための後方到達性アプローチを提案する。
フィードバックループにおけるNNの存在は、その活性化関数の非線形性や、NNモデルは一般に可逆的ではないため、ユニークな問題セットを示す。
フィードフォワードNNで表される制御ポリシを持つ線形系と非線形系のBP過近似を計算するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-28T13:17:28Z) - Distributed neural network control with dependability guarantees: a
compositional port-Hamiltonian approach [0.0]
大規模なサイバー物理システムは、制御ポリシーが分散されていること、すなわち、ローカルなリアルタイム測定と近隣エージェントとの通信にのみ依存することを要求する。
最近の研究でニューラルネットワーク(NN)分散コントローラのトレーニングが提案されている。
NNコントローラの主な課題は、トレーニング中と後、すなわちクローズドループシステムは不安定であり、勾配の消失と爆発によってトレーニングが失敗する可能性があることである。
論文 参考訳(メタデータ) (2021-12-16T17:37:11Z) - Neural network optimal feedback control with enhanced closed loop
stability [3.0981875303080795]
近年の研究では、教師あり学習は高次元非線形力学系のための最適フィードバックコントローラを設計するための有効なツールであることが示されている。
しかし、これらのニューラルネットワーク(NN)コントローラの挙動はまだよく理解されていない。
本稿では,NNコントローラがシステムの安定化に有効であることを示すために,数値シミュレーションを用いた。
論文 参考訳(メタデータ) (2021-09-15T17:59:20Z) - Robust Stability of Neural-Network Controlled Nonlinear Systems with
Parametric Variability [2.0199917525888895]
ニューラルネットワーク制御非線形システムの安定性と安定化性の理論を考案する。
このような頑健な安定化NNコントローラの計算には、安定性保証トレーニング(SGT)も提案されている。
論文 参考訳(メタデータ) (2021-09-13T05:09:30Z) - Recurrent Neural Network Controllers Synthesis with Stability Guarantees
for Partially Observed Systems [6.234005265019845]
本稿では、不確実な部分観測システムのための動的制御系として、リカレントニューラルネットワーク(RNN)の重要なクラスを考える。
本稿では、再パラメータ化空間における安定性条件を反復的に強制する計画的ポリシー勾配法を提案する。
数値実験により,本手法は,より少ないサンプルを用いて制御器の安定化を学習し,政策勾配よりも高い最終性能を達成することを示す。
論文 参考訳(メタデータ) (2021-09-08T18:21:56Z) - On the Stability of Nonlinear Receding Horizon Control: A Geometric
Perspective [72.7951562665449]
産業における非線形回帰制御(RHC)戦略の広範な採用には30年以上がかかる。
本稿では,グローバル・ジオメトリの役割を理解するための第一歩として,グローバル・ベース・コントロールの役割について述べる。
論文 参考訳(メタデータ) (2021-03-27T22:59:37Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。