論文の概要: Neural Network Optimal Feedback Control with Guaranteed Local Stability
- arxiv url: http://arxiv.org/abs/2205.00394v1
- Date: Sun, 1 May 2022 04:23:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 16:31:03.696524
- Title: Neural Network Optimal Feedback Control with Guaranteed Local Stability
- Title(参考訳): 局所安定性を保証したニューラルネットワーク最適フィードバック制御
- Authors: Tenavi Nakamura-Zimmerer and Qi Gong and Wei Kang
- Abstract要約: テスト精度の高いニューラルネットワーク(NN)コントローラでは,動的システムを局所的に安定化させることができないことを示す。
提案するNNアーキテクチャは,最適化されたフィードバックポリシを学習するための半言語近似能力を維持しながら,局所的な安定性を保証する。
- 参考スコア(独自算出の注目度): 2.8725913509167156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent research shows that deep learning can be an effective tool for
designing optimal feedback controllers for high-dimensional nonlinear dynamic
systems. But the behavior of these neural network (NN) controllers is still not
well understood. In particular, some NNs with high test accuracy can fail to
even locally stabilize the dynamic system. To address this challenge we propose
several novel NN architectures, which we show guarantee local stability while
retaining the semi-global approximation capacity to learn the optimal feedback
policy. The proposed architectures are compared against standard NN feedback
controllers through numerical simulations of two high-dimensional nonlinear
optimal control problems (OCPs): stabilization of an unstable Burgers-type
partial differential equation (PDE), and altitude and course tracking for a six
degree-of-freedom (6DoF) unmanned aerial vehicle (UAV). The simulations
demonstrate that standard NNs can fail to stabilize the dynamics even when
trained well, while the proposed architectures are always at least locally
stable. Moreover, the proposed controllers are found to be near-optimal in
testing.
- Abstract(参考訳): 近年の研究では、高次元非線形力学系のための最適フィードバックコントローラの設計にディープラーニングが有効であることが示されている。
しかし、これらのニューラルネットワーク(NN)コントローラの挙動はまだよく理解されていない。
特に、テスト精度の高いいくつかのNNは、動的システムを局所的に安定化させることができない。
この課題に対処するために,我々は,準グローバル近似容量を保持しながら局所安定性を保証し,最適フィードバックポリシーを学習する,いくつかの新しいnnアーキテクチャを提案する。
提案手法は,不安定なバーガース型偏微分方程式 (pde) の安定化と,6自由度 (6dof) 無人航空機 (uav) の高度・コース追跡という2つの高次元非線形最適制御問題の数値シミュレーションにより,標準nnフィードバックコントローラと比較した。
シミュレーションにより,提案アーキテクチャは少なくとも局所的に安定しているのに対して,標準NNは十分に訓練しても動的に安定できないことが示された。
さらに、提案するコントローラは、テストにおいてほぼ最適であることが判明した。
関連論文リスト
- Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。
我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。
SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-06-10T21:44:52Z) - Lyapunov-stable Neural Control for State and Output Feedback: A Novel Formulation [67.63756749551924]
学習ベースのニューラルネットワーク(NN)制御ポリシは、ロボット工学と制御の幅広いタスクにおいて、印象的な経験的パフォーマンスを示している。
非線形力学系を持つNNコントローラのトラクション領域(ROA)に対するリアプノフ安定性の保証は困難である。
我々は、高速な経験的ファルシフィケーションと戦略的正則化を用いて、Lyapunov証明書とともにNNコントローラを学習するための新しいフレームワークを実証する。
論文 参考訳(メタデータ) (2024-04-11T17:49:15Z) - Safety Filter Design for Neural Network Systems via Convex Optimization [35.87465363928146]
ニューラルネットワーク(NN)システムの安全性を確保するために,凸最適化に依存する新しい安全フィルタを提案する。
非線形振り子システムにおいて,提案手法の有効性を数値的に示す。
論文 参考訳(メタデータ) (2023-08-16T01:30:13Z) - Backward Reachability Analysis of Neural Feedback Loops: Techniques for
Linear and Nonlinear Systems [59.57462129637796]
本稿では,ニューラルネットワークを用いた閉ループシステムの安全性検証のための後方到達性アプローチを提案する。
フィードバックループにおけるNNの存在は、その活性化関数の非線形性や、NNモデルは一般に可逆的ではないため、ユニークな問題セットを示す。
フィードフォワードNNで表される制御ポリシを持つ線形系と非線形系のBP過近似を計算するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-28T13:17:28Z) - Distributed neural network control with dependability guarantees: a
compositional port-Hamiltonian approach [0.0]
大規模なサイバー物理システムは、制御ポリシーが分散されていること、すなわち、ローカルなリアルタイム測定と近隣エージェントとの通信にのみ依存することを要求する。
最近の研究でニューラルネットワーク(NN)分散コントローラのトレーニングが提案されている。
NNコントローラの主な課題は、トレーニング中と後、すなわちクローズドループシステムは不安定であり、勾配の消失と爆発によってトレーニングが失敗する可能性があることである。
論文 参考訳(メタデータ) (2021-12-16T17:37:11Z) - Neural network optimal feedback control with enhanced closed loop
stability [3.0981875303080795]
近年の研究では、教師あり学習は高次元非線形力学系のための最適フィードバックコントローラを設計するための有効なツールであることが示されている。
しかし、これらのニューラルネットワーク(NN)コントローラの挙動はまだよく理解されていない。
本稿では,NNコントローラがシステムの安定化に有効であることを示すために,数値シミュレーションを用いた。
論文 参考訳(メタデータ) (2021-09-15T17:59:20Z) - Robust Stability of Neural-Network Controlled Nonlinear Systems with
Parametric Variability [2.0199917525888895]
ニューラルネットワーク制御非線形システムの安定性と安定化性の理論を考案する。
このような頑健な安定化NNコントローラの計算には、安定性保証トレーニング(SGT)も提案されている。
論文 参考訳(メタデータ) (2021-09-13T05:09:30Z) - Recurrent Neural Network Controllers Synthesis with Stability Guarantees
for Partially Observed Systems [6.234005265019845]
本稿では、不確実な部分観測システムのための動的制御系として、リカレントニューラルネットワーク(RNN)の重要なクラスを考える。
本稿では、再パラメータ化空間における安定性条件を反復的に強制する計画的ポリシー勾配法を提案する。
数値実験により,本手法は,より少ないサンプルを用いて制御器の安定化を学習し,政策勾配よりも高い最終性能を達成することを示す。
論文 参考訳(メタデータ) (2021-09-08T18:21:56Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。