Fugu-MT 論文翻訳(概要): Neural Network Optimal Feedback Control with Guaranteed Local Stability

論文の概要: Neural Network Optimal Feedback Control with Guaranteed Local Stability

arxiv url: http://arxiv.org/abs/2205.00394v1
Date: Sun, 1 May 2022 04:23:24 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-03 16:31:03.696524
Title: Neural Network Optimal Feedback Control with Guaranteed Local Stability
Title（参考訳）: 局所安定性を保証したニューラルネットワーク最適フィードバック制御
Authors: Tenavi Nakamura-Zimmerer and Qi Gong and Wei Kang
Abstract要約: テスト精度の高いニューラルネットワーク(NN)コントローラでは,動的システムを局所的に安定化させることができないことを示す。提案するNNアーキテクチャは,最適化されたフィードバックポリシを学習するための半言語近似能力を維持しながら,局所的な安定性を保証する。
参考スコア（独自算出の注目度）: 2.8725913509167156
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent research shows that deep learning can be an effective tool for designing optimal feedback controllers for high-dimensional nonlinear dynamic systems. But the behavior of these neural network (NN) controllers is still not well understood. In particular, some NNs with high test accuracy can fail to even locally stabilize the dynamic system. To address this challenge we propose several novel NN architectures, which we show guarantee local stability while retaining the semi-global approximation capacity to learn the optimal feedback policy. The proposed architectures are compared against standard NN feedback controllers through numerical simulations of two high-dimensional nonlinear optimal control problems (OCPs): stabilization of an unstable Burgers-type partial differential equation (PDE), and altitude and course tracking for a six degree-of-freedom (6DoF) unmanned aerial vehicle (UAV). The simulations demonstrate that standard NNs can fail to stabilize the dynamics even when trained well, while the proposed architectures are always at least locally stable. Moreover, the proposed controllers are found to be near-optimal in testing.
Abstract（参考訳）: 近年の研究では、高次元非線形力学系のための最適フィードバックコントローラの設計にディープラーニングが有効であることが示されている。しかし、これらのニューラルネットワーク(NN)コントローラの挙動はまだよく理解されていない。特に、テスト精度の高いいくつかのNNは、動的システムを局所的に安定化させることができない。この課題に対処するために,我々は,準グローバル近似容量を保持しながら局所安定性を保証し,最適フィードバックポリシーを学習する,いくつかの新しいnnアーキテクチャを提案する。提案手法は,不安定なバーガース型偏微分方程式 (pde) の安定化と,6自由度 (6dof) 無人航空機 (uav) の高度・コース追跡という2つの高次元非線形最適制御問題の数値シミュレーションにより,標準nnフィードバックコントローラと比較した。シミュレーションにより,提案アーキテクチャは少なくとも局所的に安定しているのに対して,標準NNは十分に訓練しても動的に安定できないことが示された。さらに、提案するコントローラは、テストにおいてほぼ最適であることが判明した。

関連論文リスト

Provably-Stable Neural Network-Based Control of Nonlinear Systems [3.5000297213981653]
NNベースの制御に関する現在の文献は、安定性と追跡性能に関する理論的保証を欠いている。本稿では,アフィン非線形システムのための実測可能なNNベース制御方式を設計するための体系的・包括的手法を提案する。
論文参考訳（メタデータ） (2025-02-01T01:05:06Z)
Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。 SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文参考訳（メタデータ） (2024-06-10T21:44:52Z)
Lyapunov-stable Neural Control for State and Output Feedback: A Novel Formulation [67.63756749551924]
学習ベースのニューラルネットワーク(NN)制御ポリシは、ロボット工学と制御の幅広いタスクにおいて、印象的な経験的パフォーマンスを示している。非線形力学系を持つNNコントローラのトラクション領域(ROA)に対するリアプノフ安定性の保証は困難である。我々は、高速な経験的ファルシフィケーションと戦略的正則化を用いて、Lyapunov証明書とともにNNコントローラを学習するための新しいフレームワークを実証する。
論文参考訳（メタデータ） (2024-04-11T17:49:15Z)
Safety Filter Design for Neural Network Systems via Convex Optimization [35.87465363928146]
ニューラルネットワーク(NN)システムの安全性を確保するために,凸最適化に依存する新しい安全フィルタを提案する。非線形振り子システムにおいて,提案手法の有効性を数値的に示す。
論文参考訳（メタデータ） (2023-08-16T01:30:13Z)
Backward Reachability Analysis of Neural Feedback Loops: Techniques for Linear and Nonlinear Systems [59.57462129637796]
本稿では,ニューラルネットワークを用いた閉ループシステムの安全性検証のための後方到達性アプローチを提案する。フィードバックループにおけるNNの存在は、その活性化関数の非線形性や、NNモデルは一般に可逆的ではないため、ユニークな問題セットを示す。フィードフォワードNNで表される制御ポリシを持つ線形系と非線形系のBP過近似を計算するためのフレームワークを提案する。
論文参考訳（メタデータ） (2022-09-28T13:17:28Z)
Distributed neural network control with dependability guarantees: a compositional port-Hamiltonian approach [0.0]
大規模なサイバー物理システムは、制御ポリシーが分散されていること、すなわち、ローカルなリアルタイム測定と近隣エージェントとの通信にのみ依存することを要求する。最近の研究でニューラルネットワーク(NN)分散コントローラのトレーニングが提案されている。 NNコントローラの主な課題は、トレーニング中と後、すなわちクローズドループシステムは不安定であり、勾配の消失と爆発によってトレーニングが失敗する可能性があることである。
論文参考訳（メタデータ） (2021-12-16T17:37:11Z)
Neural network optimal feedback control with enhanced closed loop stability [3.0981875303080795]
近年の研究では、教師あり学習は高次元非線形力学系のための最適フィードバックコントローラを設計するための有効なツールであることが示されている。しかし、これらのニューラルネットワーク(NN)コントローラの挙動はまだよく理解されていない。本稿では,NNコントローラがシステムの安定化に有効であることを示すために,数値シミュレーションを用いた。
論文参考訳（メタデータ） (2021-09-15T17:59:20Z)
Robust Stability of Neural-Network Controlled Nonlinear Systems with Parametric Variability [2.0199917525888895]
ニューラルネットワーク制御非線形システムの安定性と安定化性の理論を考案する。このような頑健な安定化NNコントローラの計算には、安定性保証トレーニング(SGT)も提案されている。
論文参考訳（メタデータ） (2021-09-13T05:09:30Z)
Recurrent Neural Network Controllers Synthesis with Stability Guarantees for Partially Observed Systems [6.234005265019845]
本稿では、不確実な部分観測システムのための動的制御系として、リカレントニューラルネットワーク(RNN)の重要なクラスを考える。本稿では、再パラメータ化空間における安定性条件を反復的に強制する計画的ポリシー勾配法を提案する。数値実験により,本手法は,より少ないサンプルを用いて制御器の安定化を学習し,政策勾配よりも高い最終性能を達成することを示す。
論文参考訳（メタデータ） (2021-09-08T18:21:56Z)
Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文参考訳（メタデータ） (2020-11-16T17:14:59Z)
Gaussian Process-based Min-norm Stabilizing Controller for Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文参考訳（メタデータ） (2020-11-14T01:27:32Z)
Learning Stabilizing Controllers for Unstable Linear Quadratic Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文参考訳（メタデータ） (2020-06-19T08:58:57Z)
Adaptive Control and Regret Minimization in Linear Quadratic Gaussian (LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。 LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文参考訳（メタデータ） (2020-03-12T19:56:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。