論文の概要: A Guaranteed-Stable Neural Network Approach for Optimal Control of Nonlinear Systems
- arxiv url: http://arxiv.org/abs/2501.17333v1
- Date: Tue, 28 Jan 2025 22:55:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-30 15:53:05.547850
- Title: A Guaranteed-Stable Neural Network Approach for Optimal Control of Nonlinear Systems
- Title(参考訳): 非線形システムの最適制御のための保証安定ニューラルネットワークアプローチ
- Authors: Anran Li, John P. Swensen, Mehdi Hosseinzadeh,
- Abstract要約: 非線形システムの最適制御に対する有望なアプローチは、システムを反復線形化し、最適制御入力を決定するために各タイミングで最適化問題を解くことである。
このアプローチはオンライン最適化に依存するため、計算コストがかかるため、限られた計算資源を持つシステムでは非現実的である。
この問題の潜在的な解決策の1つは、ニューラルネットワーク(NN)を制御ループに組み込むことである。
- 参考スコア(独自算出の注目度): 3.5000297213981653
- License:
- Abstract: A promising approach to optimal control of nonlinear systems involves iteratively linearizing the system and solving an optimization problem at each time instant to determine the optimal control input. Since this approach relies on online optimization, it can be computationally expensive, and thus unrealistic for systems with limited computing resources. One potential solution to this issue is to incorporate a Neural Network (NN) into the control loop to emulate the behavior of the optimal control scheme. Ensuring stability and reference tracking in the resulting NN-based closed-loop system requires modifications to the primary optimization problem. These modifications often introduce non-convexity and nonlinearity with respect to the decision variables, which may surpass the capabilities of existing solvers and complicate the generation of the training dataset. To address this issue, this paper develops a Neural Optimization Machine (NOM) to solve the resulting optimization problems. The central concept of a NOM is to transform the optimization challenges into the problem of training a NN. Rigorous proofs demonstrate that when a NN trained on data generated by the NOM is used in the control loop, all signals remain bounded and the system states asymptotically converge to a neighborhood around the desired equilibrium point, with a tunable proximity threshold. Simulation and experimental studies are provided to illustrate the effectiveness of the proposed methodology.
- Abstract(参考訳): 非線形システムの最適制御に対する有望なアプローチは、システムを反復線形化し、最適制御入力を決定するために各タイミングで最適化問題を解くことである。
このアプローチはオンライン最適化に依存するため、計算コストがかかるため、限られた計算資源を持つシステムでは非現実的である。
この問題の潜在的な解決策の1つは、最適制御スキームの振る舞いをエミュレートするために、ニューラルネットワーク(NN)を制御ループに組み込むことである。
NNベースのクローズドループシステムにおいて、安定性と参照追跡を保証するためには、主最適化問題を修正する必要がある。
これらの修正は、既存の問題解決者の能力を超え、トレーニングデータセットの生成を複雑にする可能性がある決定変数に関して、非凸性や非線形性をもたらすことが多い。
この問題に対処するために,ニューラルネットワーク最適化マシン(NOM)を開発し,結果の最適化問題を解く。
NOMの中心的な概念は、最適化の課題をNNをトレーニングする問題に変換することである。
厳密な証明は、NOMによって生成されたデータに基づいて訓練されたNNが制御ループで使用されるとき、全ての信号は有界のままであり、系状態は漸近的に所望の平衡点付近に収束し、調整可能な近接閾値を持つことを示した。
提案手法の有効性を説明するため,シミュレーションおよび実験的検討を行った。
関連論文リスト
- Parameter-Adaptive Approximate MPC: Tuning Neural-Network Controllers without Retraining [50.00291020618743]
この研究は、大規模なデータセットを再計算し、再トレーニングすることなくオンラインチューニングが可能な、新しいパラメータ適応型AMPCアーキテクチャを導入している。
資源制約の厳しいマイクロコントローラ(MCU)を用いた2種類の実カートポールシステムの揺らぎを制御し,パラメータ適応型AMPCの有効性を示す。
これらの貢献は、現実世界のシステムにおけるAMPCの実践的応用に向けた重要な一歩である。
論文 参考訳(メタデータ) (2024-04-08T20:02:19Z) - Approximate non-linear model predictive control with safety-augmented neural networks [7.670727843779155]
本稿では、ニューラルネットワーク(NN)によるモデル予測制御(MPC)制御の近似を行い、高速なオンライン評価を実現する。
我々は,近似不正確性にもかかわらず,収束性や制約満足度を決定論的に保証する安全性向上を提案する。
論文 参考訳(メタデータ) (2023-04-19T11:27:06Z) - Neural ODEs as Feedback Policies for Nonlinear Optimal Control [1.8514606155611764]
ニューラルネットワークをパラメータ化した微分方程式として連続時間力学をモデル化するために、ニューラル常微分方程式(ニューラルODE)を用いる。
本稿では,一般非線形最適制御問題の解法としてニューラル・オードとして提案するニューラル・コントロール・ポリシーを提案する。
論文 参考訳(メタデータ) (2022-10-20T13:19:26Z) - Backward Reachability Analysis of Neural Feedback Loops: Techniques for
Linear and Nonlinear Systems [59.57462129637796]
本稿では,ニューラルネットワークを用いた閉ループシステムの安全性検証のための後方到達性アプローチを提案する。
フィードバックループにおけるNNの存在は、その活性化関数の非線形性や、NNモデルは一般に可逆的ではないため、ユニークな問題セットを示す。
フィードフォワードNNで表される制御ポリシを持つ線形系と非線形系のBP過近似を計算するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-28T13:17:28Z) - High-dimensional Bayesian Optimization Algorithm with Recurrent Neural
Network for Disease Control Models in Time Series [1.9371782627708491]
本稿では,リカレントニューラルネットワークを組み合わせた高次元ベイズ最適化アルゴリズムを提案する。
提案したRNN-BOアルゴリズムは,低次元空間における最適制御問題を解くことができる。
また、RNN層の異なる数の影響や、ソリューションの品質と関連する計算努力のトレードオフに対する訓練のエポックスについても論じる。
論文 参考訳(メタデータ) (2022-01-01T08:40:17Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Neural Contraction Metrics for Robust Estimation and Control: A Convex
Optimization Approach [6.646482960350819]
本稿では,ニューラル・コントラクト・メトリック(NCM)の概念を用いて,ロバストな非線形推定と制御のための新しいディープラーニングベースのフレームワークを提案する。
NCMは、最適な収縮距離を大域的に近似するために、ディープロング短期記憶リカレントニューラルネットワークを使用する。
そこで本稿では,NCMを用いた非線形システムの最適推定器と制御器の設計について述べる。
論文 参考訳(メタデータ) (2020-06-08T05:29:38Z) - Neural Control Variates [71.42768823631918]
ニューラルネットワークの集合が、積分のよい近似を見つけるという課題に直面していることを示す。
理論的に最適な分散最小化損失関数を導出し、実際に安定したオンライントレーニングを行うための代替の複合損失を提案する。
具体的には、学習した光場近似が高次バウンスに十分な品質であることを示し、誤差補正を省略し、無視可能な可視バイアスのコストでノイズを劇的に低減できることを示した。
論文 参考訳(メタデータ) (2020-06-02T11:17:55Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Loss landscapes and optimization in over-parameterized non-linear
systems and neural networks [20.44438519046223]
広域ニューラルネットワークがPL$*$条件を満たすことを示し、(S)GD収束を大域最小値に説明する。
広域ニューラルネットワークがPL$*$条件を満たすことを示し、(S)GD収束を大域最小値に説明する。
論文 参考訳(メタデータ) (2020-02-29T17:18:28Z) - Optimizing Wireless Systems Using Unsupervised and
Reinforced-Unsupervised Deep Learning [96.01176486957226]
無線ネットワークにおけるリソース割り当てとトランシーバーは、通常最適化問題の解決によって設計される。
本稿では,変数最適化と関数最適化の両問題を解くための教師なし・教師なし学習フレームワークを紹介する。
論文 参考訳(メタデータ) (2020-01-03T11:01:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。