論文の概要: Neural Koopman Lyapunov Control
- arxiv url: http://arxiv.org/abs/2201.05098v1
- Date: Thu, 13 Jan 2022 17:38:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-14 15:07:52.431811
- Title: Neural Koopman Lyapunov Control
- Title(参考訳): ニューラル・クープマン・リアプノフ制御
- Authors: Vrushabh Zinage, Efstathios Bakolas
- Abstract要約: データから安定化可能な双線形制御系とその関連する可観測物を特定し,構築するためのフレームワークを提案する。
提案手法は、未知のダイナミクスを持つ非線形制御系に対して、大域的安定性の証明可能な保証を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning and synthesizing stabilizing controllers for unknown nonlinear
systems is a challenging problem for real-world and industrial applications.
Koopman operator theory allow one to analyze nonlinear systems through the lens
of linear systems and nonlinear control systems through the lens of bilinear
control systems. The key idea of these methods, lies in the transformation of
the coordinates of the nonlinear system into the Koopman observables, which are
coordinates that allow the representation of the original system (control
system) as a higher dimensional linear (bilinear control) system. However, for
nonlinear control systems, the bilinear control model obtained by applying
Koopman operator based learning methods is not necessarily stabilizable and
therefore, the existence of a stabilizing feedback control is not guaranteed
which is crucial for many real world applications. Simultaneous identification
of these stabilizable Koopman based bilinear control systems as well as the
associated Koopman observables is still an open problem. In this paper, we
propose a framework to identify and construct these stabilizable bilinear
models and its associated observables from data by simultaneously learning a
bilinear Koopman embedding for the underlying unknown nonlinear control system
as well as a Control Lyapunov Function (CLF) for the Koopman based bilinear
model using a learner and falsifier. Our proposed approach thereby provides
provable guarantees of global asymptotic stability for the nonlinear control
systems with unknown dynamics. Numerical simulations are provided to validate
the efficacy of our proposed class of stabilizing feedback controllers for
unknown nonlinear systems.
- Abstract(参考訳): 未知の非線形システムに対する学習および安定化コントローラの合成は、実世界の産業アプリケーションにとって難しい問題である。
クープマン作用素理論は、非線形系のレンズと非線形制御系のレンズを通して非線形系の解析を可能にする。
これらの方法の鍵となる考え方は、非線形系の座標をクープマン可観測子に変換することであり、これは元の系(制御系)を高次元線型(双線型制御)系として表現できる座標である。
しかし、非線形制御系では、クープマン演算子に基づく学習法を適用した双線形制御モデルは必ずしも安定化できないため、多くの実世界のアプリケーションにとって重要な安定化フィードバック制御の存在は保証されない。
これらの安定化可能なクープマンベースの双線型制御系と関連するクープマン可観測系の同時同定は依然として未解決の問題である。
本稿では,これらの安定化可能な双線形モデルとその関連可観測体を,基礎となる未知の非線形制御系に対する双線形クープマン埋め込みを同時に学習することにより,データから同定し,構築する枠組みと,学習者およびファルシファイアを用いた二線形モデルに対する制御リャプノフ関数(CLF)を提案する。
提案手法は,未知ダイナミクスを持つ非線形制御系に対する大域的漸近安定性の証明可能な保証を提供する。
提案する非線形系に対する安定化型フィードバックコントローラの有効性を検証するために数値シミュレーションを行った。
関連論文リスト
- Identification For Control Based on Neural Networks: Approximately Linearizable Models [42.15267357325546]
本研究では,非線形システムの効率的な制御設計と安定性解析のための制御指向同定手法を提案する。
ニューラルネットワークは離散時間非線形状態空間モデルを特定し、時間領域の入力出力挙動を近似する。
ネットワークは、同定されたモデルがフィードバックによってほぼ線形化可能であるように構成され、制御則が学習段階から自明に従うことを保証する。
論文 参考訳(メタデータ) (2024-09-24T08:31:22Z) - Learning Control-Oriented Dynamical Structure from Data [25.316358215670274]
一般非線形制御アフィン系に対する状態依存非線形トラッキングコントローラの定式化について論じる。
安定軌跡追跡における学習版の有効性を実証的に実証した。
論文 参考訳(メタデータ) (2023-02-06T02:01:38Z) - Neural Lyapunov Control of Unknown Nonlinear Systems with Stability
Guarantees [4.786698731084036]
本稿では,未知の非線形システムをニューラルネットワークで安定化させ,ニューラルリアプノフ関数を学習するための学習フレームワークを提案する。
未知の非線形システムに対する閉ループ安定性の観点から,提案手法の理論的保証を提供する。
論文 参考訳(メタデータ) (2022-06-04T05:57:31Z) - KCRL: Krasovskii-Constrained Reinforcement Learning with Guaranteed
Stability in Nonlinear Dynamical Systems [66.9461097311667]
形式的安定性を保証するモデルに基づく強化学習フレームワークを提案する。
提案手法は,特徴表現を用いて信頼区間までシステムダイナミクスを学習する。
我々は、KCRLが、基礎となる未知のシステムとの有限数の相互作用において安定化ポリシーを学ぶことが保証されていることを示す。
論文 参考訳(メタデータ) (2022-06-03T17:27:04Z) - Deep Koopman Operator with Control for Nonlinear Systems [44.472875714432504]
そこで我々は,Koopman組込み関数とKoopman Operatorを学習するためのエンドツーエンドのディープラーニングフレームワークを提案する。
まず、ニューラルネットワークを用いて埋め込み関数とクープマン演算子をパラメータ化し、Kステップ損失関数でエンドツーエンドに学習する。
次に,制御入力の非線形性をモデル化するために,非線形状態依存制御項を符号化する補助制御ネットワークを設計する。
論文 参考訳(メタデータ) (2022-02-16T11:40:36Z) - Learning over All Stabilizing Nonlinear Controllers for a
Partially-Observed Linear System [4.3012765978447565]
線形力学系に対する非線形出力フィードバックコントローラのパラメータ化を提案する。
提案手法は, 制約を満たすことなく, 部分的に観測可能な線形力学系の閉ループ安定性を保証する。
論文 参考訳(メタデータ) (2021-12-08T10:43:47Z) - Supervised DKRC with Images for Offline System Identification [77.34726150561087]
現代の力学系はますます非線形で複雑なものになりつつある。
予測と制御のためのコンパクトで包括的な表現でこれらのシステムをモデル化するフレームワークが必要である。
本手法は,教師付き学習手法を用いてこれらの基礎関数を学習する。
論文 参考訳(メタデータ) (2021-09-06T04:39:06Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Active Learning for Nonlinear System Identification with Guarantees [102.43355665393067]
状態遷移が既知の状態-作用対の特徴埋め込みに線形に依存する非線形力学系のクラスについて検討する。
そこで本稿では, トラジェクティブ・プランニング, トラジェクティブ・トラッキング, システムの再推定という3つのステップを繰り返すことで, この問題を解決するためのアクティブ・ラーニング・アプローチを提案する。
本手法は, 非線形力学系を標準線形回帰の統計速度と同様, パラメトリック速度で推定する。
論文 参考訳(メタデータ) (2020-06-18T04:54:11Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。