論文の概要: Deep Koopman Operator with Control for Nonlinear Systems
- arxiv url: http://arxiv.org/abs/2202.08004v1
- Date: Wed, 16 Feb 2022 11:40:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-17 22:08:01.758572
- Title: Deep Koopman Operator with Control for Nonlinear Systems
- Title(参考訳): 非線形系に対する制御付きディープクープマン演算子
- Authors: Haojie Shi, Max Q.H. Meng
- Abstract要約: そこで我々は,Koopman組込み関数とKoopman Operatorを学習するためのエンドツーエンドのディープラーニングフレームワークを提案する。
まず、ニューラルネットワークを用いて埋め込み関数とクープマン演算子をパラメータ化し、Kステップ損失関数でエンドツーエンドに学習する。
次に,制御入力の非線形性をモデル化するために,非線形状態依存制御項を符号化する補助制御ネットワークを設計する。
- 参考スコア(独自算出の注目度): 44.472875714432504
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently Koopman operator has become a promising data-driven tool to
facilitate real-time control for unknown nonlinear systems. It maps nonlinear
systems into equivalent linear systems in embedding space, ready for real-time
linear control methods. However, designing an appropriate Koopman embedding
function remains a challenging task. Furthermore, most Koopman-based algorithms
only consider nonlinear systems with linear control input, resulting in lousy
prediction and control performance when the system is fully nonlinear with the
control input. In this work, we propose an end-to-end deep learning framework
to learn the Koopman embedding function and Koopman Operator together to
alleviate such difficulties. We first parameterize the embedding function and
Koopman Operator with the neural network and train them end-to-end with the
K-steps loss function. We then design an auxiliary control network to encode
the nonlinear state-dependent control term to model the nonlinearity in control
input. For linear control, this encoded term is considered the new control
variable instead, ensuring the linearity of the embedding space. Then we deploy
Linear Quadratic Regulator (LQR) on the linear embedding space to derive the
optimal control policy and decode the actual control input from the control
net. Experimental results demonstrate that our approach outperforms other
existing methods, reducing the prediction error by order-of-magnitude and
achieving superior control performance in several nonlinear dynamic systems
like damping pendulum, CartPole, and 7 Dof robotic manipulator.
- Abstract(参考訳): 近年、koopman演算子は未知非線形システムのリアルタイム制御を容易にする有望なデータ駆動ツールとなっている。
非線形系を埋め込み空間における等価線型系にマッピングし、リアルタイム線形制御法に備える。
しかし、適切なクープマン埋め込み関数を設計することは難しい課題である。
さらに、多くのkoopmanベースのアルゴリズムは線形制御入力を持つ非線形システムのみを考慮し、システムが制御入力と完全に非線形である場合の予測と制御性能が低くなる。
本研究では,Koopman組込み関数とKoopman Operatorを併用して学習し,その難しさを軽減するためのエンドツーエンドディープラーニングフレームワークを提案する。
まず,埋め込み関数とkoopman演算子をニューラルネットワークでパラメータ化し,kステップ損失関数を用いてエンドツーエンドにトレーニングする。
次に,非線形状態依存制御項を符号化し,制御入力の非線形性をモデル化する補助制御ネットワークを設計する。
線形制御では、この符号化項は代わりに新しい制御変数と見なされ、埋め込み空間の線型性を保証する。
次に、線形埋め込み空間に線形擬似レギュレータ(LQR)を配置し、最適制御ポリシーを導出し、制御ネットから実際の制御入力を復号する。
実験の結果, 振子, カートポール, 7自由度ロボットマニピュレータなどの非線形力学系において, 従来の手法よりも優れており, 桁数による予測誤差を低減し, 制御性能に優れることがわかった。
関連論文リスト
- Nonparametric Control-Koopman Operator Learning: Flexible and Scalable Models for Prediction and Control [2.7784144651669704]
非線形制御-アフィン系のクープマン演算子表現を学習するための非パラメトリックフレームワークを提案する。
また、ランダムなプロジェクションを活用することにより、制御クープマン作用素推定器のスケーラビリティも向上する。
予測タスクと制御タスクの両方において,新しいcKORアプローチの有効性を実証した。
論文 参考訳(メタデータ) (2024-05-12T15:46:52Z) - Computationally Efficient Data-Driven Discovery and Linear
Representation of Nonlinear Systems For Control [0.0]
この研究は、制御のための非線形システムのシステム同定と線形化のためのクープマン作用素理論を用いたデータ駆動型フレームワークの開発に焦点をあてる。
提案手法は, オートエンコーダのベースラインよりも効率よく, 精度が高いことを示す。
論文 参考訳(メタデータ) (2023-09-08T02:19:14Z) - Differentially Flat Learning-based Model Predictive Control Using a
Stability, State, and Input Constraining Safety Filter [10.52705437098686]
学習に基づく最適制御アルゴリズムは、過去の軌跡データとシステムダイナミクスの学習モデルを用いて未知のシステムを制御する。
本稿では、微分平坦性を利用して、最先端の学習ベースコントローラに類似した性能を実現する非線形制御器を提案する。
論文 参考訳(メタデータ) (2023-07-20T02:42:23Z) - Towards Data-driven LQR with KoopmanizingFlows [8.133902705930327]
本稿では,線形時間不変モデル(LTI)を連続時間非自律非線形力学のクラスで学習するための新しいフレームワークを提案する。
我々は、有意な持ち上げ座標を同時に学習しながら、制御において線形なクープマン作用素の有限表現を学習する。
論文 参考訳(メタデータ) (2022-01-27T17:02:03Z) - Neural Koopman Lyapunov Control [0.0]
データから安定化可能な双線形制御系とその関連する可観測物を特定し,構築するためのフレームワークを提案する。
提案手法は、未知のダイナミクスを持つ非線形制御系に対して、大域的安定性の証明可能な保証を提供する。
論文 参考訳(メタデータ) (2022-01-13T17:38:09Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Improper Learning for Non-Stochastic Control [78.65807250350755]
逆方向の摂動, 逆方向に選択された凸損失関数, 部分的に観察された状態を含む, 未知の線形力学系を制御することの問題点を考察する。
このパラメトリゼーションにオンライン降下を適用することで、大規模なクローズドループポリシーに対してサブリニア後悔を実現する新しいコントローラが得られる。
我々の境界は、線形力学コントローラの安定化と競合する非確率的制御設定における最初のものである。
論文 参考訳(メタデータ) (2020-01-25T02:12:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。