論文の概要: Nonparametric Control-Koopman Operator Learning: Flexible and Scalable Models for Prediction and Control
- arxiv url: http://arxiv.org/abs/2405.07312v1
- Date: Sun, 12 May 2024 15:46:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-14 15:34:20.399378
- Title: Nonparametric Control-Koopman Operator Learning: Flexible and Scalable Models for Prediction and Control
- Title(参考訳): 非パラメトリック制御-コオプマン演算子学習:予測と制御のための柔軟でスケーラブルなモデル
- Authors: Petar Bevanda, Bas Driessen, Lucian Cristian Iacob, Roland Toth, Stefan Sosnowski, Sandra Hirche,
- Abstract要約: 非線形制御-アフィン系のクープマン演算子表現を学習するための非パラメトリックフレームワークを提案する。
また、ランダムなプロジェクションを活用することにより、制御クープマン作用素推定器のスケーラビリティも向上する。
予測タスクと制御タスクの両方において,新しいcKORアプローチの有効性を実証した。
- 参考スコア(独自算出の注目度): 2.7784144651669704
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Linearity of Koopman operators and simplicity of their estimators coupled with model-reduction capabilities has lead to their great popularity in applications for learning dynamical systems. While nonparametric Koopman operator learning in infinite-dimensional reproducing kernel Hilbert spaces is well understood for autonomous systems, its control system analogues are largely unexplored. Addressing systems with control inputs in a principled manner is crucial for fully data-driven learning of controllers, especially since existing approaches commonly resort to representational heuristics or parametric models of limited expressiveness and scalability. We address the aforementioned challenge by proposing a universal framework via control-affine reproducing kernels that enables direct estimation of a single operator even for control systems. The proposed approach, called control-Koopman operator regression (cKOR), is thus completely analogous to Koopman operator regression of the autonomous case. First in the literature, we present a nonparametric framework for learning Koopman operator representations of nonlinear control-affine systems that does not suffer from the curse of control input dimensionality. This allows for reformulating the infinite-dimensional learning problem in a finite-dimensional space based solely on data without apriori loss of precision due to a restriction to a finite span of functions or inputs as in other approaches. For enabling applications to large-scale control systems, we also enhance the scalability of control-Koopman operator estimators by leveraging random projections (sketching). The efficacy of our novel cKOR approach is demonstrated on both forecasting and control tasks.
- Abstract(参考訳): クープマン作用素の線形性とそれらの推定器の単純さとモデル推論能力は、力学系を学習するアプリケーションにおいて大きな人気をもたらした。
無限次元再生カーネルヒルベルト空間における非パラメトリッククープマン作用素の学習は、自律系においてよく理解されているが、制御系類似性はほとんど探索されていない。
特に既存の手法では、表現的ヒューリスティックスや、限定的な表現性や拡張性を持つパラメトリックモデルを利用することが多いため、制御器の完全なデータ駆動学習には、制御入力によるシステムへの対処が不可欠である。
本稿では,制御系においても単一演算子の直接推定が可能な制御アフィン再生カーネルによるユニバーサルフレームワークを提案することで,上記の課題に対処する。
提案手法は制御・クープマン作用素回帰(英語版)(cKOR)と呼ばれ、自律の場合のクープマン作用素回帰(英語版)(Koopman operator regression)と完全に類似している。
まず、制御入力次元の呪いに苦しむことのない非線形制御アフィン系のクープマン演算子表現を学習するための非パラメトリックフレームワークを提案する。
これにより、有限次元空間における無限次元学習問題を、他のアプローチのように有限な関数や入力に制限されるため、アプリオリの精度を失うことなく、データのみに基づいて再構成することができる。
大規模制御システムへの応用を実現するため,ランダムプロジェクション(スケッチング)を活用して制御クープマン演算子推定器のスケーラビリティを向上させる。
予測タスクと制御タスクの両方において,新しいcKORアプローチの有効性を実証した。
関連論文リスト
- Deep Koopman Operator with Control for Nonlinear Systems [44.472875714432504]
そこで我々は,Koopman組込み関数とKoopman Operatorを学習するためのエンドツーエンドのディープラーニングフレームワークを提案する。
まず、ニューラルネットワークを用いて埋め込み関数とクープマン演算子をパラメータ化し、Kステップ損失関数でエンドツーエンドに学習する。
次に,制御入力の非線形性をモデル化するために,非線形状態依存制御項を符号化する補助制御ネットワークを設計する。
論文 参考訳(メタデータ) (2022-02-16T11:40:36Z) - Towards Data-driven LQR with KoopmanizingFlows [8.133902705930327]
本稿では,線形時間不変モデル(LTI)を連続時間非自律非線形力学のクラスで学習するための新しいフレームワークを提案する。
我々は、有意な持ち上げ座標を同時に学習しながら、制御において線形なクープマン作用素の有限表現を学習する。
論文 参考訳(メタデータ) (2022-01-27T17:02:03Z) - Neural Koopman Lyapunov Control [0.0]
データから安定化可能な双線形制御系とその関連する可観測物を特定し,構築するためのフレームワークを提案する。
提案手法は、未知のダイナミクスを持つ非線形制御系に対して、大域的安定性の証明可能な保証を提供する。
論文 参考訳(メタデータ) (2022-01-13T17:38:09Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Discrete-time Contraction-based Control of Nonlinear Systems with
Parametric Uncertainties using Neural Networks [6.804154699470765]
本研究は,ニューラルネットワークを用いた離散時間収縮解析と制御へのアプローチを展開する。
この方法論は、ニューラルネットワークをトレーニングして、収縮メトリックとフィードバックゲインを学習する。
結果として得られる収縮ベースのコントローラは、訓練されたニューラルネットワークを組み込み、時間変動参照の効率的な追跡を達成することができる。
論文 参考訳(メタデータ) (2021-05-12T05:07:34Z) - Data-driven Koopman Operators for Model-based Shared Control of
Human-Machine Systems [66.65503164312705]
本稿では,データ駆動型共有制御アルゴリズムを提案する。
ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。
モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
論文 参考訳(メタデータ) (2020-06-12T14:14:07Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z) - Technical Report: Adaptive Control for Linearizable Systems Using
On-Policy Reinforcement Learning [41.24484153212002]
本稿では,未知システムに対するフィードバック線形化に基づくトラッキング制御系を適応的に学習するフレームワークを提案する。
学習した逆モデルがすべての時点において可逆である必要はない。
二重振り子の模擬例は、提案された理論の有用性を示している。
論文 参考訳(メタデータ) (2020-04-06T15:50:31Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。