論文の概要: Nonparametric Control Koopman Operators
- arxiv url: http://arxiv.org/abs/2405.07312v3
- Date: Tue, 04 Mar 2025 09:09:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 12:13:33.492693
- Title: Nonparametric Control Koopman Operators
- Title(参考訳): 非パラメトリック制御クープマン演算子
- Authors: Petar Bevanda, Bas Driessen, Lucian Cristian Iacob, Stefan Sosnowski, Roland Tóth, Sandra Hirche,
- Abstract要約: 本稿では、明示的な辞書や入力パラメトリゼーションのないカーネルヒルベルト空間(RKHS)の再生における制御系のための新しいクープマン演算子表現フレームワークを提案する。
異なるモデル表現の基本的な等価性を確立することにより、制御系演算子学習と無限次元回帰のギャップを埋めることができる。
- 参考スコア(独自算出の注目度): 3.9393118740111084
- License:
- Abstract: This paper presents a novel Koopman (composition) operator representation framework for control systems in reproducing kernel Hilbert spaces (RKHSs) that is free of explicit dictionary or input parametrizations. By establishing fundamental equivalences between different model representations, we are able to close the gap of control system operator learning and infinite-dimensional regression, enabling various empirical estimators and the connection to well-understood learning theory in RKHSs under one unified framework. As a consequence, our proposed framework allows for arbitrary accurate finite-rank approximations in infinite-dimensional spaces and leads to finite-dimensional predictors without apriori restrictions to a finite span of functions or inputs. To enable applications to high-dimensional control systems, we improve the scalability of our proposed control Koopman operator estimates by utilizing sketching techniques. Numerical experiments demonstrate superior prediction accuracy compared to bilinear EDMD, especially in high dimensions. Finally, we show that our learned models are readily interfaced with linear-parameter-varying techniques for model predictive control.
- Abstract(参考訳): 本稿では、明示的な辞書や入力パラメトリゼーションのないカーネルヒルベルト空間(RKHS)の再生における制御系のための新しいクープマン演算子表現フレームワークを提案する。
異なるモデル表現の基本的な等価性を確立することにより、制御系演算子学習と無限次元回帰のギャップを埋めることができ、様々な経験的推定器とRKHSにおけるよく理解された学習理論への接続を1つの統一的な枠組みの下で実現できる。
その結果、提案するフレームワークは、無限次元空間における任意の正確な有限ランク近似を可能にし、有限次元の関数や入力に対するアプリオリ制約を伴わない有限次元予測子を導出する。
高次元制御システムへの応用を実現するため,スケッチ技術を用いて提案した制御演算子推定値のスケーラビリティを向上する。
数値実験では、特に高次元において、双線形EDMDと比較して予測精度が優れていることが示されている。
最後に,学習したモデルは,モデル予測制御のための線形パラメータ変化技術と容易にインターフェース可能であることを示す。
関連論文リスト
- Kernel-Based Optimal Control: An Infinitesimal Generator Approach [3.7411439050030393]
無限次元再生ヒルベルト核空間内での無限小生成学習を用いた非線形システムの最適制御手法を提案する。
我々の学習フレームワークは、システム力学とステージコスト関数のデータサンプルを利用しており、制御のペナルティと制約しか提供されていない。
このアプローチが現代的な凸作用素-理論的ハミルトン・ヤコビ・ベルマン再帰とシームレスに統合されることを示し、最適制御問題に対するデータ駆動解を可能にする。
論文 参考訳(メタデータ) (2024-12-02T15:08:55Z) - Deep Koopman Operator with Control for Nonlinear Systems [44.472875714432504]
そこで我々は,Koopman組込み関数とKoopman Operatorを学習するためのエンドツーエンドのディープラーニングフレームワークを提案する。
まず、ニューラルネットワークを用いて埋め込み関数とクープマン演算子をパラメータ化し、Kステップ損失関数でエンドツーエンドに学習する。
次に,制御入力の非線形性をモデル化するために,非線形状態依存制御項を符号化する補助制御ネットワークを設計する。
論文 参考訳(メタデータ) (2022-02-16T11:40:36Z) - Towards Data-driven LQR with KoopmanizingFlows [8.133902705930327]
本稿では,線形時間不変モデル(LTI)を連続時間非自律非線形力学のクラスで学習するための新しいフレームワークを提案する。
我々は、有意な持ち上げ座標を同時に学習しながら、制御において線形なクープマン作用素の有限表現を学習する。
論文 参考訳(メタデータ) (2022-01-27T17:02:03Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Discrete-time Contraction-based Control of Nonlinear Systems with
Parametric Uncertainties using Neural Networks [6.804154699470765]
本研究は,ニューラルネットワークを用いた離散時間収縮解析と制御へのアプローチを展開する。
この方法論は、ニューラルネットワークをトレーニングして、収縮メトリックとフィードバックゲインを学習する。
結果として得られる収縮ベースのコントローラは、訓練されたニューラルネットワークを組み込み、時間変動参照の効率的な追跡を達成することができる。
論文 参考訳(メタデータ) (2021-05-12T05:07:34Z) - Data-driven Koopman Operators for Model-based Shared Control of
Human-Machine Systems [66.65503164312705]
本稿では,データ駆動型共有制御アルゴリズムを提案する。
ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。
モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
論文 参考訳(メタデータ) (2020-06-12T14:14:07Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z) - Technical Report: Adaptive Control for Linearizable Systems Using
On-Policy Reinforcement Learning [41.24484153212002]
本稿では,未知システムに対するフィードバック線形化に基づくトラッキング制御系を適応的に学習するフレームワークを提案する。
学習した逆モデルがすべての時点において可逆である必要はない。
二重振り子の模擬例は、提案された理論の有用性を示している。
論文 参考訳(メタデータ) (2020-04-06T15:50:31Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。