論文の概要: Nonparametric Control-Koopman Operator Learning: Flexible and Scalable Models for Prediction and Control
- arxiv url: http://arxiv.org/abs/2405.07312v1
- Date: Sun, 12 May 2024 15:46:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-05-14 15:34:20.399378
- Title: Nonparametric Control-Koopman Operator Learning: Flexible and Scalable Models for Prediction and Control
- Title(参考訳): 非パラメトリック制御-コオプマン演算子学習:予測と制御のための柔軟でスケーラブルなモデル
- Authors: Petar Bevanda, Bas Driessen, Lucian Cristian Iacob, Roland Toth, Stefan Sosnowski, Sandra Hirche,
- Abstract要約: 非線形制御-アフィン系のクープマン演算子表現を学習するための非パラメトリックフレームワークを提案する。
また、ランダムなプロジェクションを活用することにより、制御クープマン作用素推定器のスケーラビリティも向上する。
予測タスクと制御タスクの両方において,新しいcKORアプローチの有効性を実証した。
- 参考スコア(独自算出の注目度): 2.7784144651669704
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Linearity of Koopman operators and simplicity of their estimators coupled with model-reduction capabilities has lead to their great popularity in applications for learning dynamical systems. While nonparametric Koopman operator learning in infinite-dimensional reproducing kernel Hilbert spaces is well understood for autonomous systems, its control system analogues are largely unexplored. Addressing systems with control inputs in a principled manner is crucial for fully data-driven learning of controllers, especially since existing approaches commonly resort to representational heuristics or parametric models of limited expressiveness and scalability. We address the aforementioned challenge by proposing a universal framework via control-affine reproducing kernels that enables direct estimation of a single operator even for control systems. The proposed approach, called control-Koopman operator regression (cKOR), is thus completely analogous to Koopman operator regression of the autonomous case. First in the literature, we present a nonparametric framework for learning Koopman operator representations of nonlinear control-affine systems that does not suffer from the curse of control input dimensionality. This allows for reformulating the infinite-dimensional learning problem in a finite-dimensional space based solely on data without apriori loss of precision due to a restriction to a finite span of functions or inputs as in other approaches. For enabling applications to large-scale control systems, we also enhance the scalability of control-Koopman operator estimators by leveraging random projections (sketching). The efficacy of our novel cKOR approach is demonstrated on both forecasting and control tasks.
- Abstract(参考訳): クープマン作用素の線形性とそれらの推定器の単純さとモデル推論能力は、力学系を学習するアプリケーションにおいて大きな人気をもたらした。
無限次元再生カーネルヒルベルト空間における非パラメトリッククープマン作用素の学習は、自律系においてよく理解されているが、制御系類似性はほとんど探索されていない。
特に既存の手法では、表現的ヒューリスティックスや、限定的な表現性や拡張性を持つパラメトリックモデルを利用することが多いため、制御器の完全なデータ駆動学習には、制御入力によるシステムへの対処が不可欠である。
本稿では,制御系においても単一演算子の直接推定が可能な制御アフィン再生カーネルによるユニバーサルフレームワークを提案することで,上記の課題に対処する。
提案手法は制御・クープマン作用素回帰(英語版)(cKOR)と呼ばれ、自律の場合のクープマン作用素回帰(英語版)(Koopman operator regression)と完全に類似している。
まず、制御入力次元の呪いに苦しむことのない非線形制御アフィン系のクープマン演算子表現を学習するための非パラメトリックフレームワークを提案する。
これにより、有限次元空間における無限次元学習問題を、他のアプローチのように有限な関数や入力に制限されるため、アプリオリの精度を失うことなく、データのみに基づいて再構成することができる。
大規模制御システムへの応用を実現するため,ランダムプロジェクション(スケッチング)を活用して制御クープマン演算子推定器のスケーラビリティを向上させる。
予測タスクと制御タスクの両方において,新しいcKORアプローチの有効性を実証した。
関連論文リスト
- Training Deep Learning Models with Norm-Constrained LMOs [56.00317694850397]
正規球上の線形最小化オラクル(LMO)を利用する最適化手法について検討する。
この問題の幾何学に適応するためにLMOを用いた新しいアルゴリズム群を提案し, 意外なことに, 制約のない問題に適用可能であることを示す。
論文 参考訳(メタデータ) (2025-02-11T13:10:34Z) - Kernel-Based Optimal Control: An Infinitesimal Generator Approach [3.7411439050030393]
本稿では,非線形システムの最適制御のための演算子理論的手法を提案する。
我々の学習フレームワークは,システムダイナミクスとステージコスト関数のデータサンプルを活用する。
我々は、我々のアプローチが現代の凸作用素-理論的ハミルトン・ヤコビ・ベルマン再帰とシームレスに統合されることを実証する。
論文 参考訳(メタデータ) (2024-12-02T15:08:55Z) - Fundamental operating regimes, hyper-parameter fine-tuning and glassiness: towards an interpretable replica-theory for trained restricted Boltzmann machines [0.0]
本稿では,二つの可視層を持つボルツマンマシンと,単一基底パターンの雑音的現実化からなる乱れのないデータセットによって訓練されたガウス的隠れ層を考える。
本稿では,ネットワーク生成能力を記述するための統計力学フレームワークを開発し,レプリカのトリックを活用し,基礎となる順序パラメータの自己評価を仮定する。
論文 参考訳(メタデータ) (2024-06-14T11:12:00Z) - Random Features Approximation for Control-Affine Systems [6.067043299145924]
制御アフィン構造をキャプチャする非線形特徴表現の2つの新しいクラスを提案する。
提案手法はランダムな特徴(RF)近似を用いて,より少ない計算コストでカーネル手法の表現性を継承する。
論文 参考訳(メタデータ) (2024-06-10T17:54:57Z) - Unsupervised Solution Operator Learning for Mean-Field Games via Sampling-Invariant Parametrizations [7.230928145936957]
我々はMFGソリューション演算子を学習するための新しいフレームワークを開発する。
我々のモデルはMFGインスタンスを入力として取り出し、1つのフォワードパスで解を出力する。
離散化フリーであり、高次元MFGの学習演算子に適している。
論文 参考訳(メタデータ) (2024-01-27T19:07:49Z) - Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - Function-Space Regularization in Neural Networks: A Probabilistic
Perspective [51.133793272222874]
所望の予測関数に関する情報をニューラルネットワークトレーニングに明示的にエンコードできる、モチベーションの高い正規化手法を導出できることが示される。
本手法の有効性を実証的に評価し,提案手法がほぼ完全なセマンティックシフト検出と高度に校正された予測不確実性推定に繋がることを示す。
論文 参考訳(メタデータ) (2023-12-28T17:50:56Z) - Koopman Kernel Regression [6.116741319526748]
クープマン作用素理論は線形時間不変(LTI)ODEによる予測のキャラクタリゼーションに有効なパラダイムであることを示す。
我々は、LTI力学系への変換のみにまたがる、普遍的なクープマン不変核再生ヒルベルト空間(RKHS)を導出する。
実験では、Koopman演算子やシーケンシャルデータ予測器と比較して予測性能が優れていることを示した。
論文 参考訳(メタデータ) (2023-05-25T16:22:22Z) - On the Forward Invariance of Neural ODEs [92.07281135902922]
本稿では,ニューラル常微分方程式(ODE)が出力仕様を満たすことを保証するための新しい手法を提案する。
提案手法では,出力仕様を学習システムのパラメータや入力の制約に変換するために,制御障壁関数のクラスを用いる。
論文 参考訳(メタデータ) (2022-10-10T15:18:28Z) - Deep Koopman Operator with Control for Nonlinear Systems [44.472875714432504]
そこで我々は,Koopman組込み関数とKoopman Operatorを学習するためのエンドツーエンドのディープラーニングフレームワークを提案する。
まず、ニューラルネットワークを用いて埋め込み関数とクープマン演算子をパラメータ化し、Kステップ損失関数でエンドツーエンドに学習する。
次に,制御入力の非線形性をモデル化するために,非線形状態依存制御項を符号化する補助制御ネットワークを設計する。
論文 参考訳(メタデータ) (2022-02-16T11:40:36Z) - Towards Data-driven LQR with KoopmanizingFlows [8.133902705930327]
本稿では,線形時間不変モデル(LTI)を連続時間非自律非線形力学のクラスで学習するための新しいフレームワークを提案する。
我々は、有意な持ち上げ座標を同時に学習しながら、制御において線形なクープマン作用素の有限表現を学習する。
論文 参考訳(メタデータ) (2022-01-27T17:02:03Z) - Neural Koopman Lyapunov Control [0.0]
データから安定化可能な双線形制御系とその関連する可観測物を特定し,構築するためのフレームワークを提案する。
提案手法は、未知のダイナミクスを持つ非線形制御系に対して、大域的安定性の証明可能な保証を提供する。
論文 参考訳(メタデータ) (2022-01-13T17:38:09Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Discrete-time Contraction-based Control of Nonlinear Systems with
Parametric Uncertainties using Neural Networks [6.804154699470765]
本研究は,ニューラルネットワークを用いた離散時間収縮解析と制御へのアプローチを展開する。
この方法論は、ニューラルネットワークをトレーニングして、収縮メトリックとフィードバックゲインを学習する。
結果として得られる収縮ベースのコントローラは、訓練されたニューラルネットワークを組み込み、時間変動参照の効率的な追跡を達成することができる。
論文 参考訳(メタデータ) (2021-05-12T05:07:34Z) - Data-driven Koopman Operators for Model-based Shared Control of
Human-Machine Systems [66.65503164312705]
本稿では,データ駆動型共有制御アルゴリズムを提案する。
ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。
モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
論文 参考訳(メタデータ) (2020-06-12T14:14:07Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z) - Technical Report: Adaptive Control for Linearizable Systems Using
On-Policy Reinforcement Learning [41.24484153212002]
本稿では,未知システムに対するフィードバック線形化に基づくトラッキング制御系を適応的に学習するフレームワークを提案する。
学習した逆モデルがすべての時点において可逆である必要はない。
二重振り子の模擬例は、提案された理論の有用性を示している。
論文 参考訳(メタデータ) (2020-04-06T15:50:31Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。