論文の概要: Nonparametric Control Koopman Operators
- arxiv url: http://arxiv.org/abs/2405.07312v3
- Date: Tue, 04 Mar 2025 09:09:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 13:46:35.398685
- Title: Nonparametric Control Koopman Operators
- Title(参考訳): 非パラメトリック制御クープマン演算子
- Authors: Petar Bevanda, Bas Driessen, Lucian Cristian Iacob, Stefan Sosnowski, Roland Tóth, Sandra Hirche,
- Abstract要約: 本稿では、明示的な辞書や入力パラメトリゼーションのないカーネルヒルベルト空間(RKHS)の再生における制御系のための新しいクープマン演算子表現フレームワークを提案する。
異なるモデル表現の基本的な等価性を確立することにより、制御系演算子学習と無限次元回帰のギャップを埋めることができる。
- 参考スコア(独自算出の注目度): 3.9393118740111084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel Koopman (composition) operator representation framework for control systems in reproducing kernel Hilbert spaces (RKHSs) that is free of explicit dictionary or input parametrizations. By establishing fundamental equivalences between different model representations, we are able to close the gap of control system operator learning and infinite-dimensional regression, enabling various empirical estimators and the connection to well-understood learning theory in RKHSs under one unified framework. As a consequence, our proposed framework allows for arbitrary accurate finite-rank approximations in infinite-dimensional spaces and leads to finite-dimensional predictors without apriori restrictions to a finite span of functions or inputs. To enable applications to high-dimensional control systems, we improve the scalability of our proposed control Koopman operator estimates by utilizing sketching techniques. Numerical experiments demonstrate superior prediction accuracy compared to bilinear EDMD, especially in high dimensions. Finally, we show that our learned models are readily interfaced with linear-parameter-varying techniques for model predictive control.
- Abstract(参考訳): 本稿では、明示的な辞書や入力パラメトリゼーションのないカーネルヒルベルト空間(RKHS)の再生における制御系のための新しいクープマン演算子表現フレームワークを提案する。
異なるモデル表現の基本的な等価性を確立することにより、制御系演算子学習と無限次元回帰のギャップを埋めることができ、様々な経験的推定器とRKHSにおけるよく理解された学習理論への接続を1つの統一的な枠組みの下で実現できる。
その結果、提案するフレームワークは、無限次元空間における任意の正確な有限ランク近似を可能にし、有限次元の関数や入力に対するアプリオリ制約を伴わない有限次元予測子を導出する。
高次元制御システムへの応用を実現するため,スケッチ技術を用いて提案した制御演算子推定値のスケーラビリティを向上する。
数値実験では、特に高次元において、双線形EDMDと比較して予測精度が優れていることが示されている。
最後に,学習したモデルは,モデル予測制御のための線形パラメータ変化技術と容易にインターフェース可能であることを示す。
関連論文リスト
- Training Deep Learning Models with Norm-Constrained LMOs [56.00317694850397]
正規球上の線形最小化オラクル(LMO)を利用する最適化手法について検討する。
この問題の幾何学に適応するためにLMOを用いた新しいアルゴリズム群を提案し, 意外なことに, 制約のない問題に適用可能であることを示す。
論文 参考訳(メタデータ) (2025-02-11T13:10:34Z) - Kernel-Based Optimal Control: An Infinitesimal Generator Approach [3.7411439050030393]
本稿では,非線形システムの最適制御のための演算子理論的手法を提案する。
我々の学習フレームワークは,システムダイナミクスとステージコスト関数のデータサンプルを活用する。
我々は、我々のアプローチが現代の凸作用素-理論的ハミルトン・ヤコビ・ベルマン再帰とシームレスに統合されることを実証する。
論文 参考訳(メタデータ) (2024-12-02T15:08:55Z) - Fundamental operating regimes, hyper-parameter fine-tuning and glassiness: towards an interpretable replica-theory for trained restricted Boltzmann machines [0.0]
本稿では,二つの可視層を持つボルツマンマシンと,単一基底パターンの雑音的現実化からなる乱れのないデータセットによって訓練されたガウス的隠れ層を考える。
本稿では,ネットワーク生成能力を記述するための統計力学フレームワークを開発し,レプリカのトリックを活用し,基礎となる順序パラメータの自己評価を仮定する。
論文 参考訳(メタデータ) (2024-06-14T11:12:00Z) - Random Features Approximation for Control-Affine Systems [6.067043299145924]
制御アフィン構造をキャプチャする非線形特徴表現の2つの新しいクラスを提案する。
提案手法はランダムな特徴(RF)近似を用いて,より少ない計算コストでカーネル手法の表現性を継承する。
論文 参考訳(メタデータ) (2024-06-10T17:54:57Z) - Unsupervised Solution Operator Learning for Mean-Field Games via Sampling-Invariant Parametrizations [7.230928145936957]
我々はMFGソリューション演算子を学習するための新しいフレームワークを開発する。
我々のモデルはMFGインスタンスを入力として取り出し、1つのフォワードパスで解を出力する。
離散化フリーであり、高次元MFGの学習演算子に適している。
論文 参考訳(メタデータ) (2024-01-27T19:07:49Z) - Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - Function-Space Regularization in Neural Networks: A Probabilistic
Perspective [51.133793272222874]
所望の予測関数に関する情報をニューラルネットワークトレーニングに明示的にエンコードできる、モチベーションの高い正規化手法を導出できることが示される。
本手法の有効性を実証的に評価し,提案手法がほぼ完全なセマンティックシフト検出と高度に校正された予測不確実性推定に繋がることを示す。
論文 参考訳(メタデータ) (2023-12-28T17:50:56Z) - Koopman Kernel Regression [6.116741319526748]
クープマン作用素理論は線形時間不変(LTI)ODEによる予測のキャラクタリゼーションに有効なパラダイムであることを示す。
我々は、LTI力学系への変換のみにまたがる、普遍的なクープマン不変核再生ヒルベルト空間(RKHS)を導出する。
実験では、Koopman演算子やシーケンシャルデータ予測器と比較して予測性能が優れていることを示した。
論文 参考訳(メタデータ) (2023-05-25T16:22:22Z) - On the Forward Invariance of Neural ODEs [92.07281135902922]
本稿では,ニューラル常微分方程式(ODE)が出力仕様を満たすことを保証するための新しい手法を提案する。
提案手法では,出力仕様を学習システムのパラメータや入力の制約に変換するために,制御障壁関数のクラスを用いる。
論文 参考訳(メタデータ) (2022-10-10T15:18:28Z) - Deep Koopman Operator with Control for Nonlinear Systems [44.472875714432504]
そこで我々は,Koopman組込み関数とKoopman Operatorを学習するためのエンドツーエンドのディープラーニングフレームワークを提案する。
まず、ニューラルネットワークを用いて埋め込み関数とクープマン演算子をパラメータ化し、Kステップ損失関数でエンドツーエンドに学習する。
次に,制御入力の非線形性をモデル化するために,非線形状態依存制御項を符号化する補助制御ネットワークを設計する。
論文 参考訳(メタデータ) (2022-02-16T11:40:36Z) - Towards Data-driven LQR with KoopmanizingFlows [8.133902705930327]
本稿では,線形時間不変モデル(LTI)を連続時間非自律非線形力学のクラスで学習するための新しいフレームワークを提案する。
我々は、有意な持ち上げ座標を同時に学習しながら、制御において線形なクープマン作用素の有限表現を学習する。
論文 参考訳(メタデータ) (2022-01-27T17:02:03Z) - Neural Koopman Lyapunov Control [0.0]
データから安定化可能な双線形制御系とその関連する可観測物を特定し,構築するためのフレームワークを提案する。
提案手法は、未知のダイナミクスを持つ非線形制御系に対して、大域的安定性の証明可能な保証を提供する。
論文 参考訳(メタデータ) (2022-01-13T17:38:09Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Discrete-time Contraction-based Control of Nonlinear Systems with
Parametric Uncertainties using Neural Networks [6.804154699470765]
本研究は,ニューラルネットワークを用いた離散時間収縮解析と制御へのアプローチを展開する。
この方法論は、ニューラルネットワークをトレーニングして、収縮メトリックとフィードバックゲインを学習する。
結果として得られる収縮ベースのコントローラは、訓練されたニューラルネットワークを組み込み、時間変動参照の効率的な追跡を達成することができる。
論文 参考訳(メタデータ) (2021-05-12T05:07:34Z) - Data-driven Koopman Operators for Model-based Shared Control of
Human-Machine Systems [66.65503164312705]
本稿では,データ駆動型共有制御アルゴリズムを提案する。
ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。
モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
論文 参考訳(メタデータ) (2020-06-12T14:14:07Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z) - Technical Report: Adaptive Control for Linearizable Systems Using
On-Policy Reinforcement Learning [41.24484153212002]
本稿では,未知システムに対するフィードバック線形化に基づくトラッキング制御系を適応的に学習するフレームワークを提案する。
学習した逆モデルがすべての時点において可逆である必要はない。
二重振り子の模擬例は、提案された理論の有用性を示している。
論文 参考訳(メタデータ) (2020-04-06T15:50:31Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。