論文の概要: Linear quadratic control of nonlinear systems with Koopman operator
learning and the Nystr\"om method
- arxiv url: http://arxiv.org/abs/2403.02811v1
- Date: Tue, 5 Mar 2024 09:28:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 15:18:13.982752
- Title: Linear quadratic control of nonlinear systems with Koopman operator
learning and the Nystr\"om method
- Title(参考訳): Koopman演算子学習とNystr\"om法による非線形系の線形二次制御
- Authors: Edoardo Caldarelli, Antoine Chatalic, Adri\`a Colom\'e, Cesare
Molinari, Carlos Ocampo-Martinez, Carme Torras, Lorenzo Rosasco
- Abstract要約: 計算量を大幅に削減するために,ランダムな部分空間をどのように利用できるかを示す。
我々の主な技術的貢献は、Nystr"om近似の効果に関する理論的保証を導出することである。
- 参考スコア(独自算出の注目度): 15.747820715709937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we study how the Koopman operator framework can be combined
with kernel methods to effectively control nonlinear dynamical systems. While
kernel methods have typically large computational requirements, we show how
random subspaces (Nystr\"om approximation) can be used to achieve huge
computational savings while preserving accuracy. Our main technical
contribution is deriving theoretical guarantees on the effect of the Nystr\"om
approximation. More precisely, we study the linear quadratic regulator problem,
showing that both the approximated Riccati operator and the regulator
objective, for the associated solution of the optimal control problem, converge
at the rate $m^{-1/2}$, where $m$ is the random subspace size. Theoretical
findings are complemented by numerical experiments corroborating our results.
- Abstract(参考訳): 本論文では, 非線形力学系を効果的に制御するために, クープマン演算子フレームワークをカーネル法と組み合わせる方法について検討する。
カーネル法は通常大きな計算量を必要とするが、ランダム部分空間(nystr\"om approximation)が精度を維持しながら巨大な計算節約を達成する方法を示す。
我々の主な技術的貢献は、Nystr\"om近似の効果に関する理論的保証の導出である。
より正確には、線形二次レギュレータ問題の研究を行い、近似リッカティ作用素とレギュレータ目的の両方を最適制御問題の関連する解として、m$ がランダム部分空間サイズであるレート $m^{-1/2}$ で収束することを示した。
理論的知見は数値実験によって補完される。
関連論文リスト
- Impact of Computation in Integral Reinforcement Learning for
Continuous-Time Control [5.126167270246931]
計算法の選択(この場合、二次規則)が制御性能に大きな影響を及ぼすことを示す。
我々は、IntRLのポリシー反復とハミルトン・ヤコビ・ベルマン方程式に適用されたニュートンの方法とを平行に描いている。
IntRL の局所収束速度は、Prapezoidal rule と、Mat'ern kernel を持つベイズ二次函数を用いて、$O(N-2)$ および $O(N-b)$ となることを証明している。
論文 参考訳(メタデータ) (2024-02-27T10:12:47Z) - Equation Discovery with Bayesian Spike-and-Slab Priors and Efficient Kernels [57.46832672991433]
ケルネル学習とBayesian Spike-and-Slab pres (KBASS)に基づく新しい方程式探索法を提案する。
カーネルレグレッションを用いてターゲット関数を推定する。これはフレキシブルで表現力があり、データ空間やノイズに対してより堅牢である。
我々は,効率的な後部推論と関数推定のための予測伝搬予測最大化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-10-09T03:55:09Z) - Deep Learning with Kernels through RKHM and the Perron-Frobenius
Operator [14.877070496733966]
再生カーネル Hilbert $C*$-module (RKHM) は、複製カーネル Hilbert 空間 (RKHS) を$C*$-algebra を用いて一般化したものである。
我々は、この設定で有界な新しいラデマッハ一般化を導出し、ペロン・フロベニウス作用素による良性過剰適合の理論的解釈を提供する。
論文 参考訳(メタデータ) (2023-05-23T01:38:41Z) - Learning "best" kernels from data in Gaussian process regression. With
application to aerodynamics [0.4588028371034406]
本稿では,ガウス過程の回帰/クリギングサロゲートモデリング手法におけるカーネルの選択/設計アルゴリズムを紹介する。
アルゴリズムの最初のクラスはカーネルフローであり、機械学習の分類の文脈で導入された。
アルゴリズムの第2のクラスはスペクトル核リッジ回帰と呼ばれ、近似される関数のノルムが最小となるような「最良の」カーネルを選択することを目的としている。
論文 参考訳(メタデータ) (2022-06-03T07:50:54Z) - On the Benefits of Large Learning Rates for Kernel Methods [110.03020563291788]
本稿では,カーネル手法のコンテキストにおいて,現象を正確に特徴付けることができることを示す。
分離可能なヒルベルト空間における2次対象の最小化を考慮し、早期停止の場合、学習速度の選択が得られた解のスペクトル分解に影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2022-02-28T13:01:04Z) - Nystr\"om Kernel Mean Embeddings [92.10208929236826]
Nystr"om法に基づく効率的な近似手法を提案する。
サブサンプルサイズの条件は標準の$n-1/2$レートを得るのに十分である。
本稿では,この結果の最大誤差と二次規則の近似への応用について論じる。
論文 参考訳(メタデータ) (2022-01-31T08:26:06Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Control Occupation Kernel Regression for Nonlinear Control-Affine
Systems [6.308539010172309]
非線形高次制御アフィン力学系の近似を求めるアルゴリズムを提案する。
ヒルベルト空間のベクトル値構造は、ドリフトと制御アフィン系の制御有効成分の同時近似を可能にする。
論文 参考訳(メタデータ) (2021-05-31T21:14:30Z) - Estimating Koopman operators for nonlinear dynamical systems: a
nonparametric approach [77.77696851397539]
Koopman演算子は非線形系の線形記述を可能にする数学的ツールである。
本稿では,その核となる部分を同一フレームワークのデュアルバージョンとして捉え,それらをカーネルフレームワークに組み込む。
カーネルメソッドとKoopman演算子との強力なリンクを確立し、Kernel関数を通じて後者を推定する。
論文 参考訳(メタデータ) (2021-03-25T11:08:26Z) - Sparse Spectrum Warped Input Measures for Nonstationary Kernel Learning [29.221457769884648]
本研究では,非定常カーネルを学習するための明示的,入力に依存した,計測値のワーピングの一般的な形式を提案する。
提案した学習アルゴリズムは、標準定常カーネルの滑らかさを制御する条件付きガウス測度として入力をワープする。
我々は,小・大規模データ体制の学習問題において,ワーピング関数のパラメータ数に顕著な効率性を示す。
論文 参考訳(メタデータ) (2020-10-09T01:10:08Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。