論文の概要: Nonparametric Sparse Online Learning of the Koopman Operator
- arxiv url: http://arxiv.org/abs/2501.16489v1
- Date: Mon, 27 Jan 2025 20:48:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-29 16:42:12.768661
- Title: Nonparametric Sparse Online Learning of the Koopman Operator
- Title(参考訳): クープマン演算子の非パラメトリックスパースオンライン学習
- Authors: Boya Hou, Sina Sanjari, Nathan Dahlin, Alec Koppel, Subhonmesh Bose,
- Abstract要約: クープマン作用素は、一般的な非線形力学系の力学を表現する強力なフレームワークを提供する。
クープマン作用素を学ぶためのデータ駆動手法は、選択された関数空間がシステム力学の下で閉じていると仮定するのが一般的である。
演算子近似アルゴリズムを用いて、演算子を反復的に学習し、表現の複雑さの制御を行う。
- 参考スコア(独自算出の注目度): 11.710740395697128
- License:
- Abstract: The Koopman operator provides a powerful framework for representing the dynamics of general nonlinear dynamical systems. Data-driven techniques to learn the Koopman operator typically assume that the chosen function space is closed under system dynamics. In this paper, we study the Koopman operator via its action on the reproducing kernel Hilbert space (RKHS), and explore the mis-specified scenario where the dynamics may escape the chosen function space. We relate the Koopman operator to the conditional mean embeddings (CME) operator and then present an operator stochastic approximation algorithm to learn the Koopman operator iteratively with control over the complexity of the representation. We provide both asymptotic and finite-time last-iterate guarantees of the online sparse learning algorithm with trajectory-based sampling with an analysis that is substantially more involved than that for finite-dimensional stochastic approximation. Numerical examples confirm the effectiveness of the proposed algorithm.
- Abstract(参考訳): クープマン作用素は、一般的な非線形力学系の力学を表現する強力なフレームワークを提供する。
クープマン作用素を学ぶためのデータ駆動手法は、選択された関数空間がシステム力学の下で閉じていると仮定するのが一般的である。
本稿では、再生カーネルヒルベルト空間(RKHS)に対する作用を通じてクープマン作用素について検討し、動的に選択された関数空間から逃れられるような不特定シナリオを探索する。
我々は、クープマン作用素を条件付き平均埋め込み(CME)演算子に関連付け、次に演算子確率近似アルゴリズムを示し、クープマン演算子を表現の複雑さの制御で反復的に学習する。
本研究では,オンラインスパース学習アルゴリズムの漸近的および有限時間的最終項目保証と,有限次元確率近似よりもかなり関係のある解析をトラジェクトリベースサンプリングで実現する。
数値実験により,提案アルゴリズムの有効性が確認された。
関連論文リスト
- Nonparametric Sparse Online Learning of the Koopman Operator [11.710740395697128]
クープマン作用素は、一般的な非線形力学系の力学を表現する強力なフレームワークを提供する。
クープマン作用素を学ぶためのデータ駆動手法は、選択された関数空間がシステム力学の下で閉じていると仮定するのが一般的である。
演算子近似アルゴリズムを用いて、演算子を反復的に学習し、表現の複雑さの制御を行う。
論文 参考訳(メタデータ) (2024-05-13T02:18:49Z) - Multiplicative Dynamic Mode Decomposition [4.028503203417233]
有限次元近似においてクープマン作用素に固有の乗法構造を強制する乗法動的モード分解(MultDMD)を導入する。
MultDMDは有限次元近似に対する構造化されたアプローチを示し、クープマン作用素のスペクトル特性を正確に反映することができる。
我々は,MultDMDの理論的枠組みについて詳述し,その定式化,最適化戦略,収束特性について詳述する。
論文 参考訳(メタデータ) (2024-05-08T18:09:16Z) - Parameterized Projected Bellman Operator [64.129598593852]
近似値反復(英: Approximate value iteration, AVI)は、強化学習(RL)のためのアルゴリズムの一群である。
本稿ではベルマン作用素の近似版を学習する新しい代替手法を提案する。
逐次決定問題に対するPBO学習のための最適化問題を定式化する。
論文 参考訳(メタデータ) (2023-12-20T09:33:16Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Auxiliary Functions as Koopman Observables: Data-Driven Analysis of
Dynamical Systems via Polynomial Optimization [0.0]
本稿では,明示的なモデル発見を必要としないフレキシブルなデータ駆動型システム解析手法を提案する。
この手法は、データからクープマン演算子を近似する確立した手法に根ざし、数値的に解ける半定プログラムとして実装される。
論文 参考訳(メタデータ) (2023-03-02T18:44:18Z) - Spectral Decomposition Representation for Reinforcement Learning [100.0424588013549]
本稿では, スペクトル分解表現法(SPEDER)を提案する。この手法は, データ収集ポリシーに急激な依存を生じさせることなく, ダイナミックスから状態-作用の抽象化を抽出する。
理論的解析により、オンライン設定とオフライン設定の両方において提案アルゴリズムのサンプル効率が確立される。
実験により、いくつかのベンチマークで現在の最先端アルゴリズムよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-08-19T19:01:30Z) - Learning Dynamical Systems via Koopman Operator Regression in
Reproducing Kernel Hilbert Spaces [52.35063796758121]
動的システムの有限データ軌跡からクープマン作用素を学ぶためのフレームワークを定式化する。
リスクとクープマン作用素のスペクトル分解の推定を関連付ける。
以上の結果から,RRRは他の広く用いられている推定値よりも有益である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-27T14:57:48Z) - Reinforcement Learning from Partial Observation: Linear Function Approximation with Provable Sample Efficiency [111.83670279016599]
部分観察決定過程(POMDP)の無限観測および状態空間を用いた強化学習について検討した。
線形構造をもつPOMDPのクラスに対する部分可観測性と関数近似の最初の試みを行う。
論文 参考訳(メタデータ) (2022-04-20T21:15:38Z) - KoopmanizingFlows: Diffeomorphically Learning Stable Koopman Operators [7.447933533434023]
本稿では,線形時間不変(LTI)モデルを構築するための新しいフレームワークを提案する。
事前に定義された関数のライブラリやスペクトルを知ることなく、クープマン作用素の特徴を学習する。
本稿では,LASA手書きデータセットにおける最先端手法と比較して,提案手法の優れた有効性を示す。
論文 参考訳(メタデータ) (2021-12-08T02:40:40Z) - Estimating Koopman operators for nonlinear dynamical systems: a
nonparametric approach [77.77696851397539]
Koopman演算子は非線形系の線形記述を可能にする数学的ツールである。
本稿では,その核となる部分を同一フレームワークのデュアルバージョンとして捉え,それらをカーネルフレームワークに組み込む。
カーネルメソッドとKoopman演算子との強力なリンクを確立し、Kernel関数を通じて後者を推定する。
論文 参考訳(メタデータ) (2021-03-25T11:08:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。