論文の概要: Koopman Spectrum Nonlinear Regulators and Efficient Online Learning
- arxiv url: http://arxiv.org/abs/2106.15775v2
- Date: Tue, 2 Jul 2024 08:53:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 10:45:46.862885
- Title: Koopman Spectrum Nonlinear Regulators and Efficient Online Learning
- Title(参考訳): クープマンスペクトル非線形レギュレータと効率的なオンライン学習
- Authors: Motoya Ohnishi, Isao Ishikawa, Kendall Lowrey, Masahiro Ikeda, Sham Kakade, Yoshinobu Kawahara,
- Abstract要約: クープマンスペクトルコストの最小化により非線形システムを制御する新しいパラダイムを提案する。
このパラダイムでは累積コストで不可能ないくつかの力学特性が実現可能であることを実証する。
本稿では,いくつかの構造的前提の下で線形な後悔を楽しむオンライン学習アルゴリズムのサンプルを提示する。
- 参考スコア(独自算出の注目度): 14.140666469781047
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most modern reinforcement learning algorithms optimize a cumulative single-step cost along a trajectory. The optimized motions are often 'unnatural', representing, for example, behaviors with sudden accelerations that waste energy and lack predictability. In this work, we present a novel paradigm of controlling nonlinear systems via the minimization of the Koopman spectrum cost: a cost over the Koopman operator of the controlled dynamics. This induces a broader class of dynamical behaviors that evolve over stable manifolds such as nonlinear oscillators, closed loops, and smooth movements. We demonstrate that some dynamics characterizations that are not possible with a cumulative cost are feasible in this paradigm, which generalizes the classical eigenstructure and pole assignments to nonlinear decision making. Moreover, we present a sample efficient online learning algorithm for our problem that enjoys a sub-linear regret bound under some structural assumptions.
- Abstract(参考訳): 現代の強化学習アルゴリズムの多くは、軌道に沿って累積的な単段階コストを最適化している。
最適化された運動はしばしば「不自然な」もので、例えば、エネルギーを浪費し、予測可能性に欠ける急激な加速を伴う行動を表す。
本研究では、制御力学のクープマン作用素に対するコストであるクープマンスペクトルコストの最小化を通じて非線形系を制御する新しいパラダイムを提案する。
このことは、非線形発振器、閉ループ、滑らかな運動のような安定多様体上で進化するより広範な力学挙動のクラスを誘導する。
我々は,古典的固有構造と極配置を非線形決定に一般化するパラダイムにおいて,累積コストで不可能ないくつかの力学特性が実現可能であることを実証した。
さらに,いくつかの構造的前提の下でのサブ線形後悔を楽しむ問題に対して,効率的なオンライン学習アルゴリズムを提案する。
関連論文リスト
- Deep Learning for Structure-Preserving Universal Stable Koopman-Inspired
Embeddings for Nonlinear Canonical Hamiltonian Dynamics [9.599029891108229]
シンプレクティック変換による正準非線形ハミルトン系に対する大域的線形化埋め込みの同定に着目する。
連続スペクトルを持つ系に対するクープマン作用素の欠点を克服するため、持ち上げ原理を適用し、大域的な立方体埋め込みを学習する。
我々は、コンパクトなシンプレクティック座標変換とそれに対応する単純な力学モデルを取得するためのディープラーニングの能力を実証する。
論文 参考訳(メタデータ) (2023-08-26T09:58:09Z) - Learning Nonlinear Projections for Reduced-Order Modeling of Dynamical
Systems using Constrained Autoencoders [0.0]
制約付き自己エンコーダニューラルネットワークによって記述された非線形射影のクラスを導入し,データから多様体と射影繊維の両方を学習する。
我々のアーキテクチャでは、エンコーダがデコーダの左逆であることを保証するために、可逆的アクティベーション関数と生物直交重み行列を用いる。
また,高速なダイナミックスと非正規性を考慮した斜め射影ファイバの学習を促進するために,新しいダイナミックス対応コスト関数を導入する。
論文 参考訳(メタデータ) (2023-07-28T04:01:48Z) - Learning Globally Smooth Functions on Manifolds [94.22412028413102]
スムーズな関数の学習は、線形モデルやカーネルモデルなどの単純なケースを除いて、一般的に難しい。
本研究は,半無限制約学習と多様体正規化の技法を組み合わせることで,これらの障害を克服することを提案する。
軽度条件下では、この手法は解のリプシッツ定数を推定し、副生成物として大域的に滑らかな解を学ぶ。
論文 参考訳(メタデータ) (2022-10-01T15:45:35Z) - Towards Data-driven LQR with KoopmanizingFlows [8.133902705930327]
本稿では,線形時間不変モデル(LTI)を連続時間非自律非線形力学のクラスで学習するための新しいフレームワークを提案する。
我々は、有意な持ち上げ座標を同時に学習しながら、制御において線形なクープマン作用素の有限表現を学習する。
論文 参考訳(メタデータ) (2022-01-27T17:02:03Z) - Optimization on manifolds: A symplectic approach [127.54402681305629]
本稿では、最適化問題を解くための一般的な枠組みとして、ディラックの制約付きハミルトン系理論の散逸拡張を提案する。
我々の(加速された)アルゴリズムのクラスは単純で効率的なだけでなく、幅広い文脈にも適用できる。
論文 参考訳(メタデータ) (2021-07-23T13:43:34Z) - Designing Kerr Interactions for Quantum Information Processing via
Counterrotating Terms of Asymmetric Josephson-Junction Loops [68.8204255655161]
静的空洞非線形性は通常、ボゾン量子誤り訂正符号の性能を制限する。
非線形性を摂動として扱うことで、シュリーファー・ヴォルフ変換を用いて実効ハミルトニアンを導出する。
その結果、立方体相互作用は、線形演算と非線形演算の両方の有効率を高めることができることがわかった。
論文 参考訳(メタデータ) (2021-07-14T15:11:05Z) - Estimating Koopman operators for nonlinear dynamical systems: a
nonparametric approach [77.77696851397539]
Koopman演算子は非線形系の線形記述を可能にする数学的ツールである。
本稿では,その核となる部分を同一フレームワークのデュアルバージョンとして捉え,それらをカーネルフレームワークに組み込む。
カーネルメソッドとKoopman演算子との強力なリンクを確立し、Kernel関数を通じて後者を推定する。
論文 参考訳(メタデータ) (2021-03-25T11:08:26Z) - Extended Koopman Models [0.0]
非線形動的モデリングのクープマン作用素法の2つの新しい一般化を導入する。
それぞれが2つの非線形非動的系の軌道予測において従来のクープマンモデルよりも著しく優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T07:10:37Z) - Sparse Quantized Spectral Clustering [85.77233010209368]
このような非線形変換の下で行列の固有スペクトルがどのように変化するのかを、ランダム行列理論のツールを用いて正確に述べる。
急激なスペーシング/量子化の下でも,情報的固有構造にはほとんど変化は見られなかった。
論文 参考訳(メタデータ) (2020-10-03T15:58:07Z) - First Steps: Latent-Space Control with Semantic Constraints for
Quadruped Locomotion [73.37945453998134]
従来の四重化制御のアプローチでは、単純化された手作りのモデルが採用されている。
これにより、有効な運動範囲が縮小されているため、ロボットの能力が大幅に低下する。
この研究において、これらの課題は、構造化潜在空間における最適化として四重化制御をフレーミングすることによって解決される。
深い生成モデルは、実現可能な関節構成の統計的表現を捉え、一方、複雑な動的および終端的制約は高レベルな意味的指標によって表現される。
実世界とシミュレーションの両方で最適化された移動軌跡の実現可能性を検証する。
論文 参考訳(メタデータ) (2020-07-03T07:04:18Z) - Sparsity-promoting algorithms for the discovery of informative Koopman
invariant subspaces [0.0]
本稿では,マルチタスク特徴学習に基づくフレームワークを提案し,部分空間における最も情報に富むクープマンを抽出する。
提案手法は, 提案アルゴリズム, 疎度MDD, およびKDMDを促進する経験的基準との関係を示す。
論文 参考訳(メタデータ) (2020-02-25T03:02:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。