論文の概要: Towards Data-driven LQR with KoopmanizingFlows
- arxiv url: http://arxiv.org/abs/2201.11640v1
- Date: Thu, 27 Jan 2022 17:02:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-28 15:34:47.026124
- Title: Towards Data-driven LQR with KoopmanizingFlows
- Title(参考訳): KoopmanizingFlowsによるデータ駆動型LQRの実現
- Authors: Petar Bevanda, Max Beier, Shahab Heshmati-Alamdari, Stefan Sosnowski,
Sandra Hirche
- Abstract要約: 本稿では,線形時間不変モデル(LTI)を連続時間非自律非線形力学のクラスで学習するための新しいフレームワークを提案する。
我々は、有意な持ち上げ座標を同時に学習しながら、制御において線形なクープマン作用素の有限表現を学習する。
- 参考スコア(独自算出の注目度): 8.133902705930327
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel framework for learning linear time-invariant (LTI) models
for a class of continuous-time non-autonomous nonlinear dynamics based on a
representation of Koopman operators. In general, the operator is
infinite-dimensional but, crucially, linear. To utilize it for efficient LTI
control, we learn a finite representation of the Koopman operator that is
linear in controls while concurrently learning meaningful lifting coordinates.
For the latter, we rely on KoopmanizingFlows - a diffeomorphism-based
representation of Koopman operators. With such a learned model, we can replace
the nonlinear infinite-horizon optimal control problem with quadratic costs to
that of a linear quadratic regulator (LQR), facilitating efficacious optimal
control for nonlinear systems. The prediction and control efficacy of the
proposed method is verified on simulation examples.
- Abstract(参考訳): クープマン作用素の表現に基づく連続時間非自律非線形ダイナミクスのクラスに対する線形時間不変(LTI)モデルを学習するための新しいフレームワークを提案する。
一般に、作用素は無限次元であるが、決定的に線型である。
これを効率的なlti制御に利用するために,制御に線形なkoopman演算子の有限表現を学習し,有意義な昇降座標を同時に学習する。
後者については、KoopmanizingFlows - Koopman演算子の微分同相に基づく表現に依存する。
このような学習モデルを用いて,非線形無限ホリゾン最適制御問題を線形二次レギュレータ (lqr) の2次コストで置き換えることができ,非線形システムの最適制御が容易になる。
提案手法の予測と制御の有効性をシミュレーション例で検証した。
関連論文リスト
- Uncertainty Modelling and Robust Observer Synthesis using the Koopman Operator [5.317624228510749]
クープマン作用素は非線形系を無限次元線型系として書き換えることを可能にする。
クープマン作用素の有限次元近似は、データから直接同定することができる。
提案手法を実験的に実証するために、数十台のモータードライブの人口を用いている。
論文 参考訳(メタデータ) (2024-10-01T20:31:18Z) - Koopman-Assisted Reinforcement Learning [8.812992091278668]
ベルマン方程式とその連続形式であるハミルトン・ヤコビ・ベルマン方程式(HJB)は、強化学習(RL)と制御理論においてユビキタスである。
本稿では,データ駆動型クープマン演算子と決定過程(MDP)の関連性について検討する。
これらの制約に対処する2つの新しいRLアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-03-04T18:19:48Z) - Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - Deep Koopman Operator with Control for Nonlinear Systems [44.472875714432504]
そこで我々は,Koopman組込み関数とKoopman Operatorを学習するためのエンドツーエンドのディープラーニングフレームワークを提案する。
まず、ニューラルネットワークを用いて埋め込み関数とクープマン演算子をパラメータ化し、Kステップ損失関数でエンドツーエンドに学習する。
次に,制御入力の非線形性をモデル化するために,非線形状態依存制御項を符号化する補助制御ネットワークを設計する。
論文 参考訳(メタデータ) (2022-02-16T11:40:36Z) - KoopmanizingFlows: Diffeomorphically Learning Stable Koopman Operators [7.447933533434023]
本稿では,線形時間不変(LTI)モデルを構築するための新しいフレームワークを提案する。
事前に定義された関数のライブラリやスペクトルを知ることなく、クープマン作用素の特徴を学習する。
本稿では,LASA手書きデータセットにおける最先端手法と比較して,提案手法の優れた有効性を示す。
論文 参考訳(メタデータ) (2021-12-08T02:40:40Z) - Estimating Koopman operators for nonlinear dynamical systems: a
nonparametric approach [77.77696851397539]
Koopman演算子は非線形系の線形記述を可能にする数学的ツールである。
本稿では,その核となる部分を同一フレームワークのデュアルバージョンとして捉え,それらをカーネルフレームワークに組み込む。
カーネルメソッドとKoopman演算子との強力なリンクを確立し、Kernel関数を通じて後者を推定する。
論文 参考訳(メタデータ) (2021-03-25T11:08:26Z) - LQF: Linear Quadratic Fine-Tuning [114.3840147070712]
本稿では,非線形微調整に匹敵する性能を実現する事前学習モデルの線形化手法を提案する。
LQFはアーキテクチャの単純な変更、損失関数、そして一般的に分類に使用される最適化で構成されている。
論文 参考訳(メタデータ) (2020-12-21T06:40:20Z) - Derivative-Based Koopman Operators for Real-Time Control of Robotic
Systems [14.211417879279075]
本稿では, モデル誤差を拘束する非線形力学をデータ駆動で同定するための一般化可能な手法を提案する。
クープマン演算子に基づく線形表現を構築し,テイラー級数精度解析を用いて誤差境界を導出する。
制御と組み合わせると、非線形系のクープマン表現は競合する非線形モデリング法よりも極端に優れた性能を持つ。
論文 参考訳(メタデータ) (2020-10-12T15:15:13Z) - Learning the Linear Quadratic Regulator from Nonlinear Observations [135.66883119468707]
我々は、LQR with Rich Observations(RichLQR)と呼ばれる連続制御のための新しい問題設定を導入する。
本設定では, 線形力学と二次的コストを有する低次元連続潜伏状態によって環境を要約する。
本結果は,システムモデルと一般関数近似における未知の非線形性を持つ連続制御のための,最初の証明可能なサンプル複雑性保証である。
論文 参考訳(メタデータ) (2020-10-08T07:02:47Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。