論文の概要: Data-driven End-to-end Learning of Pole Placement Control for Nonlinear
Dynamics via Koopman Invariant Subspaces
- arxiv url: http://arxiv.org/abs/2208.08883v1
- Date: Tue, 16 Aug 2022 05:57:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-19 13:20:35.441654
- Title: Data-driven End-to-end Learning of Pole Placement Control for Nonlinear
Dynamics via Koopman Invariant Subspaces
- Title(参考訳): クープマン不変部分空間を用いた非線形ダイナミクスのための極配置制御のデータ駆動エンドツーエンド学習
- Authors: Tomoharu Iwata, Yoshinobu Kawahara
- Abstract要約: クープマン作用素理論に基づくブラックボックス非線形力学系を制御するためのデータ駆動手法を提案する。
制御力学のクープマン作用素の固有値が目標固有値に近いようにポリシーネットワークを訓練する。
提案手法は,モデルレス強化学習やシステム同定によるモデルベース制御よりも優れた性能を示す。
- 参考スコア(独自算出の注目度): 37.795752939016225
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a data-driven method for controlling the frequency and convergence
rate of black-box nonlinear dynamical systems based on the Koopman operator
theory. With the proposed method, a policy network is trained such that the
eigenvalues of a Koopman operator of controlled dynamics are close to the
target eigenvalues. The policy network consists of a neural network to find a
Koopman invariant subspace, and a pole placement module to adjust the
eigenvalues of the Koopman operator. Since the policy network is
differentiable, we can train it in an end-to-end fashion using reinforcement
learning. We demonstrate that the proposed method achieves better performance
than model-free reinforcement learning and model-based control with system
identification.
- Abstract(参考訳): クープマン作用素理論に基づくブラックボックス非線形力学系の周波数と収束率を制御するためのデータ駆動手法を提案する。
提案手法では,制御力学のクープマン作用素の固有値が目標固有値に近いようにポリシーネットワークを訓練する。
ポリシーネットワークは、クープマン不変部分空間を見つけるニューラルネットワークと、クープマン演算子の固有値を調整するポール配置モジュールとから構成される。
政策ネットワークは異なるため、強化学習を用いてエンドツーエンドで学習することができる。
提案手法は,モデルレス強化学習やシステム同定によるモデルベース制御よりも優れた性能を示す。
関連論文リスト
- Non-Stationary Learning of Neural Networks with Automatic Soft Parameter Reset [98.52916361979503]
非定常性を自動的にモデル化し適応する新しい学習手法を導入する。
非定常的・非政治的強化学習環境において,本手法が有効であることを示す。
論文 参考訳(メタデータ) (2024-11-06T16:32:40Z) - Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - Towards Data-driven LQR with KoopmanizingFlows [8.133902705930327]
本稿では,線形時間不変モデル(LTI)を連続時間非自律非線形力学のクラスで学習するための新しいフレームワークを提案する。
我々は、有意な持ち上げ座標を同時に学習しながら、制御において線形なクープマン作用素の有限表現を学習する。
論文 参考訳(メタデータ) (2022-01-27T17:02:03Z) - Robust Value Iteration for Continuous Control Tasks [99.00362538261972]
シミュレーションから物理システムへ制御ポリシを転送する場合、そのポリシは、動作の変動に対して堅牢でなければならない。
本稿では、動的プログラミングを用いて、コンパクトな状態領域上での最適値関数を計算するRobust Fitted Value Iterationを提案する。
より深い強化学習アルゴリズムや非ロバストなアルゴリズムと比較して、ロバストな値の方が頑健であることを示す。
論文 参考訳(メタデータ) (2021-05-25T19:48:35Z) - Estimating Koopman operators for nonlinear dynamical systems: a
nonparametric approach [77.77696851397539]
Koopman演算子は非線形系の線形記述を可能にする数学的ツールである。
本稿では,その核となる部分を同一フレームワークのデュアルバージョンとして捉え,それらをカーネルフレームワークに組み込む。
カーネルメソッドとKoopman演算子との強力なリンクを確立し、Kernel関数を通じて後者を推定する。
論文 参考訳(メタデータ) (2021-03-25T11:08:26Z) - CKNet: A Convolutional Neural Network Based on Koopman Operator for
Modeling Latent Dynamics from Pixels [5.286010070038216]
そこで我々は,Koopman演算子(CKNet)に基づく畳み込みニューラルネットワーク(CNN)を提案し,生画素から潜時ダイナミクスを同定する。
実験では、32ディムの特定ダイナミクスが有効な120ステップを予測し、明確な画像を生成することが示されています。
論文 参考訳(メタデータ) (2021-02-19T23:29:08Z) - Deep Learning of Koopman Representation for Control [0.0]
提案手法は、制御のために、Deep Neural NetworkベースのKoopman演算子の学習に依存する。
コントローラは純粋にデータ駆動であり、事前のドメイン知識に依存しない。
本手法は,OpenAI Gym環境上の2つの古典力学系に適用し,その性能を実証する。
論文 参考訳(メタデータ) (2020-10-15T06:41:24Z) - Data Driven Control with Learned Dynamics: Model-Based versus Model-Free
Approach [0.0]
モデルベースとモデルフリーの2種類のデータ駆動制御手法を比較した。
最近提案されたDeep Koopman Representation for Control (DKRC)は、未知の非線形力学系を高次元線形系にマッピングするためにディープニューラルネットワークを利用する。
もう1つは、アクター批判アーキテクチャに基づく古典的なモデルフリー制御手法である、Deep Deterministic Policy Gradient (DDPG)は、様々な力学系で有効であることが証明されている。
論文 参考訳(メタデータ) (2020-06-16T22:18:21Z) - Data-driven Koopman Operators for Model-based Shared Control of
Human-Machine Systems [66.65503164312705]
本稿では,データ駆動型共有制御アルゴリズムを提案する。
ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。
モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
論文 参考訳(メタデータ) (2020-06-12T14:14:07Z) - Machine learning in spectral domain [4.724825031148412]
固有値のチューニングは、実際には、ニューラルネットワークのグローバルなトレーニングの実行に対応しています。
固有値に結合したスペクトル学習は、ディープニューラルネットワークの事前トレーニングにも使用できる。
論文 参考訳(メタデータ) (2020-05-29T07:55:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。