論文の概要: Deep Learning of Koopman Representation for Control
- arxiv url: http://arxiv.org/abs/2010.07546v1
- Date: Thu, 15 Oct 2020 06:41:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 05:39:04.111899
- Title: Deep Learning of Koopman Representation for Control
- Title(参考訳): 制御のためのクープマン表現の深層学習
- Authors: Yiqiang Han, Wenjian Hao, Umesh Vaidya
- Abstract要約: 提案手法は、制御のために、Deep Neural NetworkベースのKoopman演算子の学習に依存する。
コントローラは純粋にデータ駆動であり、事前のドメイン知識に依存しない。
本手法は,OpenAI Gym環境上の2つの古典力学系に適用し,その性能を実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop a data-driven, model-free approach for the optimal control of the
dynamical system. The proposed approach relies on the Deep Neural Network (DNN)
based learning of Koopman operator for the purpose of control. In particular,
DNN is employed for the data-driven identification of basis function used in
the linear lifting of nonlinear control system dynamics. The controller
synthesis is purely data-driven and does not rely on a priori domain knowledge.
The OpenAI Gym environment, employed for Reinforcement Learning-based control
design, is used for data generation and learning of Koopman operator in control
setting. The method is applied to two classic dynamical systems on OpenAI Gym
environment to demonstrate the capability.
- Abstract(参考訳): 動的システムの最適制御のためのデータ駆動型モデルフリーアプローチを開発した。
提案手法は、制御のために、Deep Neural Network(DNN)ベースのKoopman演算子の学習に依存する。
特にDNNは非線形制御系力学の線形昇降に使用される基底関数のデータ駆動同定に使用される。
コントローラ合成は純粋にデータ駆動であり、事前のドメイン知識に依存しない。
強化学習に基づく制御設計に使用されるOpenAI Gym環境は、制御設定においてクープマン演算子のデータ生成と学習に使用される。
この手法はOpenAI Gym環境上の2つの古典力学系に適用され,その性能を示す。
関連論文リスト
- Dropout MPC: An Ensemble Neural MPC Approach for Systems with Learned Dynamics [0.0]
そこで本研究では,モンテカルロのドロップアウト手法を学習システムモデルに応用した,サンプリングベースアンサンブルニューラルMPCアルゴリズムを提案する。
この手法は一般に複雑な力学を持つ不確実なシステムを対象としており、第一原理から派生したモデルは推論が難しい。
論文 参考訳(メタデータ) (2024-06-04T17:15:25Z) - Neural Control: Concurrent System Identification and Control Learning with Neural ODE [13.727727205587804]
ニューラル・コントロール(NC)と呼ばれる未知の力学系を制御するニューラル・ODEに基づく手法を提案する。
本モデルは,対象状態へ誘導する最適制御と同様に,システムダイナミクスを同時に学習する。
実験では,未知の力学系の最適制御を学習するためのモデルの有効性を実証した。
論文 参考訳(メタデータ) (2024-01-03T17:05:17Z) - ConCerNet: A Contrastive Learning Based Framework for Automated
Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。
本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2023-02-11T21:07:30Z) - Data-driven End-to-end Learning of Pole Placement Control for Nonlinear
Dynamics via Koopman Invariant Subspaces [37.795752939016225]
クープマン作用素理論に基づくブラックボックス非線形力学系を制御するためのデータ駆動手法を提案する。
制御力学のクープマン作用素の固有値が目標固有値に近いようにポリシーネットワークを訓練する。
提案手法は,モデルレス強化学習やシステム同定によるモデルベース制御よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-08-16T05:57:28Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Supervised DKRC with Images for Offline System Identification [77.34726150561087]
現代の力学系はますます非線形で複雑なものになりつつある。
予測と制御のためのコンパクトで包括的な表現でこれらのシステムをモデル化するフレームワークが必要である。
本手法は,教師付き学習手法を用いてこれらの基礎関数を学習する。
論文 参考訳(メタデータ) (2021-09-06T04:39:06Z) - Stochastic Deep Model Reference Adaptive Control [9.594432031144715]
本稿では,ディープニューラルネットワークを用いたモデル参照適応制御を提案する。
Deep Model Reference Adaptive Controlは、DNNモデルの出力層重みをリアルタイムに適応させるために、リアプノフ法を用いる。
データ駆動型教師付き学習アルゴリズムは、内部層パラメータの更新に使用される。
論文 参考訳(メタデータ) (2021-08-04T14:05:09Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Trajectory-wise Multiple Choice Learning for Dynamics Generalization in
Reinforcement Learning [137.39196753245105]
本稿では,動的一般化のためのマルチヘッドダイナミックスモデルを学習するモデルベース強化学習アルゴリズムを提案する。
文脈学習は,過去の経験から得られる動的情報からコンテキスト潜在ベクトルにエンコードする。
提案手法は,最先端のRL法と比較して,様々な制御タスクにおいて優れたゼロショット一般化性能を示す。
論文 参考訳(メタデータ) (2020-10-26T03:20:42Z) - Data Driven Control with Learned Dynamics: Model-Based versus Model-Free
Approach [0.0]
モデルベースとモデルフリーの2種類のデータ駆動制御手法を比較した。
最近提案されたDeep Koopman Representation for Control (DKRC)は、未知の非線形力学系を高次元線形系にマッピングするためにディープニューラルネットワークを利用する。
もう1つは、アクター批判アーキテクチャに基づく古典的なモデルフリー制御手法である、Deep Deterministic Policy Gradient (DDPG)は、様々な力学系で有効であることが証明されている。
論文 参考訳(メタデータ) (2020-06-16T22:18:21Z) - Data-driven Koopman Operators for Model-based Shared Control of
Human-Machine Systems [66.65503164312705]
本稿では,データ駆動型共有制御アルゴリズムを提案する。
ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。
モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
論文 参考訳(メタデータ) (2020-06-12T14:14:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。