論文の概要: Data Driven Control with Learned Dynamics: Model-Based versus Model-Free
Approach
- arxiv url: http://arxiv.org/abs/2006.09543v1
- Date: Tue, 16 Jun 2020 22:18:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 20:29:18.878394
- Title: Data Driven Control with Learned Dynamics: Model-Based versus Model-Free
Approach
- Title(参考訳): 学習ダイナミクスを用いたデータ駆動制御:モデルベース対モデルフリーアプローチ
- Authors: Wenjian Hao, Yiqiang Han
- Abstract要約: モデルベースとモデルフリーの2種類のデータ駆動制御手法を比較した。
最近提案されたDeep Koopman Representation for Control (DKRC)は、未知の非線形力学系を高次元線形系にマッピングするためにディープニューラルネットワークを利用する。
もう1つは、アクター批判アーキテクチャに基づく古典的なモデルフリー制御手法である、Deep Deterministic Policy Gradient (DDPG)は、様々な力学系で有効であることが証明されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper compares two different types of data-driven control methods,
representing model-based and model-free approaches. One is a recently proposed
method - Deep Koopman Representation for Control (DKRC), which utilizes a deep
neural network to map an unknown nonlinear dynamical system to a
high-dimensional linear system, which allows for employing state-of-the-art
control strategy. The other one is a classic model-free control method based on
an actor-critic architecture - Deep Deterministic Policy Gradient (DDPG), which
has been proved to be effective in various dynamical systems. The comparison is
carried out in OpenAI Gym, which provides multiple control environments for
benchmark purposes. Two examples are provided for comparison, i.e., classic
Inverted Pendulum and Lunar Lander Continuous Control. From the results of the
experiments, we compare these two methods in terms of control strategies and
the effectiveness under various initialization conditions. We also examine the
learned dynamic model from DKRC with the analytical model derived from the
Euler-Lagrange Linearization method, which demonstrates the accuracy in the
learned model for unknown dynamics from a data-driven sample-efficient
approach.
- Abstract(参考訳): 本稿では,モデルベースとモデルフリーの2種類のデータ駆動制御手法を比較する。
最近提案されたDeep Koopman Representation for Control (DKRC)は、未知の非線形力学系を高次元線形系にマッピングするためにディープニューラルネットワークを利用する。
もう1つは、アクター批判アーキテクチャに基づく古典的なモデルフリー制御手法である、Deep Deterministic Policy Gradient (DDPG)は、様々な力学系で有効であることが証明されている。
ベンチマーク目的で複数のコントロール環境を提供するOpenAI Gymで比較が行われる。
比較には、古典的逆振り子と月着陸連続制御という2つの例がある。
実験の結果から,これら2つの手法を制御戦略と様々な初期化条件における有効性の観点から比較した。
また,データ駆動型サンプル効率アプローチによる未知ダイナミクスの学習モデルの精度を示すeuler-lagrange線形化法による解析モデルを用いて,dkrcから得られた学習動的モデルについて検討した。
関連論文リスト
- Active Learning for Control-Oriented Identification of Nonlinear Systems [26.231260751633307]
本稿では,非線形力学の一般クラスに適した能動学習アルゴリズムの最初の有限サンプル解析について述べる。
ある設定では、アルゴリズムの過剰な制御コストは、対数係数まで、最適な速度を達成する。
我々は,非線形システムの制御におけるアクティブな制御指向探索の利点を示すとともに,シミュレーションにおける我々のアプローチを検証する。
論文 参考訳(メタデータ) (2024-04-13T15:40:39Z) - Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - A Data-Driven Model-Reference Adaptive Control Approach Based on
Reinforcement Learning [4.817429789586126]
ここではモデル参照適応解が自律系に対して開発され、ハミルトン・ヤコビ・ベルマン方程式の誤差に基づく構造を解く。
これは、制御戦略におけるプロセスまたは参照モデルのダイナミクスを知らずにリアルタイムに行われる。
論文 参考訳(メタデータ) (2023-03-17T14:10:52Z) - Model-Based Reinforcement Learning with SINDy [0.0]
強化学習(RL)における物理系の非線形力学を規定する新しい手法を提案する。
本手法は,技術モデル学習アルゴリズムの状態よりもはるかに少ないトラジェクトリを用いて,基礎となるダイナミクスを発見することができることを確認した。
論文 参考訳(メタデータ) (2022-08-30T19:03:48Z) - Dynamically-Scaled Deep Canonical Correlation Analysis [77.34726150561087]
カノニカル相関解析 (CCA) は, 2つのビューの特徴抽出手法である。
本稿では,入力依存の正準相関モデルをトレーニングするための新しい動的スケーリング手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T12:52:49Z) - Learning to Generate Content-Aware Dynamic Detectors [62.74209921174237]
サンプル適応型モデルアーキテクチャを自動的に生成する効率的な検出器の設計を新たに導入する。
動的ルーティングの学習を導くために、オブジェクト検出に適したコースツーファインの成層図を紹介します。
MS-COCOデータセットの実験により、CADDetはバニラルーティングに比べて10%少ないFLOPで1.8以上のmAPを達成することが示された。
論文 参考訳(メタデータ) (2020-12-08T08:05:20Z) - DyNODE: Neural Ordinary Differential Equations for Dynamics Modeling in
Continuous Control [0.0]
本稿では,ニューラル常微分方程式の枠組みに制御を組み込むことにより,システムの基盤となる力学を捉える新しい手法を提案する。
以上の結果から,アクター批判強化学習アルゴリズムと組み合わせた単純なDyNODEアーキテクチャが,標準ニューラルネットワークより優れていることが示唆された。
論文 参考訳(メタデータ) (2020-09-09T12:56:58Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z) - Combining Model-Based and Model-Free Methods for Nonlinear Control: A
Provably Convergent Policy Gradient Approach [10.648049177775686]
本研究では,線形モデルを用いてモデルフリーなポリシー手法の温かいスタートを定義する新しい手法を開発する。
このハイブリッドアプローチは,モデルフリーアプローチに関連する収束問題を回避しつつ,モデルベースコントローラよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-12T21:16:29Z) - Data-driven Koopman Operators for Model-based Shared Control of
Human-Machine Systems [66.65503164312705]
本稿では,データ駆動型共有制御アルゴリズムを提案する。
ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。
モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
論文 参考訳(メタデータ) (2020-06-12T14:14:07Z) - Model-Augmented Actor-Critic: Backpropagating through Paths [81.86992776864729]
現在のモデルに基づく強化学習アプローチでは、単に学習されたブラックボックスシミュレータとしてモデルを使用する。
その微分可能性を利用してモデルをより効果的に活用する方法を示す。
論文 参考訳(メタデータ) (2020-05-16T19:18:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。