論文の概要: Online-Learning Deep Neuro-Adaptive Dynamic Inversion Controller for
Model Free Control
- arxiv url: http://arxiv.org/abs/2107.10383v1
- Date: Wed, 21 Jul 2021 22:46:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-23 15:20:29.711934
- Title: Online-Learning Deep Neuro-Adaptive Dynamic Inversion Controller for
Model Free Control
- Title(参考訳): モデル自由制御のためのオンライン学習型ディープニューロ適応動的インバージョン制御
- Authors: Nathan Lutes and K. Krishnamurthy and Venkata Sriram Siddhardh
Nadendla and S. N. Balakrishnan
- Abstract要約: ニュートラル適応コントローラは、新しい重み更新法則に基づいて訓練されたディープニューラルネットワークを特徴とする実装である。
制御器は、非線形プラントを迅速に学習することができ、追従制御問題において優れた性能を示す。
- 参考スコア(独自算出の注目度): 1.3764085113103217
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adaptive methods are popular within the control literature due to the
flexibility and forgiveness they offer in the area of modelling. Neural network
adaptive control is favorable specifically for the powerful nature of the
machine learning algorithm to approximate unknown functions and for the ability
to relax certain constraints within traditional adaptive control. Deep neural
networks are large framework networks with vastly superior approximation
characteristics than their shallow counterparts. However, implementing a deep
neural network can be difficult due to size specific complications such as
vanishing/exploding gradients in training. In this paper, a neuro-adaptive
controller is implemented featuring a deep neural network trained on a new
weight update law that escapes the vanishing/exploding gradient problem by only
incorporating the sign of the gradient. The type of controller designed is an
adaptive dynamic inversion controller utilizing a modified state observer in a
secondary estimation loop to train the network. The deep neural network learns
the entire plant model on-line, creating a controller that is completely model
free. The controller design is tested in simulation on a 2 link planar robot
arm. The controller is able to learn the nonlinear plant quickly and displays
good performance in the tracking control problem.
- Abstract(参考訳): 適応的手法は、モデリングの領域で提供される柔軟性と許しのために制御文学の中で人気がある。
ニューラルネットワーク適応制御は、未知の関数を近似する機械学習アルゴリズムの強力な性質と、従来の適応制御における特定の制約を緩和する能力に特に好ましい。
ディープニューラルネットワークは、浅いフレームワークに比べて近似特性が非常に優れている大規模なフレームワークネットワークである。
しかし,深層ニューラルネットワークの実装は,学習中の勾配の消失・爆発などの複雑度が大きいため困難である。
本稿では,新しい重み更新法に基づいて訓練された深層ニューラルネットワークを特徴とするニューロ適応制御器を実装し,勾配の符号のみを組み込むことで,消失・爆発勾配問題から逃れる。
設計したコントローラのタイプは、二次推定ループの修正状態オブザーバを利用してネットワークをトレーニングする適応動的インバージョンコントローラである。
ディープニューラルネットワークは、植物モデル全体をオンラインで学習し、完全にモデルフリーのコントローラを作成する。
コントローラの設計は、2リンクの平面ロボットアームでシミュレーションでテストされる。
コントローラは非線形植物を素早く学習でき、トラッキング制御問題において優れた性能を示す。
関連論文リスト
- Auto-Train-Once: Controller Network Guided Automatic Network Pruning from Scratch [72.26822499434446]
オートトレインオース (Auto-Train-Once, ATO) は、DNNの計算コストと記憶コストを自動的に削減するために設計された、革新的なネットワークプルーニングアルゴリズムである。
総合的な収束解析と広範な実験を行い,本手法が様々なモデルアーキテクチャにおける最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2024-03-21T02:33:37Z) - Neural Control: Concurrent System Identification and Control Learning with Neural ODE [13.727727205587804]
ニューラル・コントロール(NC)と呼ばれる未知の力学系を制御するニューラル・ODEに基づく手法を提案する。
本モデルは,対象状態へ誘導する最適制御と同様に,システムダイナミクスを同時に学習する。
実験では,未知の力学系の最適制御を学習するためのモデルの有効性を実証した。
論文 参考訳(メタデータ) (2024-01-03T17:05:17Z) - Rational Neural Network Controllers [0.0]
最近の研究は、制御システム(ニューラルフィードバックループとして知られる)におけるニューラルネットワークの有効性を実証している。
このアプローチの大きな課題のひとつは、ニューラルネットワークが敵の攻撃に敏感であることが示されていることだ。
本稿では、有理性ニューラルネットワークを考察し、ニューラルフィードバックループのロバストネス問題に有効に使用できる新しい有理性活性化関数を提案する。
論文 参考訳(メタデータ) (2023-07-12T16:35:41Z) - Closed-form control with spike coding networks [1.1470070927586016]
スパイキングニューラルネットワーク(SNN)を用いた効率的かつ堅牢な制御は、依然として未解決の問題である。
スパイク符号化ネットワーク(SCN)の神経科学理論を,クローズドフォームの最適推定と制御を取り入れて拡張する。
模擬スプリング・マス・ダンパーおよびカート・ポールシステムのロバストなスパイク制御を実証した。
論文 参考訳(メタデータ) (2022-12-25T10:32:20Z) - Experimental study of Neural ODE training with adaptive solver for
dynamical systems modeling [72.84259710412293]
アダプティブと呼ばれるいくつかのODEソルバは、目の前の問題の複雑さに応じて評価戦略を適用することができる。
本稿では,動的システムモデリングのためのブラックボックスとして適応型ソルバをシームレスに利用できない理由を示すための簡単な実験について述べる。
論文 参考訳(メタデータ) (2022-11-13T17:48:04Z) - Neurosymbolic hybrid approach to driver collision warning [64.02492460600905]
自律運転システムには2つの主要なアルゴリズムアプローチがある。
ディープラーニングだけでは、多くの分野で最先端の結果が得られています。
しかし、ディープラーニングモデルが機能しない場合、デバッグが非常に難しい場合もあります。
論文 参考訳(メタデータ) (2022-03-28T20:29:50Z) - Deep Q-learning: a robust control approach [4.125187280299247]
ニューラルネットワークカーネルを用いて不確実な線形時間不変モデルを定式化し,学習を記述する。
周波数領域におけるエージェントの動作を学習し解析することの不安定さを示す。
OpenAI Gym環境における数値シミュレーションにより,$mathcalH_infty$制御学習はDouble Deep Q-learningよりも若干優れていたことが示唆された。
論文 参考訳(メタデータ) (2022-01-21T09:47:34Z) - Provable Regret Bounds for Deep Online Learning and Control [77.77295247296041]
我々は、損失関数がニューラルネットワークのパラメータを最適化するために適応できることを示し、後から最も優れたネットと競合することを示す。
オンライン設定におけるこれらの結果の適用として、オンライン制御コントローラの証明可能なバウンダリを得る。
論文 参考訳(メタデータ) (2021-10-15T02:13:48Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Dynamic Modeling and Adaptive Controlling in GPS-Intelligent Buoy (GIB)
Systems Based on Neural-Fuzzy Networks [0.0]
本稿では, バックステッピング技術を用いて, 改良されたニューラルネットワークによる海洋ブイの位置決めに動的システムモデリングを適用した。
数値的および得られた結果から,制御系は比較的少ない位置誤差でブイの経路と位置を所望の目的に調整できることを示した。
論文 参考訳(メタデータ) (2020-04-03T17:28:53Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。