論文の概要: Learning-based vs Model-free Adaptive Control of a MAV under Wind Gust
- arxiv url: http://arxiv.org/abs/2101.12501v1
- Date: Fri, 29 Jan 2021 10:13:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-01 12:42:38.969560
- Title: Learning-based vs Model-free Adaptive Control of a MAV under Wind Gust
- Title(参考訳): 風洞下でのMAVの学習型対モデルフリー適応制御
- Authors: Thomas Chaffre, Julien Moras, Adrien Chan-Hon-Tong, Julien Marzat,
Karl Sammut, Gilles Le Chenadec, Benoit Clement
- Abstract要約: 未知の条件下でのナビゲーション問題は、制御分野において最も重要でよく研究されている問題の一つである。
近年のモデルフリー適応制御法は, センサフィードバックから直接植物の物理的特性を学習することにより, この依存を除去することを目的としている。
提案手法は,深い強化学習フレームワークによって頑健に調整された完全状態フィードバックコントローラからなる,概念的にシンプルな学習ベースアプローチを提案する。
- 参考スコア(独自算出の注目度): 0.2770822269241973
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Navigation problems under unknown varying conditions are among the most
important and well-studied problems in the control field. Classic model-based
adaptive control methods can be applied only when a convenient model of the
plant or environment is provided. Recent model-free adaptive control methods
aim at removing this dependency by learning the physical characteristics of the
plant and/or process directly from sensor feedback. Although there have been
prior attempts at improving these techniques, it remains an open question as to
whether it is possible to cope with real-world uncertainties in a control
system that is fully based on either paradigm. We propose a conceptually simple
learning-based approach composed of a full state feedback controller, tuned
robustly by a deep reinforcement learning framework based on the Soft
Actor-Critic algorithm. We compare it, in realistic simulations, to a
model-free controller that uses the same deep reinforcement learning framework
for the control of a micro aerial vehicle under wind gust. The results indicate
the great potential of learning-based adaptive control methods in modern
dynamical systems.
- Abstract(参考訳): 未知の様々な条件下でのナビゲーション問題は、制御分野で最も重要な、よく研究された問題の一つです。
古典的なモデルに基づく適応制御法は、植物や環境の便利なモデルが提供される場合にのみ適用できる。
最近のモデルフリー適応制御法は、センサフィードバックから直接プラントやプロセスの性質を学習することで、この依存性を取り除くことを目的としている。
これらの手法を改良する試みは以前からあったが、いずれのパラダイムにもとづく制御システムにおいて、現実的な不確実性に対処できるかどうかについては未解決のままである。
本研究では,ソフトアクタ-クリティックアルゴリズムに基づく深層強化学習フレームワークを用いて,完全な状態フィードバック制御系からなる,概念的に単純な学習ベースアプローチを提案する。
リアルなシミュレーションでは、同じ深層強化学習フレームワークを使用して、風力ガストの下でのマイクロ空中車両の制御を行うモデルフリーのコントローラと比較します。
この結果は,現代の力学系における学習に基づく適応制御手法の大きな可能性を示している。
関連論文リスト
- Sim-to-Real Transfer of Adaptive Control Parameters for AUV
Stabilization under Current Disturbance [1.099532646524593]
本稿では,最大エントロピー深層強化学習フレームワークを古典的なモデルベース制御アーキテクチャと組み合わせ,適応制御系を定式化する新しい手法を提案する。
本フレームワークでは,バイオインスパイアされた体験再生機構,拡張されたドメインランダム化手法,物理プラットフォーム上で実行される評価プロトコルなどを含むSim-to-Real転送戦略を導入する。
実験により,AUVの準最適モデルから有能なポリシを効果的に学習し,実車への移動時の制御性能を3倍に向上することを示した。
論文 参考訳(メタデータ) (2023-10-17T08:46:56Z) - In-Distribution Barrier Functions: Self-Supervised Policy Filters that
Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。
本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文 参考訳(メタデータ) (2023-01-27T22:28:19Z) - A stabilizing reinforcement learning approach for sampled systems with
partially unknown models [0.0]
純粋オンライン学習環境におけるシステム制御器閉ループの実用的安定性を保証する手法を提案する。
要求された結果を達成するため、我々は古典的な適応制御技術を採用する。
この方法は適応的なトラクション制御とクルーズ制御でテストされ、コストを大幅に削減することが判明した。
論文 参考訳(メタデータ) (2022-08-31T09:20:14Z) - Learning Variable Impedance Control for Aerial Sliding on Uneven
Heterogeneous Surfaces by Proprioceptive and Tactile Sensing [42.27572349747162]
本研究では,空中すべり作業に対する学習に基づく適応制御手法を提案する。
提案するコントローラ構造は,データ駆動制御とモデルベース制御を組み合わせたものである。
美術品間相互作用制御手法の微調整状態と比較して,追従誤差の低減と外乱拒否の改善を実現した。
論文 参考訳(メタデータ) (2022-06-28T16:28:59Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Deluca -- A Differentiable Control Library: Environments, Methods, and
Benchmarking [52.44199258132215]
我々は、微分可能な物理学とロボティクス環境のオープンソースライブラリを提示する。
ライブラリには,OpenAI Gymの古典的なコントロール設定など,いくつかのポピュラーな環境がある。
ライブラリを使用して得られた新しい科学的結果のいくつかのユースケースを提供します。
論文 参考訳(メタデータ) (2021-02-19T15:06:47Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Model-Reference Reinforcement Learning for Collision-Free Tracking
Control of Autonomous Surface Vehicles [1.7033108359337459]
提案する制御アルゴリズムは,従来の制御手法と強化学習を組み合わせることで,制御精度と知性を向上させる。
強化学習により、全体トラッキングコントローラはモデルの不確実性を補償し、衝突回避を実現することができる。
論文 参考訳(メタデータ) (2020-08-17T12:15:15Z) - Model-Reference Reinforcement Learning Control of Autonomous Surface
Vehicles with Uncertainties [1.7033108359337459]
提案した制御は,従来の制御手法と深層強化学習を組み合わせたものである。
強化学習により,不確かさのモデリングを補うための制御法を直接学習することができる。
従来の深層強化学習法と比較して,提案した学習に基づく制御は安定性を保証し,サンプル効率を向上することができる。
論文 参考訳(メタデータ) (2020-03-30T22:02:13Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。