論文の概要: Reinforcement Learning with Formal Performance Metrics for Quadcopter
Attitude Control under Non-nominal Contexts
- arxiv url: http://arxiv.org/abs/2107.12942v1
- Date: Tue, 27 Jul 2021 16:58:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-28 16:33:19.821706
- Title: Reinforcement Learning with Formal Performance Metrics for Quadcopter
Attitude Control under Non-nominal Contexts
- Title(参考訳): 非名詞文脈下でのクワッドコプター姿勢制御のための形式的性能指標を用いた強化学習
- Authors: Nicola Bernini, Mikhail Bessa, R\'emi Delmas, Arthur Gold, Eric
Goubault, Romain Pennec, Sylvie Putot, Fran\c{c}ois Sillion
- Abstract要約: 本研究では,車両の挙動を定量的に評価し,制御器の性能を計測する信号時間論理の頑健な形式を開発する。
得られた制御器のロバスト性について論じる。これは1つのローターの動力の部分的損失と風洞の巻き上げと、強化学習による実用的な制御器設計の結論の導出による仕上げである。
- 参考スコア(独自算出の注目度): 2.198760145670348
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We explore the reinforcement learning approach to designing controllers by
extensively discussing the case of a quadcopter attitude controller. We provide
all details allowing to reproduce our approach, starting with a model of the
dynamics of a crazyflie 2.0 under various nominal and non-nominal conditions,
including partial motor failures and wind gusts. We develop a robust form of a
signal temporal logic to quantitatively evaluate the vehicle's behavior and
measure the performance of controllers. The paper thoroughly describes the
choices in training algorithms, neural net architecture, hyperparameters,
observation space in view of the different performance metrics we have
introduced. We discuss the robustness of the obtained controllers, both to
partial loss of power for one rotor and to wind gusts and finish by drawing
conclusions on practical controller design by reinforcement learning.
- Abstract(参考訳): クワッドコプターの姿勢制御装置の事例を広く議論し, 制御器の設計における強化学習手法を検討する。
本研究は, 運動障害や風洞など, 名目上および非公称条件下でのクレーフフリー2.0の力学モデルから始めることで, われわれのアプローチを再現できるすべての詳細を提示する。
我々は,車両の挙動を定量的に評価し,制御器の性能を測定するための信号時間論理の頑健な形式を開発する。
この論文は、私たちが導入したさまざまなパフォーマンス指標の観点から、トレーニングアルゴリズム、ニューラルネットアーキテクチャ、ハイパーパラメータ、観察空間の選択肢を詳しく説明している。
得られた制御器のロバスト性について論じる。1つのローターの動力の部分的損失と風洞の巻き上げと、強化学習による実用的な制御器設計の結論の導出による仕上げについて述べる。
関連論文リスト
- Model-Free versus Model-Based Reinforcement Learning for Fixed-Wing UAV
Attitude Control Under Varying Wind Conditions [1.474723404975345]
本稿では、PIDを基準点として、固定翼無人航空機の姿勢制御のためのモデルフリーおよびモデルベース強化学習の性能を評価し、比較する。
その結果, 時間差モデル予測制御は, PIDコントローラと他のモデルレス強化学習法の両方で, 精度と頑健さの点で優れていた。
論文 参考訳(メタデータ) (2024-09-26T14:47:14Z) - Modelling, Positioning, and Deep Reinforcement Learning Path Tracking
Control of Scaled Robotic Vehicles: Design and Experimental Validation [3.807917169053206]
スケールされたロボットカーは通常、車両の状態の推定と制御に特化したタスクを含む階層的な制御機構を備えている。
本稿では, (i) フェデレートされた拡張カルマンフィルタ (FEKF) と (ii) エキスパートデモレータを用いて訓練された新しい深部強化学習 (DRL) パストラッキングコントローラを提案する。
実験により検証されたモデルは、(i)FEKFの設計を支援するために使用され、(ii)DRLに基づく経路追跡アルゴリズムをトレーニングするためのデジタルツインとして機能する。
論文 参考訳(メタデータ) (2024-01-10T14:40:53Z) - A Reinforcement Learning Approach for Robust Supervisory Control of UAVs
Under Disturbances [1.8799681615947088]
無人航空機(UAV)の監視強化学習制御手法を提案する。
我々は,既存の組込み制御と交差する監視制御アーキテクチャを定式化し,悪風の形での環境障害に対する堅牢性を示す。
論文 参考訳(メタデータ) (2023-05-21T19:00:06Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - Designing a Robust Low-Level Agnostic Controller for a Quadrotor with
Actor-Critic Reinforcement Learning [0.38073142980732994]
ソフトアクター・クリティカルに基づく低レベルウェイポイント誘導制御器の訓練段階におけるドメインランダム化を提案する。
トレーニング中の四元数力学に一定の不確実性を導入することにより、より大規模な四元数パラメータを用いて提案課題を実行することができる制御器が得られることを示す。
論文 参考訳(メタデータ) (2022-10-06T14:58:19Z) - Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
論文 参考訳(メタデータ) (2022-09-19T17:55:05Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - Is Disentanglement enough? On Latent Representations for Controllable
Music Generation [78.8942067357231]
強い生成デコーダが存在しない場合、アンタングル化は必ずしも制御性を意味するものではない。
VAEデコーダに対する潜伏空間の構造は、異なる属性を操作するための生成モデルの能力を高める上で重要な役割を果たす。
論文 参考訳(メタデータ) (2021-08-01T18:37:43Z) - Bidirectional Interaction between Visual and Motor Generative Models
using Predictive Coding and Active Inference [68.8204255655161]
本稿では,感覚予測のための生成モデルと,運動軌跡の生成モデルからなるニューラルアーキテクチャを提案する。
我々は,知覚予測のシーケンスが学習,制御,オンライン適応を導くレールとしてどのように機能するかを強調する。
論文 参考訳(メタデータ) (2021-04-19T09:41:31Z) - Robust Behavioral Cloning for Autonomous Vehicles using End-to-End
Imitation Learning [0.4588028371034407]
本稿では、エンド・ツー・エンドの模倣学習を用いて、人間の運転者の頑健な行動クローンのための軽量パイプラインを提案する。
提案されたパイプラインは、シミュレートされた車両に3つの異なる運転行動モデルの訓練と展開に使用された。
論文 参考訳(メタデータ) (2020-10-09T19:03:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。