論文の概要: Designing a Robust Low-Level Agnostic Controller for a Quadrotor with
Actor-Critic Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2210.02964v1
- Date: Thu, 6 Oct 2022 14:58:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 17:56:25.676691
- Title: Designing a Robust Low-Level Agnostic Controller for a Quadrotor with
Actor-Critic Reinforcement Learning
- Title(参考訳): Actor-Critic Reinforcement Learning を用いた擬ドロレータのロバスト低レベルアグノスティック制御系の設計
- Authors: Guilherme Siqueira Eduardo and Wouter Caarls
- Abstract要約: ソフトアクター・クリティカルに基づく低レベルウェイポイント誘導制御器の訓練段階におけるドメインランダム化を提案する。
トレーニング中の四元数力学に一定の不確実性を導入することにより、より大規模な四元数パラメータを用いて提案課題を実行することができる制御器が得られることを示す。
- 参考スコア(独自算出の注目度): 0.38073142980732994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Purpose: Real-life applications using quadrotors introduce a number of
disturbances and time-varying properties that pose a challenge to flight
controllers. We observed that, when a quadrotor is tasked with picking up and
dropping a payload, traditional PID and RL-based controllers found in
literature struggle to maintain flight after the vehicle changes its dynamics
due to interaction with this external object.
Methods: In this work, we introduce domain randomization during the training
phase of a low-level waypoint guidance controller based on Soft Actor-Critic.
The resulting controller is evaluated on the proposed payload pick up and drop
task with added disturbances that emulate real-life operation of the vehicle.
Results & Conclusion: We show that, by introducing a certain degree of
uncertainty in quadrotor dynamics during training, we can obtain a controller
that is capable to perform the proposed task using a larger variation of
quadrotor parameters. Additionally, the RL-based controller outperforms a
traditional positional PID controller with optimized gains in this task, while
remaining agnostic to different simulation parameters.
- Abstract(参考訳): 目的: クワッドローターを用いた実生活アプリケーションは、飛行制御装置に挑戦する多くの外乱と時間変動特性をもたらす。
従来のPIDとRLをベースとした制御器は,積載物を積載し降ろす作業を行う場合,外部物体との相互作用により車両の挙動が変化した後の飛行維持に苦慮している。
方法:本研究では,ソフトアクター・クリティカルに基づく低レベルウェイポイント誘導制御器の訓練段階における領域ランダム化を提案する。
提案するペイロードピックアップ・アンド・ドロップタスクにおいて、車両の実運用をエミュレートする外乱を付加した制御器を評価する。
結果と結論: トレーニング中に四重項力学にある程度の不確実性を導入することにより, 提案するタスクをより多種多様な四重項パラメータを用いて実行可能なコントローラを得ることができることを示す。
さらに、RLベースのコントローラは、このタスクで最適化されたゲインを持つ従来の位置PIDコントローラよりも優れ、異なるシミュレーションパラメータに依存しないままである。
関連論文リスト
- Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - ReACT: Reinforcement Learning for Controller Parametrization using
B-Spline Geometries [0.0]
本研究は,N次元B-スプライン測地(BSG)を用いた深部強化学習(DRL)を用いた新しいアプローチを提案する。
本稿では,操作条件に依存する複雑な振る舞いを持つシステムのクラスであるパラメータ変量システムの制御に焦点をあてる。
多数の動作条件に依存するコントローラパラメータをマッピングするために,BSGを導入し,適応処理をより効率的にする。
論文 参考訳(メタデータ) (2024-01-10T16:27:30Z) - Modelling, Positioning, and Deep Reinforcement Learning Path Tracking
Control of Scaled Robotic Vehicles: Design and Experimental Validation [3.807917169053206]
スケールされたロボットカーは通常、車両の状態の推定と制御に特化したタスクを含む階層的な制御機構を備えている。
本稿では, (i) フェデレートされた拡張カルマンフィルタ (FEKF) と (ii) エキスパートデモレータを用いて訓練された新しい深部強化学習 (DRL) パストラッキングコントローラを提案する。
実験により検証されたモデルは、(i)FEKFの設計を支援するために使用され、(ii)DRLに基づく経路追跡アルゴリズムをトレーニングするためのデジタルツインとして機能する。
論文 参考訳(メタデータ) (2024-01-10T14:40:53Z) - Why Change Your Controller When You Can Change Your Planner: Drag-Aware
Trajectory Generation for Quadrotor Systems [10.101847906979435]
輸送ペイロードからの非モデル化された空気力学的抵抗力は破滅的な結果をもたらす可能性がある。
制御器の固定を保ちながら軌道生成部品を適応させることで軌道追跡を改善できると主張している。
シミュレーションとハードウェアプラットフォームCrzyflieで行った実験では、プランナーの変更によってトラッキングエラーが最大83%削減された。
論文 参考訳(メタデータ) (2024-01-10T07:00:07Z) - Tuning Legged Locomotion Controllers via Safe Bayesian Optimization [47.87675010450171]
本稿では,ロボットハードウェアプラットフォームにおけるモデルベースコントローラの展開を効率化するための,データ駆動型戦略を提案する。
モデルフリーな安全な学習アルゴリズムを用いて制御ゲインのチューニングを自動化し、制御定式化で使用される単純化されたモデルと実システムとのミスマッチに対処する。
論文 参考訳(メタデータ) (2023-06-12T13:10:14Z) - Performance-Driven Controller Tuning via Derivative-Free Reinforcement
Learning [6.5158195776494]
我々は,新しい微分自由強化学習フレームワークを用いて,制御器のチューニング問題に取り組む。
我々は,PIDコントローラを用いた適応走行制御とMPCコントローラを用いた軌道追跡という,自律走行による2つの具体例に関する数値実験を行った。
実験の結果,提案手法は一般的なベースラインよりも優れており,コントローラチューニングの強い可能性を強調している。
論文 参考訳(メタデータ) (2022-09-11T13:01:14Z) - Policy Search for Model Predictive Control with Application to Agile
Drone Flight [56.24908013905407]
MPCのためのポリシ・フォー・モデル・予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
シミュレーションと実環境の両方において,我々の制御器が堅牢かつリアルタイムに制御性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2021-12-07T17:39:24Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - DiffLoop: Tuning PID controllers by differentiating through the feedback
loop [8.477619837043214]
本稿では,PIDチューニングとアンチ・ウィンドアップ対策について検討する。
特に、コスト関数を用いて、制御性能を向上させるために勾配を生成する。
論文 参考訳(メタデータ) (2021-06-19T15:26:46Z) - Machine Learning for Mechanical Ventilation Control [52.65490904484772]
圧制御換気における侵襲的機械式換気装置の制御の問題点を考察する。
PIDコントローラは、臨床医が指定する気道圧の軌跡に従って、鎮静患者の肺の空気を入出させる必要があります。
制御器は、PID制御器よりも目標圧力波形をかなりよく追跡できることを示す。
論文 参考訳(メタデータ) (2021-02-12T21:23:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。