論文の概要: Improving Wind Resistance Performance of Cascaded PID Controlled
Quadcopters using Residual Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2308.01648v1
- Date: Thu, 3 Aug 2023 09:29:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-04 14:37:49.356202
- Title: Improving Wind Resistance Performance of Cascaded PID Controlled
Quadcopters using Residual Reinforcement Learning
- Title(参考訳): 残留強化学習によるカスケードpid制御クワッドコプターの耐風性能向上
- Authors: Yu Ishihara, Yuichi Hazama, Kousuke Suzuki, Jerry Jun Yokono, Kohtaro
Sabe, Kenta Kawamoto
- Abstract要約: 風力抵抗制御は、目標位置からの逸脱を避けるために、クワッドコプターが位置を維持するために欠かせない特徴である。
クワッドコプターの耐風性制御系を構築するための残留強化学習に基づく手法を提案する。
従来のケースドPIDコントローラで制御されたクワッドコプターと比較して,制御器の位置ずれを約50%低減する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Wind resistance control is an essential feature for quadcopters to maintain
their position to avoid deviation from target position and prevent collisions
with obstacles. Conventionally, cascaded PID controller is used for the control
of quadcopters for its simplicity and ease of tuning its parameters. However,
it is weak against wind disturbances and the quadcopter can easily deviate from
target position. In this work, we propose a residual reinforcement learning
based approach to build a wind resistance controller of a quadcopter. By
learning only the residual that compensates the disturbance, we can continue
using the cascaded PID controller as the base controller of the quadcopter but
improve its performance against wind disturbances. To avoid unexpected crashes
and destructions of quadcopters, our method does not require real hardware for
data collection and training. The controller is trained only on a simulator and
directly applied to the target hardware without extra finetuning process. We
demonstrate the effectiveness of our approach through various experiments
including an experiment in an outdoor scene with wind speed greater than 13
m/s. Despite its simplicity, our controller reduces the position deviation by
approximately 50% compared to the quadcopter controlled with the conventional
cascaded PID controller. Furthermore, trained controller is robust and
preserves its performance even though the quadcopter's mass and propeller's
lift coefficient is changed between 50% to 150% from original training time.
- Abstract(参考訳): 風抵抗制御は、目標位置からの逸脱を避け、障害物との衝突を防止するために、クワッドコプターにとって重要な特徴である。
従来、カスケードpidコントローラはクワッドコプターの制御に使われ、そのシンプルさとパラメータのチューニングが容易である。
しかし、風乱に対して弱いため、クワッドコプターは目標位置から容易に逸脱することができる。
本研究では,クワッドコプターの耐風性制御系を構築するための残留強化学習に基づく手法を提案する。
乱れを補う残留物のみを学習することにより、カスケードされたPIDコントローラをクアッドコプターのベースコントローラとして使用し続けることができるが、風乱に対する性能は向上する。
クワッドコプターの予期せぬクラッシュや破壊を避けるため,本手法では実際のハードウェアを必要としない。
コントローラはシミュレータ上でのみトレーニングされ、追加の微調整プロセスなしでターゲットハードウェアに直接適用される。
風速13m/s以上の屋外シーンにおける実験を含む各種実験によるアプローチの有効性を実証した。
その単純さにもかかわらず、従来のカスケードpidコントローラで制御されるクワッドコプターと比較して、位置ずれを約50%低減する。
さらに、訓練された制御装置は、クアッドコプターの質量とプロペラのリフト係数が元の訓練時間から50%から150%に変化しても頑丈で性能を保っている。
関連論文リスト
- From Flies to Robots: Inverted Landing in Small Quadcopters with Dynamic
Perching [15.57055572401334]
逆着陸は、多くの動物のチラシの中で日常的な行動である。
我々は,任意の天井面接触条件に対する制御ポリシーを策定する。
小型クワッドコプターにおいて,強靭な逆着陸動作を達成できた。
論文 参考訳(メタデータ) (2024-02-29T21:09:08Z) - Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
論文 参考訳(メタデータ) (2022-09-19T17:55:05Z) - Skip Training for Multi-Agent Reinforcement Learning Controller for
Industrial Wave Energy Converters [94.84709449845352]
近年のウェーブ・エナジー・コンバータ(WEC)は、発電を最大化するために複数の脚と発電機を備えている。
従来のコントローラは複雑な波のパターンを捕捉する制限を示しており、コントローラはエネルギー捕獲を効率的に最大化する必要がある。
本稿では,従来のスプリングダンパよりも優れたマルチエージェント強化学習コントローラ(MARL)を提案する。
論文 参考訳(メタデータ) (2022-09-13T00:20:31Z) - Neural-Fly Enables Rapid Learning for Agile Flight in Strong Winds [96.74836678572582]
本稿では,ディープラーニングを通じて事前学習した表現を組み込むことで,オンラインでの迅速な適応を可能にする学習ベースのアプローチを提案する。
Neural-Flyは、最先端の非線形かつ適応的なコントローラよりもかなり少ないトラッキングエラーで正確な飛行制御を実現する。
論文 参考訳(メタデータ) (2022-05-13T21:55:28Z) - Reinforcement Learning with Formal Performance Metrics for Quadcopter
Attitude Control under Non-nominal Contexts [2.198760145670348]
本研究では,車両の挙動を定量的に評価し,制御器の性能を計測する信号時間論理の頑健な形式を開発する。
得られた制御器のロバスト性について論じる。これは1つのローターの動力の部分的損失と風洞の巻き上げと、強化学習による実用的な制御器設計の結論の導出による仕上げである。
論文 参考訳(メタデータ) (2021-07-27T16:58:19Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Machine Learning for Mechanical Ventilation Control [52.65490904484772]
圧制御換気における侵襲的機械式換気装置の制御の問題点を考察する。
PIDコントローラは、臨床医が指定する気道圧の軌跡に従って、鎮静患者の肺の空気を入出させる必要があります。
制御器は、PID制御器よりも目標圧力波形をかなりよく追跡できることを示す。
論文 参考訳(メタデータ) (2021-02-12T21:23:33Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Developmental Reinforcement Learning of Control Policy of a Quadcopter
UAV with Thrust Vectoring Rotors [1.0057838324294686]
推力ベクター機能を有するクアッドコプターのための新規な強化学習型制御器を提案する。
このロボットの制御方針は、学習したクワッドコプターの制御装置からポリシー伝達を用いて学習される。
学習方針の性能は、ホバリングとウェイポイントナビゲーションのタスクの物理シミュレーションにより評価される。
論文 参考訳(メタデータ) (2020-07-15T16:17:29Z) - Mid-flight Propeller Failure Detection and Control of
Propeller-deficient Quadcopter using Reinforcement Learning [0.2578242050187029]
本稿では,4,3,2個のプロペラを備えたクアッドコプタ用強化学習型制御器を提案する。
また,プロペラの損失を検知し,適切な制御器に切り替えるニューラルネットワークベースのプロペラ故障検出システムを提案する。
論文 参考訳(メタデータ) (2020-02-26T15:31:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。