Fugu-MT 論文翻訳(概要): AirPilot: A PPO-based DRL Auto-Tuned Nonlinear PID Drone Controller for Robust Autonomous Flights

論文の概要: AirPilot: A PPO-based DRL Auto-Tuned Nonlinear PID Drone Controller for Robust Autonomous Flights

arxiv url: http://arxiv.org/abs/2404.00204v2
Date: Fri, 16 Aug 2024 07:08:59 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-19 20:24:02.548182
Title: AirPilot: A PPO-based DRL Auto-Tuned Nonlinear PID Drone Controller for Robust Autonomous Flights
Title（参考訳）: AirPilot:ロバストな自律飛行のためのPPOベースのDRL自動調整型非線形PIDドローンコントローラ
Authors: Junyang Zhang, Cristian Emanuel Ocampo Rivera, Kyle Tyni, Steven Nguyen, Ulices Santa Cruz Leal, Yasser Shoukry,
Abstract要約: AirPilotコントローラは、PID制御の単純さと有効性と、DRLの適応性、学習能力、最適化能力を組み合わせる。 AirPilotは、ナビゲーションエラーを82%以上削減し、オーバーシュート、スピード、設定時間を大幅に改善する。
参考スコア（独自算出の注目度）: 1.947822083318316
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Navigation precision, speed and stability are crucial for safe UAV flight maneuvers and effective flight mission executions in dynamic environments. Different flight missions may have varying objectives, such as minimizing energy consumption, achieving precise positioning, or maximizing speed. A controller that can adapt to different objectives on the fly is highly valuable. Proportional Integral Derivative controllers are one of the most popular and widely used control algorithms for drones control systems, but their linear control algorithm fails to capture the nonlinear nature of the dynamic wind conditions and complex drone system. Manually tuning the PID gains for various missions can be time-consuming and requires significant expertise. This paper aims to revolutionize drone flight control by presenting the AirPilot, a nonlinear Deep Reinforcement Learning (DRL) - enhanced PID drone controller using Proximal Policy Optimization. AirPilot controller combines the simplicity and effectiveness of traditional PID control with the adaptability, learning capability, and optimization potential of DRL. This makes it better suited for modern drone applications where the environment is dynamic, and mission-specific performance demands are high. We employed a COEX Clover autonomous drone for training the DRL agent within the Gazebo simulator and subsequently implemented it in a real-world lab setting, which marks a significant milestone as one of the first attempts to apply a DRL-based flight controller on an actual drone. Airpilot is capable of reducing the navigation error by more than 82% and improving overshoot, speed and settling time significantly.
Abstract（参考訳）: 航法精度、速度、安定性は、安全なUAV飛行操作および動的環境における効果的な飛行ミッション実行に不可欠である。異なる飛行ミッションには、エネルギー消費の最小化、正確な位置決めの達成、速度の最大化など、様々な目的がある。異なる目的に適応できるコントローラーは、非常に貴重である。 Proportional Integral Derivative Controlsは、ドローン制御システムにおいて最も一般的で広く使われている制御アルゴリズムの1つであるが、その線形制御アルゴリズムは、ダイナミックな風条件や複雑なドローンシステムの非線形特性を捉えていない。手動で様々なミッションのためにPIDのゲインを調整するのは時間がかかるし、かなりの専門知識を必要とする。本稿では,非線型深度強化学習(DRL)によるPID型ドローン制御システムであるAirPilotを提案することで,ドローンの飛行制御に革命をもたらすことを目的とする。 AirPilotコントローラは、従来のPID制御のシンプルさと有効性と、DRLの適応性、学習能力、最適化能力を組み合わせる。これにより、環境が動的であり、ミッション固有のパフォーマンス要求が高い現代のドローンアプリケーションに適している。私たちは、Gazeboシミュレータ内でDRLエージェントをトレーニングするためにCOEX Clover自律ドローンを使用し、その後、実際の実験室でそれを実装しました。 Airpilotは、ナビゲーションエラーを82%以上削減し、オーバーシュート、スピード、設定時間を大幅に改善する。

関連論文リスト

Transformer-Guided Deep Reinforcement Learning for Optimal Takeoff Trajectory Design of an eVTOL Drone [0.0]
電動垂直離着陸機(eVTOL)は、都市交通渋滞を緩和する有望な機会を提供する。従来の最適制御法は、高効率で確立された解を提供するが、問題次元と複雑性によって制限される。深層強化学習(DRL)は、複雑な非線形システムに対処する人工知能の特殊なタイプとして出現する。
論文参考訳（メタデータ） (2025-11-18T20:11:54Z)
Large Language Model-Empowered Decision Transformer for UAV-Enabled Data Collection [71.84636717632206]
空間分散デバイスからの信頼性とエネルギー効率のよいデータ収集のための無人航空機(UAV)は、IoT(Internet of Things)アプリケーションをサポートする上で大きな可能性を秘めている。有効なUAV制御ポリシーを学習するための共同言語モデル(LLM)を提案する。 LLM-CRDTは、現在の最先端DTアプローチよりも最大36.7%高いエネルギー効率を達成し、オンラインおよびオフラインメソッドのベンチマークより優れている。
論文参考訳（メタデータ） (2025-09-17T13:05:08Z)
Toward 6-DOF Autonomous Underwater Vehicle Energy-Aware Position Control based on Deep Reinforcement Learning: Preliminary Results [0.0]
本稿では,Trncated Quantile Critics (TQC)アルゴリズムを用いてホロノミック6-DOF AUVを制御するためのDRLベースの新しいアプローチを提案する。手動のチューニングを必要とせず、スラスタにコマンドを直接送る。
論文参考訳（メタデータ） (2025-02-25T00:37:57Z)
Hovering Flight of Soft-Actuated Insect-Scale Micro Aerial Vehicles using Deep Reinforcement Learning [25.353235604712562]
ソフトアクチュレートされた昆虫型マイクロエアロビー(IMAV)は、堅牢で計算効率のよい制御装置を設計する上で、ユニークな課題を生んでいる。本稿では、システムの遅延と不確実性に対処する深層強化学習(RL)コントローラを設計する。このコントローラは、それぞれ720 mgと850 mgの2つの異なる昆虫スケールの空中ロボットに展開する。
論文参考訳（メタデータ） (2025-02-17T22:45:59Z)
Motion Control in Multi-Rotor Aerial Robots Using Deep Reinforcement Learning [0.0]
本稿では, 付加製造用ドローンの動作制御問題への深層強化学習の適用について検討する。本稿では,AMタスクにおけるウェイポイントナビゲーションを行うマルチロータドローンの適応制御ポリシーを学習するDRLフレームワークを提案する。
論文参考訳（メタデータ） (2025-02-09T19:00:16Z)
Custom Non-Linear Model Predictive Control for Obstacle Avoidance in Indoor and Outdoor Environments [0.0]
本稿では,DJI行列100のための非線形モデル予測制御(NMPC)フレームワークを提案する。このフレームワークは様々なトラジェクトリタイプをサポートし、厳密な操作の精度を制御するためにペナルティベースのコスト関数を採用している。
論文参考訳（メタデータ） (2024-10-03T17:50:19Z)
Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文参考訳（メタデータ） (2024-09-12T11:50:06Z)
Reaching the Limit in Autonomous Racing: Optimal Control versus Reinforcement Learning [66.10854214036605]
ロボット工学における中心的な問題は、アジャイルなモバイルロボットの制御システムをどうやって設計するかである。本稿では、強化学習(RL)で訓練されたニューラルネットワークコントローラが最適制御(OC)法より優れていることを示す。その結果、アジャイルドローンを最大性能に押し上げることができ、最大加速速度は重力加速度の12倍以上、ピーク速度は時速108kmに達しました。
論文参考訳（メタデータ） (2023-10-17T02:40:27Z)
Self-Tuning PID Control via a Hybrid Actor-Critic-Based Neural Structure for Quadcopter Control [0.0]
Proportional-Integrator-Derivative (PID) コントローラは、幅広い産業および実験プロセスで使用されている。モデルパラメータの不確実性と外乱のため、Quadrotorsのような実際のシステムはより堅牢で信頼性の高いPIDコントローラを必要とする。本研究では,Reinforcement-Learning-based Neural Networkを用いた自己調整型PIDコントローラについて検討した。
論文参考訳（メタデータ） (2023-07-03T19:35:52Z)
Real-Time Model-Free Deep Reinforcement Learning for Force Control of a Series Elastic Actuator [56.11574814802912]
最先端のロボットアプリケーションは、歩行、揚力、操作などの複雑なタスクを達成するために、閉ループ力制御を備えた連続弾性アクチュエータ(SEAs)を使用する。モデルフリーPID制御法はSEAの非線形性により不安定になりやすい。深層強化学習は連続制御タスクに有効なモデルレス手法であることが証明されている。
論文参考訳（メタデータ） (2023-04-11T00:51:47Z)
Training Efficient Controllers via Analytic Policy Gradient [44.0762454494769]
ロボットシステムの制御設計は複雑であり、しばしば軌道を正確に追従するために最適化を解く必要がある。 Model Predictive Control (MPC)のようなオンライン最適化手法は、優れたトラッキング性能を実現するために示されているが、高い計算能力を必要とする。本稿では,この問題に対処するための分析政策グラディエント(APG)手法を提案する。
論文参考訳（メタデータ） (2022-09-26T22:04:35Z)
Learning a Single Near-hover Position Controller for Vastly Different Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。また、実行中に未知の障害に迅速に適応する。
論文参考訳（メタデータ） (2022-09-19T17:55:05Z)
Motion Planning and Control for Multi Vehicle Autonomous Racing at High Speeds [100.61456258283245]
本稿では,自律走行のための多層移動計画と制御アーキテクチャを提案する。提案手法はダララのAV-21レースカーに適用され、楕円形のレーストラックで25$m/s2$まで加速試験された。
論文参考訳（メタデータ） (2022-07-22T15:16:54Z)
Neural-Fly Enables Rapid Learning for Agile Flight in Strong Winds [96.74836678572582]
本稿では,ディープラーニングを通じて事前学習した表現を組み込むことで,オンラインでの迅速な適応を可能にする学習ベースのアプローチを提案する。 Neural-Flyは、最先端の非線形かつ適応的なコントローラよりもかなり少ないトラッキングエラーで正確な飛行制御を実現する。
論文参考訳（メタデータ） (2022-05-13T21:55:28Z)
Data-Efficient Deep Reinforcement Learning for Attitude Control of Fixed-Wing UAVs: Field Experiments [0.37798600249187286]
DRLは、元の非線形力学を直接操作する固定翼UAVの姿勢制御をうまく学べることを示す。我々は,UAVで学習したコントローラを飛行試験で展開し,最先端のArduPlane比例積分微分(PID)姿勢制御と同等の性能を示す。
論文参考訳（メタデータ） (2021-11-07T19:07:46Z)
Control Design of Autonomous Drone Using Deep Learning Based Image Understanding Techniques [1.0953917735844645]
本稿では,室内の騒音や不確実性を考慮して,自律飛行を行うための制御器の入力として画像を使用する新しい枠組みを提案する。ノイズの多い環境下でドローン/クワッドコプターの飛行安定性を向上させるために, 微分フィルタを用いた新しいPIDA制御を提案する。
論文参考訳（メタデータ） (2020-04-27T15:50:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。