論文の概要: Soft Actor-Critic Deep Reinforcement Learning for Fault Tolerant Flight
Control
- arxiv url: http://arxiv.org/abs/2202.09262v1
- Date: Wed, 16 Feb 2022 07:22:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-21 14:52:30.289991
- Title: Soft Actor-Critic Deep Reinforcement Learning for Fault Tolerant Flight
Control
- Title(参考訳): 耐故障飛行制御のためのソフトアクター・クリティカル深部強化学習
- Authors: Killian Dally, Erik-Jan van Kampen
- Abstract要約: オフライントレーニングされたソフトアクター・クリティカル深部強化学習コントローラは、高度に結合した操作で成功している。
制御器は6つの故障事例に対して堅牢であり、その中には15デグで詰まった舵、アイレロンの有効性を70%低下させ、構造的故障、アイシング、後向きのc.g.シフトなどが含まれる。
- 参考スコア(独自算出の注目度): 3.236217153362305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fault-tolerant flight control faces challenges, as developing a model-based
controller for each unexpected failure is unrealistic, and online learning
methods can handle limited system complexity due to their low sample
efficiency. In this research, a model-free coupled-dynamics flight controller
for a jet aircraft able to withstand multiple failure types is proposed. An
offline trained cascaded Soft Actor-Critic Deep Reinforcement Learning
controller is successful on highly coupled maneuvers, including a coordinated
40 degree bank climbing turn with a normalized Mean Absolute Error of 2.64%.
The controller is robust to six failure cases, including the rudder jammed at
-15 deg, the aileron effectiveness reduced by 70%, a structural failure, icing
and a backward c.g. shift as the response is stable and the climbing turn is
completed successfully. Robustness to biased sensor noise, atmospheric
disturbances, and to varying initial flight conditions and reference signal
shapes is also demonstrated.
- Abstract(参考訳): 予期せぬ障害毎にモデルベースのコントローラを開発することは非現実的であり、オンライン学習手法はサンプル効率が低いため、システムの複雑さを制限できる。
本研究では,複数の故障タイプに耐えられるジェット機用モデルフリー結合力学飛行制御装置を提案する。
オフラインで訓練されたソフトアクタ-クリティック深層強化学習コントローラは、正規化平均絶対誤差2.64%の40度バンククライミングターンを含む、高度に結合した操作で成功している。
制御器は、15デグでジャムされた舵、アイレロン効果を70%減少させ、応答が安定してクライミングターンが正常に完了すると、構造的故障、アイシング及び後方c.g.シフトを含む6つの故障事例に対して堅牢である。
また, バイアスセンサノイズ, 大気障害, 初期飛行条件および基準信号形状の変動に対するロバスト性も示された。
関連論文リスト
- Why Change Your Controller When You Can Change Your Planner: Drag-Aware
Trajectory Generation for Quadrotor Systems [10.101847906979435]
輸送ペイロードからの非モデル化された空気力学的抵抗力は破滅的な結果をもたらす可能性がある。
制御器の固定を保ちながら軌道生成部品を適応させることで軌道追跡を改善できると主張している。
シミュレーションとハードウェアプラットフォームCrzyflieで行った実験では、プランナーの変更によってトラッキングエラーが最大83%削減された。
論文 参考訳(メタデータ) (2024-01-10T07:00:07Z) - DATT: Deep Adaptive Trajectory Tracking for Quadrotor Control [62.24301794794304]
Deep Adaptive Trajectory Tracking (DATT)は、学習に基づくアプローチであり、現実世界の大きな乱れの存在下で、任意の、潜在的に実現不可能な軌跡を正確に追跡することができる。
DATTは、非定常風場における可溶性および非実用性の両方の軌道に対して、競争適応性非線形およびモデル予測コントローラを著しく上回っている。
適応非線形モデル予測制御ベースラインの1/4未満である3.2ms未満の推論時間で、効率的にオンラインで実行することができる。
論文 参考訳(メタデータ) (2023-10-13T12:22:31Z) - Actuator Trajectory Planning for UAVs with Overhead Manipulator using
Reinforcement Learning [0.3222802562733786]
制御可能なアームを備えたUAVを2自由度で開発し、飛行中に作動作業を行う。
我々のソリューションは、腕の先端の軌跡を制御するためのQ-learning法(End-effector)を用いています。
提案手法は,15,000エピソードのQ-ラーニングを用いて,平均変位誤差の92%の精度を実現する。
論文 参考訳(メタデータ) (2023-08-24T15:06:23Z) - Real-Time Model-Free Deep Reinforcement Learning for Force Control of a
Series Elastic Actuator [56.11574814802912]
最先端のロボットアプリケーションは、歩行、揚力、操作などの複雑なタスクを達成するために、閉ループ力制御を備えた連続弾性アクチュエータ(SEAs)を使用する。
モデルフリーPID制御法はSEAの非線形性により不安定になりやすい。
深層強化学習は連続制御タスクに有効なモデルレス手法であることが証明されている。
論文 参考訳(メタデータ) (2023-04-11T00:51:47Z) - A GOA-Based Fault-Tolerant Trajectory Tracking Control for an Underwater
Vehicle of Multi-Thruster System without Actuator Saturation [9.371458775465825]
本稿では,スラスタ損傷(パワーロス)を受けた水中車両(UV)の軌道追尾問題に対処するために,インテリジェントな耐故障制御(FTC)戦略を提案する。
提案した制御戦略では、速度変化を制御する改良されたバックステッピングアルゴリズムにより軌道追跡成分を形成し、スライディングモード制御によりトルク/フォース出力を減算する。
論文 参考訳(メタデータ) (2023-01-04T21:30:16Z) - Online Model-Free Reinforcement Learning for the Automatic Control of a
Flexible Wing Aircraft [2.3204178451683264]
フレキシブルウィング航空機の制御問題は、高次かつ高非線形な変形のために困難である。
フレキシブルウィング航空構造物のための価値強化学習プロセスに基づくオンライン制御機構を開発した。
モデルフリー制御ポリシーフレームワークと、システムのベルマン最適性方程式を解くために収束適応学習アーキテクチャを採用している。
論文 参考訳(メタデータ) (2021-08-05T06:10:37Z) - Regularizing Action Policies for Smooth Control with Reinforcement
Learning [47.312768123967025]
Conditioning for Action Policy Smoothness(CAPS)は、アクションポリシーの効果的な直感的な正規化である。
capsは、ニューラルネットワークコントローラの学習状態-動作マッピングの滑らかさを一貫して改善する。
実システムでテストしたところ、クアドロタードローンのコントローラーの滑らかさが改善され、消費電力は80%近く削減された。
論文 参考訳(メタデータ) (2020-12-11T21:35:24Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Comparison of Model Predictive and Reinforcement Learning Methods for
Fault Tolerant Control [2.524528674141466]
階層的強化学習に基づく離散時間系に対する2つの適応型耐故障制御方式を提案する。
実験により、強化学習に基づく制御器は、故障下のモデル予測制御器、部分的に観測可能なシステムモデル、様々なセンサノイズレベルよりも堅牢に動作することが示されている。
論文 参考訳(メタデータ) (2020-08-10T20:22:15Z) - Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。
このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-01T05:23:34Z) - Model-Based Meta-Reinforcement Learning for Flight with Suspended
Payloads [69.21503033239985]
吊り下げられたペイロードの輸送は、自律的な航空車両にとって困難である。
接続後飛行データから数秒以内に変化力学のモデルを学習するメタラーニング手法を提案する。
論文 参考訳(メタデータ) (2020-04-23T17:43:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。