Fugu-MT 論文翻訳(概要): Adaptive Outer-Loop Control of Quadrotors via Reinforcement Learning

論文の概要: Adaptive Outer-Loop Control of Quadrotors via Reinforcement Learning

arxiv url: http://arxiv.org/abs/2605.16015v2
Date: Mon, 18 May 2026 16:30:20 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-19 17:57:46.196271
Title: Adaptive Outer-Loop Control of Quadrotors via Reinforcement Learning
Title（参考訳）: 強化学習による擬似翼の適応外輪制御
Authors: Vishnu Saj, Sushil Vemuri, Dileep Kalathil, Moble Benedict,
Abstract要約: 本研究では,新しい適応制御アーキテクチャを提案する。まず、最適な外ループポリシーをトレーニングし、その後、地平線データへの依存をResidual Dynamics Predictorに置き換える。データ効率のよい線形キャリブレーションブリッジとオンライン推力補正機構を導入する。
参考スコア（独自算出の注目度）: 7.213232880886576
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Deep Reinforcement Learning (DRL) for quadrotor flight control typically relies on Domain Randomization (DR) for sim-to-real transfer, resulting in overly conservative policies that struggle with dynamic disturbances. To overcome this, we propose a novel adaptive control architecture that actively perceives and reacts to instantaneous perturbations. First, we train an optimal outer-loop policy, then replace its reliance on ground-truth disturbance data with a Residual Dynamics Predictor (RDP). The RDP estimates the external forces and moments acting on the aircraft in flight online using only the history of states and control actions. For seamless hardware transfer, we introduce a data-efficient linear calibration bridge and an online thrust correction mechanism that align the simulated latent space with reality using mere seconds of flight data. Real-world validations on a Crazyflie micro-quadrotor demonstrate that our adaptive controller significantly outperforms baselines, maintaining precise trajectory tracking under severe uncertainties including mass variations, asymmetric payloads, and dynamic slung loads
Abstract（参考訳）: 四重項飛行制御のための深層強化学習(DRL)は、通常、シミュレーションから現実への移動にドメインランダム化(DR)を頼り、動的障害に苦しむ過度に保守的な政策をもたらす。そこで本研究では, 瞬時摂動を積極的に知覚し, 応答する適応制御アーキテクチャを提案する。まず、最適外ループポリシーをトレーニングし、その後、地道乱れデータへの依存をResidual Dynamics Predictor (RDP) に置き換える。 RDPは、国家の歴史と制御行動のみを使用して、オンラインで航空機に作用する外部の力と瞬間を推定する。シームレスなハードウェア転送を実現するために,データ効率のよい線形キャリブレーションブリッジとオンライン推力補正機構を導入する。 Crazyflieマイクロクワッドロータの現実的検証により、適応制御器は、質量変動、非対称ペイロード、動的スラング荷重を含む深刻な不確実性の下で正確な軌道追跡を保ち、ベースラインを著しく上回ることを示した。

関連論文リスト

Hypernetwork-Conditioned Reinforcement Learning for Robust Control of Fixed-Wing Aircraft under Actuator Failures [0.8164433158925594]
本稿では,小型航空機システムのための強化学習に基づく経路追従制御手法を提案する。特徴量線形変調(FiLM)とLow-Rank Adaptation(LoRA)に基づくパラメータ効率の定式化について検討する。ハイパーネットワーク条件のポリシーは、標準的なマルチ層パーセプトロンポリシーと比較してロバスト性を向上させることができることを示す。
論文参考訳（メタデータ） (2026-04-03T18:50:31Z)
Large Language Model-Empowered Decision Transformer for UAV-Enabled Data Collection [71.84636717632206]
空間分散デバイスからの信頼性とエネルギー効率のよいデータ収集のための無人航空機(UAV)は、IoT(Internet of Things)アプリケーションをサポートする上で大きな可能性を秘めている。有効なUAV制御ポリシーを学習するための共同言語モデル(LLM)を提案する。 LLM-CRDTは、現在の最先端DTアプローチよりも最大36.7%高いエネルギー効率を達成し、オンラインおよびオフラインメソッドのベンチマークより優れている。
論文参考訳（メタデータ） (2025-09-17T13:05:08Z)
Double Check My Desired Return: Transformer with Target Alignment for Offline Reinforcement Learning [64.6334337560557]
教師付き学習(RvS)による強化学習は、シーケンスモデリングタスクとしてオフラインRLをフレーム化する。決定変換器(DT)は、実際の完了したリターンを特定のターゲットリターンと確実に整合させるのに苦労する。そこで我々は,Offline RLの目標アライメントによる変換器の二重チェックを行う新しいアプローチであるDoctorを提案する。
論文参考訳（メタデータ） (2025-08-22T14:30:53Z)
Custom Non-Linear Model Predictive Control for Obstacle Avoidance in Indoor and Outdoor Environments [0.0]
本稿では,DJI行列100のための非線形モデル予測制御(NMPC)フレームワークを提案する。このフレームワークは様々なトラジェクトリタイプをサポートし、厳密な操作の精度を制御するためにペナルティベースのコスト関数を採用している。
論文参考訳（メタデータ） (2024-10-03T17:50:19Z)
DATT: Deep Adaptive Trajectory Tracking for Quadrotor Control [62.24301794794304]
Deep Adaptive Trajectory Tracking (DATT)は、学習に基づくアプローチであり、現実世界の大きな乱れの存在下で、任意の、潜在的に実現不可能な軌跡を正確に追跡することができる。 DATTは、非定常風場における可溶性および非実用性の両方の軌道に対して、競争適応性非線形およびモデル予測コントローラを著しく上回っている。適応非線形モデル予測制御ベースラインの1/4未満である3.2ms未満の推論時間で、効率的にオンラインで実行することができる。
論文参考訳（メタデータ） (2023-10-13T12:22:31Z)
Designing a Robust Low-Level Agnostic Controller for a Quadrotor with Actor-Critic Reinforcement Learning [0.38073142980732994]
ソフトアクター・クリティカルに基づく低レベルウェイポイント誘導制御器の訓練段階におけるドメインランダム化を提案する。トレーニング中の四元数力学に一定の不確実性を導入することにより、より大規模な四元数パラメータを用いて提案課題を実行することができる制御器が得られることを示す。
論文参考訳（メタデータ） (2022-10-06T14:58:19Z)
Data-Efficient Deep Reinforcement Learning for Attitude Control of Fixed-Wing UAVs: Field Experiments [0.37798600249187286]
DRLは、元の非線形力学を直接操作する固定翼UAVの姿勢制御をうまく学べることを示す。我々は,UAVで学習したコントローラを飛行試験で展開し,最先端のArduPlane比例積分微分(PID)姿勢制御と同等の性能を示す。
論文参考訳（メタデータ） (2021-11-07T19:07:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。