論文の概要: Reinforcement Learning-based Fault-Tolerant Control for Quadrotor with Online Transformer Adaptation
- arxiv url: http://arxiv.org/abs/2505.08223v1
- Date: Tue, 13 May 2025 04:50:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-14 20:57:54.423985
- Title: Reinforcement Learning-based Fault-Tolerant Control for Quadrotor with Online Transformer Adaptation
- Title(参考訳): オンライン変圧器適応型クアドロレータの強化学習に基づく耐故障性制御
- Authors: Dohyun Kim, Jayden Dongwoo Lee, Hyochoong Bang, Jungho Bae,
- Abstract要約: マルチローターは様々な分野のロボティクス応用において重要な役割を果たしている。
従来のアプローチでは、マルチロータモデルの事前知識や、新しい構成への適応に苦労する必要がある。
我々はトランスフォーマーベースのオンライン適応モジュールと統合された新しいハイブリッドRLベースのFTCフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.13499500088995461
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multirotors play a significant role in diverse field robotics applications but remain highly susceptible to actuator failures, leading to rapid instability and compromised mission reliability. While various fault-tolerant control (FTC) strategies using reinforcement learning (RL) have been widely explored, most previous approaches require prior knowledge of the multirotor model or struggle to adapt to new configurations. To address these limitations, we propose a novel hybrid RL-based FTC framework integrated with a transformer-based online adaptation module. Our framework leverages a transformer architecture to infer latent representations in real time, enabling adaptation to previously unseen system models without retraining. We evaluate our method in a PyBullet simulation under loss-of-effectiveness actuator faults, achieving a 95% success rate and a positional root mean square error (RMSE) of 0.129 m, outperforming existing adaptation methods with 86% success and an RMSE of 0.153 m. Further evaluations on quadrotors with varying configurations confirm the robustness of our framework across untrained dynamics. These results demonstrate the potential of our framework to enhance the adaptability and reliability of multirotors, enabling efficient fault management in dynamic and uncertain environments. Website is available at http://00dhkim.me/paper/rl-ftc
- Abstract(参考訳): マルチローターは多様なフィールドロボティクスの応用において重要な役割を担っているが、アクチュエータの故障の影響を受けやすいままであり、迅速な不安定性とミッションの信頼性を損なう。
強化学習(RL)を用いた様々な耐障害性制御(FTC)戦略が広く研究されているが、従来のアプローチでは、マルチロータモデルの事前知識や新しい構成への適応に苦労する必要がある。
これらの制約に対処するため、トランスフォーマーベースのオンライン適応モジュールと統合されたハイブリッドRLベースのFTCフレームワークを提案する。
我々のフレームワークは、トランスフォーマーアーキテクチャを利用して遅延表現をリアルタイムで推論し、再学習することなく、以前は見つからなかったシステムモデルへの適応を可能にする。
我々はPyBulletシミュレーションにおいて,95%の成功率と0.129mの位置平均二乗誤差(RMSE)を達成し,既存の適応手法を86%,RMSEが0.153mで上回った。
異なる構成の四辺形に対するさらなる評価は、トレーニングされていない力学における我々のフレームワークの頑健さを裏付けるものである。
これらの結果は,マルチロータの適応性と信頼性を高めるためのフレームワークの可能性を示し,動的かつ不確実な環境における効率的な故障管理を可能にする。
Webサイトはhttp://00dhkim.me/paper/rl-ftcで入手できる。
関連論文リスト
- Model-based controller assisted domain randomization in deep reinforcement learning: application to nonlinear powertrain control [0.0]
本研究では, 深部強化学習(DRL)の枠組みを用いた新しいロバスト制御手法を提案する。
問題設定は、不確実性と非線形性を考慮した制御系に対して、バニラMDPの集合である潜在マルコフ決定プロセス(LMDP)を介してモデル化される。
従来のDRLベースの制御と比較して、提案するコントローラ設計はより賢く、高度な一般化能力を実現することができる。
論文 参考訳(メタデータ) (2025-04-28T12:09:07Z) - Reinforcement Learning for Machine Learning Model Deployment: Evaluating Multi-Armed Bandits in ML Ops Environments [0.0]
本稿では,強化学習(RL)に基づくモデル管理が,展開決定をより効果的に管理できるかどうかを検討する。
当社のアプローチは、デプロイされたモデルを継続的に評価し、パフォーマンスの低いモデルをリアルタイムでロールバックすることで、より適応的な運用環境を実現する。
この結果から,RLベースのモデル管理は,自動化を向上し,手作業による介入への依存を軽減し,デプロイ後のモデル障害に伴うリスクを軽減することが示唆された。
論文 参考訳(メタデータ) (2025-03-28T16:42:21Z) - Remembering Transformer for Continual Learning [9.879896956915598]
本稿では,脳の補足学習システムにインスパイアされたリマインドトランスフォーマーを提案する。
覚えておくTransformerは、アダプタの混合アーキテクチャと、生成モデルに基づく新規性検出機構を採用している。
本研究は, 新奇性検出機構のアブレーション研究や, 適応剤のモデルキャパシティなど, 広範囲にわたる実験を行った。
論文 参考訳(メタデータ) (2024-04-11T07:22:14Z) - FullLoRA-AT: Efficiently Boosting the Robustness of Pretrained Vision
Transformers [61.48709409150777]
Vision Transformer (ViT) モデルは、様々なコンピュータビジョンタスクにおいて徐々に主流になりつつある。
既存の大きなモデルは、トレーニング中のパフォーマンスを優先する傾向があり、ロバストさを無視する可能性がある。
従来のLoRAモジュールよりも前に学習可能なレイヤ正規化を取り入れた新しいLNLoRAモジュールを開発した。
本稿では,学習可能なLNLoRAモジュールをViTモデルの主要コンポーネントに組み込むことにより,FullLoRA-ATフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-03T14:08:39Z) - Emergent Agentic Transformer from Chain of Hindsight Experience [96.56164427726203]
簡単なトランスフォーマーベースモデルが時間差と模倣学習に基づくアプローチの両方と競合することを示す。
単純なトランスフォーマーベースのモデルが時間差と模倣学習ベースのアプローチの両方で競合するのはこれが初めてである。
論文 参考訳(メタデータ) (2023-05-26T00:43:02Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Stabilizing Voltage in Power Distribution Networks via Multi-Agent
Reinforcement Learning with Transformer [128.19212716007794]
本稿では,変圧器を用いたマルチエージェント・アクタ・クリティカル・フレームワーク(T-MAAC)を提案する。
さらに、電圧制御タスクに適した新しい補助タスクトレーニングプロセスを採用し、サンプル効率を向上する。
論文 参考訳(メタデータ) (2022-06-08T07:48:42Z) - Low-level Pose Control of Tilting Multirotor for Wall Perching Tasks
Using Reinforcement Learning [2.5903488573278284]
実世界の応用において,傾き型マルチロータを制御するための新しい強化学習手法を提案する。
提案手法は,傾斜マルチロータの複雑な力学を克服し,頑健な制御性を示す。
論文 参考訳(メタデータ) (2021-08-11T21:39:51Z) - Two-stage Deep Reinforcement Learning for Inverter-based Volt-VAR
Control in Active Distribution Networks [3.260913246106564]
本稿では,インバータを用いたエネルギー資源の制御により,電圧分布を改善するための2段階深部強化学習法を提案する。
オフライン段階では、モデルミスマッチに頑健なオフラインエージェントを訓練するために、高い効率の対向強化学習アルゴリズムが開発された。
連続的なオンライン段階において、オフラインエージェントをオンラインエージェントとして安全に転送し、継続的な学習を行い、オンラインで制御し、安全性と効率を大幅に向上させる。
論文 参考訳(メタデータ) (2020-05-20T08:02:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。