論文の概要: An Aircraft Upset Recovery System with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2604.24355v1
- Date: Mon, 27 Apr 2026 11:48:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.960592
- Title: An Aircraft Upset Recovery System with Reinforcement Learning
- Title(参考訳): 強化学習による航空機のリカバリシステム
- Authors: Mahir Demir, Atahan Cilan, Seyyid Osman Sevgili, Özgün Can Yürütken, Ümit Can Bekar,
- Abstract要約: 本稿では,高度ジェットトレーナーのためのパイロットアクティブリカバリシステム(PARS)の開発について述べる。
PARSモデルは、最先端のSoft-actor critic (SAC)モデルを取り入れた高度な強化学習(RL)アーキテクチャを採用している。
PARSに関するコントロールエンジニアやドメインエキスパートが言及する負のg罰やその他の手技的な特徴も、システムによって考慮される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article explores the progress made in the creation of a pilot activated recovery system (PARS) for advanced jet trainers that utilizes artificial intelligence (AI) in an effort to enhance operational efficiency. The PARS model employs an advanced reinforcement learning (RL) architecture, incorporating a cutting-edge soft-actor critic (SAC) model and hyper-parameter optimization methods. Negative-g punishments and other handcrafted features remarked upon by control engineers and domain experts regarding PARS are also taken into account by the system. When evaluated by them, the AI model's behavior is deemed more desirable than that of conventional control methods.
- Abstract(参考訳): 本稿では,人工知能(AI)を活用した高度ジェットトレーナーのためのパイロットアクティブリカバリシステム(PARS)の開発における成果について述べる。
PARSモデルは高度な強化学習(RL)アーキテクチャを採用し、最先端のソフトアクター評論家(SAC)モデルとハイパーパラメータ最適化手法を取り入れている。
PARSに関するコントロールエンジニアやドメインエキスパートが言及する負のg罰やその他の手技的な特徴も、システムによって考慮される。
それらによって評価されると、AIモデルの振る舞いは従来の制御方法よりも望ましいと考えられる。
関連論文リスト
- An Automatic Ground Collision Avoidance System with Reinforcement Learning [0.0]
本稿では,高度ジェットトレーナーを対象としたAIを用いた自動地衝突回避システム(AGCAS)について述べる。
このシステムは、ランドスケープサーバ上での視線クエリを使用して、正確な衝突回避と効率的な衝突回避を確実にする。
論文 参考訳(メタデータ) (2026-04-27T12:27:08Z) - Cost-effective Reduced-Order Modeling via Bayesian Active Learning [12.256032958843065]
本研究では,不確実性を意識したベイズ固有分解(POD)に基づく能動的学習フレームワークBayPOD-ALを提案する。
棒の温度変化を予測する実験結果から,ベイポッドALの有効性が示唆された。
トレーニングデータセットよりも高時間分解能のデータセット上で,ベイポD-ALの性能を評価することにより,ベイポD-ALの一般化性と効率を実証する。
論文 参考訳(メタデータ) (2025-06-27T21:23:37Z) - Trial and Error: Exploration-Based Trajectory Optimization for LLM Agents [49.85633804913796]
本稿では,ETOと呼ばれる探索に基づく軌道最適化手法を提案する。
この学習方法はオープンLLMエージェントの性能を向上させるために設計されている。
3つの複雑なタスクに関する実験は、ETOがベースライン性能をはるかに上回っていることを示す。
論文 参考訳(メタデータ) (2024-03-04T21:50:29Z) - Modelling, Positioning, and Deep Reinforcement Learning Path Tracking
Control of Scaled Robotic Vehicles: Design and Experimental Validation [3.807917169053206]
スケールされたロボットカーは通常、車両の状態の推定と制御に特化したタスクを含む階層的な制御機構を備えている。
本稿では, (i) フェデレートされた拡張カルマンフィルタ (FEKF) と (ii) エキスパートデモレータを用いて訓練された新しい深部強化学習 (DRL) パストラッキングコントローラを提案する。
実験により検証されたモデルは、(i)FEKFの設計を支援するために使用され、(ii)DRLに基づく経路追跡アルゴリズムをトレーニングするためのデジタルツインとして機能する。
論文 参考訳(メタデータ) (2024-01-10T14:40:53Z) - REX: Rapid Exploration and eXploitation for AI Agents [103.68453326880456]
本稿では、REXと呼ばれるAIエージェントのための高速探索およびeXploitationのための改良されたアプローチを提案する。
REXは追加の報酬層を導入し、アッパー信頼境界(UCB)スコアに似た概念を統合し、より堅牢で効率的なAIエージェントのパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-07-18T04:26:33Z) - Constrained Reinforcement Learning for Robotics via Scenario-Based
Programming [64.07167316957533]
DRLをベースとしたエージェントの性能を最適化し,その動作を保証することが重要である。
本稿では,ドメイン知識を制約付きDRLトレーニングループに組み込む新しい手法を提案する。
我々の実験は、専門家の知識を活用するために我々のアプローチを用いることで、エージェントの安全性と性能が劇的に向上することを示した。
論文 参考訳(メタデータ) (2022-06-20T07:19:38Z) - ReIL: A Framework for Reinforced Intervention-based Imitation Learning [3.0846824529023387]
Reinforced Intervention-based Learning (ReIL) は、一般的な介入に基づく学習アルゴリズムとマルチタスク模倣学習モデルからなるフレームワークである。
実世界の移動ロボットナビゲーションの課題による実験結果から、ReILは性能の劣化に悩まされることなく、緩やかな監督補正から素早く学習できることが示唆された。
論文 参考訳(メタデータ) (2022-03-29T09:30:26Z) - RL-Controller: a reinforcement learning framework for active structural
control [0.0]
フレキシブルでスケーラブルなシミュレーション環境であるRL-Controllerを導入することで,アクティブコントローラを設計するための新しいRLベースのアプローチを提案する。
提案するフレームワークは,5階建てのベンチマークビルディングに対して,平均65%の削減率で,容易に学習可能であることを示す。
LQG 能動制御法との比較研究において,提案したモデルフリーアルゴリズムはより最適なアクチュエータ強制戦略を学習することを示した。
論文 参考訳(メタデータ) (2021-03-13T04:42:13Z) - Boosting Adversarial Training with Hypersphere Embedding [53.75693100495097]
敵対的訓練は、ディープラーニングモデルに対する敵対的攻撃に対する最も効果的な防御の1つである。
本研究では,超球埋め込み機構をATプロシージャに組み込むことを提唱する。
我々は,CIFAR-10 と ImageNet データセットに対する幅広い敵対攻撃の下で本手法を検証した。
論文 参考訳(メタデータ) (2020-02-20T08:42:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。