論文の概要: An Integrated Imitation and Reinforcement Learning Methodology for
Robust Agile Aircraft Control with Limited Pilot Demonstration Data
- arxiv url: http://arxiv.org/abs/2401.08663v1
- Date: Wed, 27 Dec 2023 14:26:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-22 09:38:36.345940
- Title: An Integrated Imitation and Reinforcement Learning Methodology for
Robust Agile Aircraft Control with Limited Pilot Demonstration Data
- Title(参考訳): 限定パイロット実証データを用いたロバストアジャイル航空機制御のための統合的模倣・強化学習手法
- Authors: Gulay Goktas Sever, Umut Demir, Abdullah Sadik Satir, Mustafa Cagatay
Sahin, Nazim Kemal Ure
- Abstract要約: 本稿では,アジャイル航空機のデータ駆動操作生成モデルの構築手法を提案する。
提案手法は, 模倣学習, 伝達学習, 強化学習の技法を組み合わせて, この目的を達成する。
- 参考スコア(独自算出の注目度): 3.3748750222488657
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present a methodology for constructing data-driven maneuver
generation models for agile aircraft that can generalize across a wide range of
trim conditions and aircraft model parameters. Maneuver generation models play
a crucial role in the testing and evaluation of aircraft prototypes, providing
insights into the maneuverability and agility of the aircraft. However,
constructing the models typically requires extensive amounts of real pilot
data, which can be time-consuming and costly to obtain. Moreover, models built
with limited data often struggle to generalize beyond the specific flight
conditions covered in the original dataset. To address these challenges, we
propose a hybrid architecture that leverages a simulation model, referred to as
the source model. This open-source agile aircraft simulator shares similar
dynamics with the target aircraft and allows us to generate unlimited data for
building a proxy maneuver generation model. We then fine-tune this model to the
target aircraft using a limited amount of real pilot data. Our approach
combines techniques from imitation learning, transfer learning, and
reinforcement learning to achieve this objective. To validate our methodology,
we utilize real agile pilot data provided by Turkish Aerospace Industries
(TAI). By employing the F-16 as the source model, we demonstrate that it is
possible to construct a maneuver generation model that generalizes across
various trim conditions and aircraft parameters without requiring any
additional real pilot data. Our results showcase the effectiveness of our
approach in developing robust and adaptable models for agile aircraft.
- Abstract(参考訳): 本稿では,多種多様なトリム条件と航空機モデルパラメータを一般化した,アジャイル航空機のデータ駆動操作生成モデルを構築する手法を提案する。
機動生成モデルは、航空機の試作機の試験と評価において重要な役割を担っており、機動性と機敏性に関する洞察を提供している。
しかし、モデルの構築は通常、膨大な量の実際のパイロットデータを必要とする。
さらに、限られたデータで構築されたモデルは、元のデータセットでカバーされた特定の飛行条件を超えて一般化するのに苦労することが多い。
これらの課題に対処するため,我々は,ソースモデルと呼ばれるシミュレーションモデルを活用したハイブリッドアーキテクチャを提案する。
このオープンソースのアジャイル航空機シミュレータは、ターゲット機と同じようなダイナミクスを共有し、プロキシ操作生成モデルを構築するために無制限のデータを生成することができます。
次に、実際のパイロットデータだけを使って、このモデルを目標機に微調整する。
この目的を達成するために,模倣学習,転送学習,強化学習といった手法を組み合わせる。
提案手法を検証するため,トルコ航空宇宙工業(TAI)が提供する実際のアジャイルパイロットデータを利用した。
F-16をソースモデルとして使用することにより、実際のパイロットデータを必要とすることなく、様々なトリム条件や航空機パラメータをまたいだ操作生成モデルを構築することができることを示す。
この結果は、アジャイル航空機の堅牢で適応可能なモデル開発における我々のアプローチの有効性を示している。
関連論文リスト
- Open-Source High-Speed Flight Surrogate Modeling Framework [0.0]
高速飛行車は音速よりもはるかに速く走行し、国防と宇宙探査に不可欠である。
様々な飛行条件下での行動の正確な予測は困難であり、しばしば高価である。
提案されたアプローチでは、より賢く、より効率的な機械学習モデルを作成する。
論文 参考訳(メタデータ) (2024-11-06T01:34:06Z) - On the Generalization Properties of Deep Learning for Aircraft Fuel Flow Estimation Models [2.7336487680215815]
本稿では,燃料消費予測におけるディープラーニングモデルの一般化能力について検討する。
本稿では,ニューラルネットワークアーキテクチャとドメイン一般化技術を統合する新しい手法を提案する。
以前は目に見えない航空機に対して、航空機へのノイズの導入とエンジンパラメーターはモデルの一般化を改善した。
論文 参考訳(メタデータ) (2024-10-10T08:34:19Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - Context-Aware Generative Models for Prediction of Aircraft Ground Tracks [0.004807514276707785]
軌道予測は航空交通管制官の意思決定を支援する上で重要な役割を果たしている。
従来のTP手法は決定論的で物理学に基づく手法であり、パラメータは世界中で収集された航空機の監視データを用いて校正される。
本研究では、確率論的機械学習を用いて、パイロット行動とATCO意図の未知の効果をモデル化する横型TPの生成法を提案する。
論文 参考訳(メタデータ) (2023-09-26T14:20:09Z) - Towards Efficient Task-Driven Model Reprogramming with Foundation Models [52.411508216448716]
ビジョンファウンデーションモデルは、非常に大きなモデルキャパシティと幅広いトレーニングデータから恩恵を受け、印象的なパワーを示す。
しかし、実際には、下流のシナリオは限られた計算資源や効率上の考慮のため、小さなモデルしかサポートできない。
これは、ファンデーションモデルの現実的な応用に重要な課題をもたらします。
論文 参考訳(メタデータ) (2023-04-05T07:28:33Z) - Inferring Traffic Models in Terminal Airspace from Flight Tracks and
Procedures [52.25258289718559]
本稿では,レーダ監視データから収集したプロシージャデータとフライトトラックから可変性を学習可能な確率モデルを提案する。
任意の航空機数を含む交通量を生成するために,ペアワイズモデルを用いる方法を示す。
論文 参考訳(メタデータ) (2023-03-17T13:58:06Z) - Data-Efficient Modeling for Precise Power Consumption Estimation of
Quadrotor Operations Using Ensemble Learning [3.722516004544342]
エレクトロニック・テイクオフ・アンド・ランディング (EVTOL) は、新興都市空力において主要な航空機であると考えられている。
本研究では,eVTOL航空機の消費電力モデル化のための枠組みを構築した。
そこで我々は,3種類の四重項の飛行記録を用いたデータ駆動モデルを構築するために,アンサンブル学習法,すなわち積み重ね法を用いた。
論文 参考訳(メタデータ) (2022-05-23T02:16:43Z) - Evaluating model-based planning and planner amortization for continuous
control [79.49319308600228]
我々は、モデル予測制御(MPC)と学習モデルとモデルフリーポリシー学習を組み合わせたハイブリッドアプローチを採っている。
モデルフリーエージェントは高いDoF制御問題においても強いベースラインであることがわかった。
モデルに基づくプランナを,パフォーマンスを損なうことなく,計画が損なわれるようなポリシーに置き換えることが可能であることを示す。
論文 参考訳(メタデータ) (2021-10-07T12:00:40Z) - Bridging Imagination and Reality for Model-Based Deep Reinforcement
Learning [72.18725551199842]
BrIdging Reality and Dream (BIRD) と呼ばれる新しいモデルに基づく強化学習アルゴリズムを提案する。
虚構と実軌跡の相互情報を最大化し、虚構から学んだ政策改善を実軌跡に容易に一般化できるようにする。
提案手法は, モデルベース計画のサンプル効率を向上し, 挑戦的なビジュアル制御ベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2020-10-23T03:22:01Z) - From industry-wide parameters to aircraft-centric on-flight inference:
improving aeronautics performance prediction with machine learning [5.171090309853363]
航空機の性能モデルは、特に燃料効率の良い飛行計画において重要な役割を担っている。
実際には、メーカーは1つの要素のチューニングを通じて、航空機のライフサイクルを通してわずかに修正されたガイドラインを提供し、より良い燃料予測を可能にしている。
これは制限があり、特に航空機の性能に影響を及ぼすそれぞれの特徴の進化を反映していない。
本論文の重要な貢献は,航空機の飛行中に連続的に記録される大量のデータを活用するために,機械学習の利用を促進することである。
論文 参考訳(メタデータ) (2020-05-11T17:40:17Z) - Model Reuse with Reduced Kernel Mean Embedding Specification [70.044322798187]
現在のアプリケーションで有用なモデルを見つけるための2段階のフレームワークを提案する。
アップロードフェーズでは、モデルがプールにアップロードされている場合、モデルの仕様としてカーネル平均埋め込み(RKME)を縮小する。
デプロイフェーズでは、RKME仕様の値に基づいて、現在のタスクと事前訓練されたモデルの関連性を測定する。
論文 参考訳(メタデータ) (2020-01-20T15:15:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。