論文の概要: TempFuser: Learning Tactical and Agile Flight Maneuvers in Aerial
Dogfights using a Long Short-Term Temporal Fusion Transformer
- arxiv url: http://arxiv.org/abs/2308.03257v2
- Date: Sat, 16 Sep 2023 17:18:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 22:45:12.304797
- Title: TempFuser: Learning Tactical and Agile Flight Maneuvers in Aerial
Dogfights using a Long Short-Term Temporal Fusion Transformer
- Title(参考訳): TempFuser: 長期の短期核融合変換器を用いた空中戦における戦術とアジャイル飛行マニアの学習
- Authors: Hyunki Seong and David Hyunchul Shim
- Abstract要約: 空中戦闘において、ドッグファイティングは、戦略的な操作と戦闘機の空気力学の両方を理解することを要求する複雑な課題を提起する。
本研究では,犬の戦いにおける戦術的,アジャイル的な飛行操作の学習を目的とした,時間的長期融合型トランスフォーマーであるTempFuserを紹介する。
- 参考スコア(独自算出の注目度): 2.5563396001349297
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In aerial combat, dogfighting poses intricate challenges that demand an
understanding of both strategic maneuvers and the aerodynamics of agile fighter
aircraft. In this paper, we introduce TempFuser, a novel long short-term
temporal fusion transformer designed to learn tactical and agile flight
maneuvers in aerial dogfights. Our approach employs two distinct LSTM-based
input embeddings to encode long-term sparse and short-term dense state
representations. By integrating these embeddings through a transformer encoder,
our model captures the tactics and agility of fighter jets, enabling it to
generate end-to-end flight commands that secure dominant positions and
outmaneuver the opponent. After extensive training against various types of
opponent aircraft in a high-fidelity flight simulator, our model successfully
learns to perform complex fighter maneuvers, consistently outperforming several
baseline models. Notably, our model exhibits human-like strategic maneuvers
even when facing adversaries with superior specifications, all without relying
on explicit prior knowledge. Moreover, it demonstrates robust pursuit
performance in challenging supersonic and low-altitude environments. Demo
videos are available at https://sites.google.com/view/tempfuser.
- Abstract(参考訳): 空中戦闘において、ドッグファイティングは、戦略的な操作とアジャイル戦闘機の空気力学の両方を理解することを要求する複雑な課題を引き起こす。
本稿では,空中戦闘における戦術的および機敏な飛行操作を学習するために設計された,新しい短期的時間融合トランスフォーマー tempfuser について紹介する。
本手法では,長期スパースおよび短期密度状態表現を符号化するために,LSTMに基づく2つの異なる入力埋め込みを用いる。
これらの埋め込みをトランスフォーマーエンコーダで統合することで、このモデルは戦闘機の戦術と機敏さを捉え、支配的な位置を確保し、敵を圧倒するエンドツーエンドの飛行コマンドを生成することができる。
高忠実度飛行シミュレーターにおける様々な種類の敵機に対する広範囲な訓練の後、我々のモデルは複雑な戦闘機の操縦をうまく学習し、一貫していくつかのベースラインモデルを上回った。
特に,我々のモデルは,明確な事前知識を必要とせず,優れた仕様の敵に面しても,人間的な戦略行動を示す。
さらに, 超音速低高度環境において頑健な追従性能を示す。
デモビデオはhttps://sites.google.com/view/tempfuser.comで閲覧できる。
関連論文リスト
- From Flies to Robots: Inverted Landing in Small Quadcopters with Dynamic
Perching [15.57055572401334]
逆着陸は、多くの動物のチラシの中で日常的な行動である。
我々は,任意の天井面接触条件に対する制御ポリシーを策定する。
小型クワッドコプターにおいて,強靭な逆着陸動作を達成できた。
論文 参考訳(メタデータ) (2024-02-29T21:09:08Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal
Locomotion Control [112.66677641636299]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Autonomous Agent for Beyond Visual Range Air Combat: A Deep
Reinforcement Learning Approach [0.2578242050187029]
本研究は, 遠近視域(BVR)空戦シミュレーション環境において動作可能な深層強化学習に基づくエージェントの開発に寄与する。
本稿では,BVR戦闘におけるその役割を学習し,改善することができる高性能戦闘機のエージェント構築の概要について述べる。
また、仮想シミュレーションを用いて実際のパイロットの能力を調べ、訓練されたエージェントと同じ環境で対話し、パフォーマンスを比較することを望んでいる。
論文 参考訳(メタデータ) (2023-04-19T13:54:37Z) - Reinforcement Learning Based Self-play and State Stacking Techniques for
Noisy Air Combat Environment [1.7403133838762446]
空気戦闘の複雑さは、攻撃的な近距離演習とアジャイルな敵の行動から生じる。
本研究では,エージェントに騒音を観測する空気戦闘シミュレーションを開発した。
ノイズ低減手法として,雑音の多いRL環境に対する状態積み重ね手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T12:23:23Z) - Harfang3D Dog-Fight Sandbox: A Reinforcement Learning Research Platform
for the Customized Control Tasks of Fighter Aircrafts [0.0]
本研究では,戦闘機用の半現実的な飛行シミュレーション環境であるHarfang3D Dog-Fight Sandboxを提案する。
強化学習を用いた航空研究における主な課題を調査するための柔軟なツールボックスである。
ソフトウェアはまた、ボット航空機の配備とマルチエージェントタスクの開発を可能にする。
論文 参考訳(メタデータ) (2022-10-13T18:18:09Z) - Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
論文 参考訳(メタデータ) (2022-09-19T17:55:05Z) - Neural-Fly Enables Rapid Learning for Agile Flight in Strong Winds [82.73648398969738]
本稿では,ディープラーニングを通じて事前学習した表現を組み込むことで,オンラインでの迅速な適応を可能にする学習ベースのアプローチを提案する。
Neural-Flyは、最先端の非線形かつ適応的なコントローラよりもかなり少ないトラッキングエラーで正確な飛行制御を実現する。
論文 参考訳(メタデータ) (2022-05-13T21:55:28Z) - L2E: Learning to Exploit Your Opponent [66.66334543946672]
本稿では,暗黙的対向モデリングのための新しい学習フレームワークを提案する。
L2Eは、トレーニング中に異なる相手との対話によって、相手を悪用する能力を取得する。
本稿では, 対戦相手を自動的に生成する新しい対戦相手戦略生成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-18T14:27:59Z) - Learning Agile Locomotion via Adversarial Training [59.03007947334165]
本稿では,四足歩行ロボット(主人公)が他のロボット(敵)を追いかけるのを学習し,後者が逃げることを学習するマルチエージェント学習システムを提案する。
この敵対的なトレーニングプロセスは、アジャイルの振る舞いを促進するだけでなく、退屈な環境設計の努力を効果的に軽減します。
1つの敵のみを使用した以前の作品とは対照的に、異なる逃走戦略を専門とする敵のアンサンブルを訓練することは、主人公がアジリティを習得するために不可欠である。
論文 参考訳(メタデータ) (2020-08-03T01:20:37Z) - Model-Based Meta-Reinforcement Learning for Flight with Suspended
Payloads [69.21503033239985]
吊り下げられたペイロードの輸送は、自律的な航空車両にとって困難である。
接続後飛行データから数秒以内に変化力学のモデルを学習するメタラーニング手法を提案する。
論文 参考訳(メタデータ) (2020-04-23T17:43:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。