論文の概要: TempFuser: Learning Tactical and Agile Flight Maneuvers in Aerial
Dogfights using a Long Short-Term Temporal Fusion Transformer
- arxiv url: http://arxiv.org/abs/2308.03257v2
- Date: Sat, 16 Sep 2023 17:18:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 22:45:12.304797
- Title: TempFuser: Learning Tactical and Agile Flight Maneuvers in Aerial
Dogfights using a Long Short-Term Temporal Fusion Transformer
- Title(参考訳): TempFuser: 長期の短期核融合変換器を用いた空中戦における戦術とアジャイル飛行マニアの学習
- Authors: Hyunki Seong and David Hyunchul Shim
- Abstract要約: 空中戦闘において、ドッグファイティングは、戦略的な操作と戦闘機の空気力学の両方を理解することを要求する複雑な課題を提起する。
本研究では,犬の戦いにおける戦術的,アジャイル的な飛行操作の学習を目的とした,時間的長期融合型トランスフォーマーであるTempFuserを紹介する。
- 参考スコア(独自算出の注目度): 2.5563396001349297
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In aerial combat, dogfighting poses intricate challenges that demand an
understanding of both strategic maneuvers and the aerodynamics of agile fighter
aircraft. In this paper, we introduce TempFuser, a novel long short-term
temporal fusion transformer designed to learn tactical and agile flight
maneuvers in aerial dogfights. Our approach employs two distinct LSTM-based
input embeddings to encode long-term sparse and short-term dense state
representations. By integrating these embeddings through a transformer encoder,
our model captures the tactics and agility of fighter jets, enabling it to
generate end-to-end flight commands that secure dominant positions and
outmaneuver the opponent. After extensive training against various types of
opponent aircraft in a high-fidelity flight simulator, our model successfully
learns to perform complex fighter maneuvers, consistently outperforming several
baseline models. Notably, our model exhibits human-like strategic maneuvers
even when facing adversaries with superior specifications, all without relying
on explicit prior knowledge. Moreover, it demonstrates robust pursuit
performance in challenging supersonic and low-altitude environments. Demo
videos are available at https://sites.google.com/view/tempfuser.
- Abstract(参考訳): 空中戦闘において、ドッグファイティングは、戦略的な操作とアジャイル戦闘機の空気力学の両方を理解することを要求する複雑な課題を引き起こす。
本稿では,空中戦闘における戦術的および機敏な飛行操作を学習するために設計された,新しい短期的時間融合トランスフォーマー tempfuser について紹介する。
本手法では,長期スパースおよび短期密度状態表現を符号化するために,LSTMに基づく2つの異なる入力埋め込みを用いる。
これらの埋め込みをトランスフォーマーエンコーダで統合することで、このモデルは戦闘機の戦術と機敏さを捉え、支配的な位置を確保し、敵を圧倒するエンドツーエンドの飛行コマンドを生成することができる。
高忠実度飛行シミュレーターにおける様々な種類の敵機に対する広範囲な訓練の後、我々のモデルは複雑な戦闘機の操縦をうまく学習し、一貫していくつかのベースラインモデルを上回った。
特に,我々のモデルは,明確な事前知識を必要とせず,優れた仕様の敵に面しても,人間的な戦略行動を示す。
さらに, 超音速低高度環境において頑健な追従性能を示す。
デモビデオはhttps://sites.google.com/view/tempfuser.comで閲覧できる。
関連論文リスト
- An Imitative Reinforcement Learning Framework for Autonomous Dogfight [20.150691753213817]
無人戦闘空母(UCAV)は、空戦において決定的な役割を担っている。
本稿では,自律的な探索を可能にしつつ,専門家データを効率的に活用する,新しい擬似強化学習フレームワークを提案する。
提案した枠組みは,UCAVの「プール・ロック・ローンチ」におけるドッグファイト・ポリシーを成功に導くことができる。
論文 参考訳(メタデータ) (2024-06-17T13:59:52Z) - Fighter flight trajectory prediction based on spatio-temporal graphcial attention network [8.938877973527779]
本稿では、符号化構造と復号構造を用いて、飛行軌道の予測を行うネットワーク時間グラフアテンション(ST-GAT)を提案する。
トランスフォーマー・ブランチ・ネットワークは、歴史的軌跡の特徴を抽出し、戦闘機の時間状態が将来の軌跡に与える影響を捉えるために使用される。
GATブランチネットワークは、歴史的軌跡の空間的特徴を抽出し、戦闘機間の潜在的な空間的相関を捉えるために使用される。
論文 参考訳(メタデータ) (2024-05-13T02:47:57Z) - From Flies to Robots: Inverted Landing in Small Quadcopters with Dynamic
Perching [15.57055572401334]
逆着陸は、多くの動物のチラシの中で日常的な行動である。
我々は,任意の天井面接触条件に対する制御ポリシーを策定する。
小型クワッドコプターにおいて,強靭な逆着陸動作を達成できた。
論文 参考訳(メタデータ) (2024-02-29T21:09:08Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Hierarchical Multi-Agent Reinforcement Learning for Air Combat
Maneuvering [40.06500618820166]
複数の異種エージェントを用いた空対空戦闘のための階層型多エージェント強化学習フレームワークを提案する。
低レベルの政策は、正確な部隊戦闘制御のために訓練される。指揮官政策は、事前訓練された低レベルの政策が与えられたミッション目標に基づいて訓練される。
論文 参考訳(メタデータ) (2023-09-20T12:16:00Z) - Reinforcement Learning Based Self-play and State Stacking Techniques for
Noisy Air Combat Environment [1.7403133838762446]
空気戦闘の複雑さは、攻撃的な近距離演習とアジャイルな敵の行動から生じる。
本研究では,エージェントに騒音を観測する空気戦闘シミュレーションを開発した。
ノイズ低減手法として,雑音の多いRL環境に対する状態積み重ね手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T12:23:23Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - Neural-Fly Enables Rapid Learning for Agile Flight in Strong Winds [96.74836678572582]
本稿では,ディープラーニングを通じて事前学習した表現を組み込むことで,オンラインでの迅速な適応を可能にする学習ベースのアプローチを提案する。
Neural-Flyは、最先端の非線形かつ適応的なコントローラよりもかなり少ないトラッキングエラーで正確な飛行制御を実現する。
論文 参考訳(メタデータ) (2022-05-13T21:55:28Z) - Fixed Points in Cyber Space: Rethinking Optimal Evasion Attacks in the
Age of AI-NIDS [70.60975663021952]
ネットワーク分類器に対するブラックボックス攻撃について検討する。
我々は、アタッカー・ディフェンダーの固定点がそれ自体、複雑な位相遷移を持つ一般サムゲームであると主張する。
攻撃防御力学の研究には連続的な学習手法が必要であることを示す。
論文 参考訳(メタデータ) (2021-11-23T23:42:16Z) - Learning Agile Locomotion via Adversarial Training [59.03007947334165]
本稿では,四足歩行ロボット(主人公)が他のロボット(敵)を追いかけるのを学習し,後者が逃げることを学習するマルチエージェント学習システムを提案する。
この敵対的なトレーニングプロセスは、アジャイルの振る舞いを促進するだけでなく、退屈な環境設計の努力を効果的に軽減します。
1つの敵のみを使用した以前の作品とは対照的に、異なる逃走戦略を専門とする敵のアンサンブルを訓練することは、主人公がアジリティを習得するために不可欠である。
論文 参考訳(メタデータ) (2020-08-03T01:20:37Z) - Model-Based Meta-Reinforcement Learning for Flight with Suspended
Payloads [69.21503033239985]
吊り下げられたペイロードの輸送は、自律的な航空車両にとって困難である。
接続後飛行データから数秒以内に変化力学のモデルを学習するメタラーニング手法を提案する。
論文 参考訳(メタデータ) (2020-04-23T17:43:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。