論文の概要: TempFuser: Learning Tactical and Agile Flight Maneuvers in Aerial
Dogfights using a Long Short-Term Temporal Fusion Transformer
- arxiv url: http://arxiv.org/abs/2308.03257v1
- Date: Mon, 7 Aug 2023 02:28:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 15:42:18.953434
- Title: TempFuser: Learning Tactical and Agile Flight Maneuvers in Aerial
Dogfights using a Long Short-Term Temporal Fusion Transformer
- Title(参考訳): TempFuser: 長期の短期核融合変換器を用いた空中戦における戦術とアジャイル飛行マニアの学習
- Authors: Hyunki Seong and David Hyunchul Shim
- Abstract要約: 本研究では,空中ドッグファイトにおけるポリシーネットワークのための長期短期核融合トランス (TempFuser) を提案する。
本手法では,LSTMをベースとした2つの入力埋め込みを用いて,長期的,スパースな状態軌跡と,短期的,高密度な状態軌跡を符号化する。
2つの埋め込みをトランスフォーマーエンコーダを通じて統合することにより、この方法はその後、アジャイルおよび戦術的な操作のためのエンドツーエンドのフライトコマンドを導出する。
- 参考スコア(独自算出の注目度): 2.8935588665357077
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Aerial dogfights necessitate understanding the tactically changing maneuvers
from a long-term perspective, along with the rapidly changing aerodynamics from
a short-term view. In this paper, we propose a novel long short-term temporal
fusion transformer (TempFuser) for a policy network in aerial dogfights. Our
method uses two LSTM-based input embeddings to encode long-term, sparse state
trajectories, as well as short-term, dense state trajectories. By integrating
the two embeddings through a transformer encoder, the method subsequently
derives end-to-end flight commands for agile and tactical maneuvers. We
formulate a deep reinforcement learning framework to train our TempFuser-based
policy model. We then extensively validate our model, demonstrating that it
outperforms other baseline models against a diverse range of opponent aircraft
in a high-fidelity environment. Our model successfully learns basic fighter
maneuvers, human pilot-like tactical maneuvers, and robust supersonic pursuit
in low altitudes without explicitly coded prior knowledge. Videos are available
at \url{https://sites.google.com/view/tempfuser}
- Abstract(参考訳): 空中戦は、短期的な視点から急速に変化する空力力と共に、戦術的に変化する操作を長期的な視点から理解する必要がある。
本稿では,空中ドッグファイトにおけるポリシーネットワークのための長期短期核融合変圧器(TempFuser)を提案する。
本手法では,LSTMをベースとした2つの入力埋め込みを用いて,長期のスパース状態軌跡と,短期の高密度状態軌跡を符号化する。
トランスフォーマーエンコーダを通じて2つの埋め込みを統合することで、この方法は、アジャイルおよび戦術的な操作のためにエンドツーエンドの飛行コマンドを導出する。
我々は、TempFuserベースのポリシーモデルをトレーニングするために、深い強化学習フレームワークを定式化します。
そして,本モデルの有効性を広く検証し,高忠実度環境下での多種多様な対向機に対して,他のベースラインモデルよりも優れていることを示す。
我々のモデルは、基礎的な戦闘機の操縦、人間のパイロットのような戦術的な操縦、低高度での強靭な超音速追跡を、事前の知識を明示的にコーディングすることなく学べる。
ビデオは \url{https://sites.google.com/view/tempfuser} で利用可能である。
関連論文リスト
- An Imitative Reinforcement Learning Framework for Autonomous Dogfight [20.150691753213817]
無人戦闘空母(UCAV)は、空戦において決定的な役割を担っている。
本稿では,自律的な探索を可能にしつつ,専門家データを効率的に活用する,新しい擬似強化学習フレームワークを提案する。
提案した枠組みは,UCAVの「プール・ロック・ローンチ」におけるドッグファイト・ポリシーを成功に導くことができる。
論文 参考訳(メタデータ) (2024-06-17T13:59:52Z) - Fighter flight trajectory prediction based on spatio-temporal graphcial attention network [8.938877973527779]
本稿では、符号化構造と復号構造を用いて、飛行軌道の予測を行うネットワーク時間グラフアテンション(ST-GAT)を提案する。
トランスフォーマー・ブランチ・ネットワークは、歴史的軌跡の特徴を抽出し、戦闘機の時間状態が将来の軌跡に与える影響を捉えるために使用される。
GATブランチネットワークは、歴史的軌跡の空間的特徴を抽出し、戦闘機間の潜在的な空間的相関を捉えるために使用される。
論文 参考訳(メタデータ) (2024-05-13T02:47:57Z) - From Flies to Robots: Inverted Landing in Small Quadcopters with Dynamic
Perching [15.57055572401334]
逆着陸は、多くの動物のチラシの中で日常的な行動である。
我々は,任意の天井面接触条件に対する制御ポリシーを策定する。
小型クワッドコプターにおいて,強靭な逆着陸動作を達成できた。
論文 参考訳(メタデータ) (2024-02-29T21:09:08Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Hierarchical Multi-Agent Reinforcement Learning for Air Combat
Maneuvering [40.06500618820166]
複数の異種エージェントを用いた空対空戦闘のための階層型多エージェント強化学習フレームワークを提案する。
低レベルの政策は、正確な部隊戦闘制御のために訓練される。指揮官政策は、事前訓練された低レベルの政策が与えられたミッション目標に基づいて訓練される。
論文 参考訳(メタデータ) (2023-09-20T12:16:00Z) - Reinforcement Learning Based Self-play and State Stacking Techniques for
Noisy Air Combat Environment [1.7403133838762446]
空気戦闘の複雑さは、攻撃的な近距離演習とアジャイルな敵の行動から生じる。
本研究では,エージェントに騒音を観測する空気戦闘シミュレーションを開発した。
ノイズ低減手法として,雑音の多いRL環境に対する状態積み重ね手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T12:23:23Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - Neural-Fly Enables Rapid Learning for Agile Flight in Strong Winds [96.74836678572582]
本稿では,ディープラーニングを通じて事前学習した表現を組み込むことで,オンラインでの迅速な適応を可能にする学習ベースのアプローチを提案する。
Neural-Flyは、最先端の非線形かつ適応的なコントローラよりもかなり少ないトラッキングエラーで正確な飛行制御を実現する。
論文 参考訳(メタデータ) (2022-05-13T21:55:28Z) - Fixed Points in Cyber Space: Rethinking Optimal Evasion Attacks in the
Age of AI-NIDS [70.60975663021952]
ネットワーク分類器に対するブラックボックス攻撃について検討する。
我々は、アタッカー・ディフェンダーの固定点がそれ自体、複雑な位相遷移を持つ一般サムゲームであると主張する。
攻撃防御力学の研究には連続的な学習手法が必要であることを示す。
論文 参考訳(メタデータ) (2021-11-23T23:42:16Z) - Learning Agile Locomotion via Adversarial Training [59.03007947334165]
本稿では,四足歩行ロボット(主人公)が他のロボット(敵)を追いかけるのを学習し,後者が逃げることを学習するマルチエージェント学習システムを提案する。
この敵対的なトレーニングプロセスは、アジャイルの振る舞いを促進するだけでなく、退屈な環境設計の努力を効果的に軽減します。
1つの敵のみを使用した以前の作品とは対照的に、異なる逃走戦略を専門とする敵のアンサンブルを訓練することは、主人公がアジリティを習得するために不可欠である。
論文 参考訳(メタデータ) (2020-08-03T01:20:37Z) - Model-Based Meta-Reinforcement Learning for Flight with Suspended
Payloads [69.21503033239985]
吊り下げられたペイロードの輸送は、自律的な航空車両にとって困難である。
接続後飛行データから数秒以内に変化力学のモデルを学習するメタラーニング手法を提案する。
論文 参考訳(メタデータ) (2020-04-23T17:43:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。