論文の概要: TempFuser: Learning Tactical and Agile Flight Maneuvers in Aerial
Dogfights using a Long Short-Term Temporal Fusion Transformer
- arxiv url: http://arxiv.org/abs/2308.03257v1
- Date: Mon, 7 Aug 2023 02:28:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 15:42:18.953434
- Title: TempFuser: Learning Tactical and Agile Flight Maneuvers in Aerial
Dogfights using a Long Short-Term Temporal Fusion Transformer
- Title(参考訳): TempFuser: 長期の短期核融合変換器を用いた空中戦における戦術とアジャイル飛行マニアの学習
- Authors: Hyunki Seong and David Hyunchul Shim
- Abstract要約: 本研究では,空中ドッグファイトにおけるポリシーネットワークのための長期短期核融合トランス (TempFuser) を提案する。
本手法では,LSTMをベースとした2つの入力埋め込みを用いて,長期的,スパースな状態軌跡と,短期的,高密度な状態軌跡を符号化する。
2つの埋め込みをトランスフォーマーエンコーダを通じて統合することにより、この方法はその後、アジャイルおよび戦術的な操作のためのエンドツーエンドのフライトコマンドを導出する。
- 参考スコア(独自算出の注目度): 2.8935588665357077
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Aerial dogfights necessitate understanding the tactically changing maneuvers
from a long-term perspective, along with the rapidly changing aerodynamics from
a short-term view. In this paper, we propose a novel long short-term temporal
fusion transformer (TempFuser) for a policy network in aerial dogfights. Our
method uses two LSTM-based input embeddings to encode long-term, sparse state
trajectories, as well as short-term, dense state trajectories. By integrating
the two embeddings through a transformer encoder, the method subsequently
derives end-to-end flight commands for agile and tactical maneuvers. We
formulate a deep reinforcement learning framework to train our TempFuser-based
policy model. We then extensively validate our model, demonstrating that it
outperforms other baseline models against a diverse range of opponent aircraft
in a high-fidelity environment. Our model successfully learns basic fighter
maneuvers, human pilot-like tactical maneuvers, and robust supersonic pursuit
in low altitudes without explicitly coded prior knowledge. Videos are available
at \url{https://sites.google.com/view/tempfuser}
- Abstract(参考訳): 空中戦は、短期的な視点から急速に変化する空力力と共に、戦術的に変化する操作を長期的な視点から理解する必要がある。
本稿では,空中ドッグファイトにおけるポリシーネットワークのための長期短期核融合変圧器(TempFuser)を提案する。
本手法では,LSTMをベースとした2つの入力埋め込みを用いて,長期のスパース状態軌跡と,短期の高密度状態軌跡を符号化する。
トランスフォーマーエンコーダを通じて2つの埋め込みを統合することで、この方法は、アジャイルおよび戦術的な操作のためにエンドツーエンドの飛行コマンドを導出する。
我々は、TempFuserベースのポリシーモデルをトレーニングするために、深い強化学習フレームワークを定式化します。
そして,本モデルの有効性を広く検証し,高忠実度環境下での多種多様な対向機に対して,他のベースラインモデルよりも優れていることを示す。
我々のモデルは、基礎的な戦闘機の操縦、人間のパイロットのような戦術的な操縦、低高度での強靭な超音速追跡を、事前の知識を明示的にコーディングすることなく学べる。
ビデオは \url{https://sites.google.com/view/tempfuser} で利用可能である。
関連論文リスト
- From Flies to Robots: Inverted Landing in Small Quadcopters with Dynamic
Perching [15.57055572401334]
逆着陸は、多くの動物のチラシの中で日常的な行動である。
我々は,任意の天井面接触条件に対する制御ポリシーを策定する。
小型クワッドコプターにおいて,強靭な逆着陸動作を達成できた。
論文 参考訳(メタデータ) (2024-02-29T21:09:08Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal
Locomotion Control [112.66677641636299]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Autonomous Agent for Beyond Visual Range Air Combat: A Deep
Reinforcement Learning Approach [0.2578242050187029]
本研究は, 遠近視域(BVR)空戦シミュレーション環境において動作可能な深層強化学習に基づくエージェントの開発に寄与する。
本稿では,BVR戦闘におけるその役割を学習し,改善することができる高性能戦闘機のエージェント構築の概要について述べる。
また、仮想シミュレーションを用いて実際のパイロットの能力を調べ、訓練されたエージェントと同じ環境で対話し、パフォーマンスを比較することを望んでいる。
論文 参考訳(メタデータ) (2023-04-19T13:54:37Z) - Reinforcement Learning Based Self-play and State Stacking Techniques for
Noisy Air Combat Environment [1.7403133838762446]
空気戦闘の複雑さは、攻撃的な近距離演習とアジャイルな敵の行動から生じる。
本研究では,エージェントに騒音を観測する空気戦闘シミュレーションを開発した。
ノイズ低減手法として,雑音の多いRL環境に対する状態積み重ね手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T12:23:23Z) - Harfang3D Dog-Fight Sandbox: A Reinforcement Learning Research Platform
for the Customized Control Tasks of Fighter Aircrafts [0.0]
本研究では,戦闘機用の半現実的な飛行シミュレーション環境であるHarfang3D Dog-Fight Sandboxを提案する。
強化学習を用いた航空研究における主な課題を調査するための柔軟なツールボックスである。
ソフトウェアはまた、ボット航空機の配備とマルチエージェントタスクの開発を可能にする。
論文 参考訳(メタデータ) (2022-10-13T18:18:09Z) - Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
論文 参考訳(メタデータ) (2022-09-19T17:55:05Z) - Neural-Fly Enables Rapid Learning for Agile Flight in Strong Winds [96.74836678572582]
本稿では,ディープラーニングを通じて事前学習した表現を組み込むことで,オンラインでの迅速な適応を可能にする学習ベースのアプローチを提案する。
Neural-Flyは、最先端の非線形かつ適応的なコントローラよりもかなり少ないトラッキングエラーで正確な飛行制御を実現する。
論文 参考訳(メタデータ) (2022-05-13T21:55:28Z) - L2E: Learning to Exploit Your Opponent [66.66334543946672]
本稿では,暗黙的対向モデリングのための新しい学習フレームワークを提案する。
L2Eは、トレーニング中に異なる相手との対話によって、相手を悪用する能力を取得する。
本稿では, 対戦相手を自動的に生成する新しい対戦相手戦略生成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-18T14:27:59Z) - Learning Agile Locomotion via Adversarial Training [59.03007947334165]
本稿では,四足歩行ロボット(主人公)が他のロボット(敵)を追いかけるのを学習し,後者が逃げることを学習するマルチエージェント学習システムを提案する。
この敵対的なトレーニングプロセスは、アジャイルの振る舞いを促進するだけでなく、退屈な環境設計の努力を効果的に軽減します。
1つの敵のみを使用した以前の作品とは対照的に、異なる逃走戦略を専門とする敵のアンサンブルを訓練することは、主人公がアジリティを習得するために不可欠である。
論文 参考訳(メタデータ) (2020-08-03T01:20:37Z) - Model-Based Meta-Reinforcement Learning for Flight with Suspended
Payloads [69.21503033239985]
吊り下げられたペイロードの輸送は、自律的な航空車両にとって困難である。
接続後飛行データから数秒以内に変化力学のモデルを学習するメタラーニング手法を提案する。
論文 参考訳(メタデータ) (2020-04-23T17:43:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。