論文の概要: Autonomous Agent for Beyond Visual Range Air Combat: A Deep
Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2304.09669v1
- Date: Wed, 19 Apr 2023 13:54:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-20 14:13:42.558464
- Title: Autonomous Agent for Beyond Visual Range Air Combat: A Deep
Reinforcement Learning Approach
- Title(参考訳): beyond visual range air combatのための自律エージェント:深層強化学習アプローチ
- Authors: Joao P. A. Dantas, Marcos R. O. A. Maximo, Takashi Yoneyama
- Abstract要約: 本研究は, 遠近視域(BVR)空戦シミュレーション環境において動作可能な深層強化学習に基づくエージェントの開発に寄与する。
本稿では,BVR戦闘におけるその役割を学習し,改善することができる高性能戦闘機のエージェント構築の概要について述べる。
また、仮想シミュレーションを用いて実際のパイロットの能力を調べ、訓練されたエージェントと同じ環境で対話し、パフォーマンスを比較することを望んでいる。
- 参考スコア(独自算出の注目度): 0.2578242050187029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work contributes to developing an agent based on deep reinforcement
learning capable of acting in a beyond visual range (BVR) air combat simulation
environment. The paper presents an overview of building an agent representing a
high-performance fighter aircraft that can learn and improve its role in BVR
combat over time based on rewards calculated using operational metrics. Also,
through self-play experiments, it expects to generate new air combat tactics
never seen before. Finally, we hope to examine a real pilot's ability, using
virtual simulation, to interact in the same environment with the trained agent
and compare their performances. This research will contribute to the air combat
training context by developing agents that can interact with real pilots to
improve their performances in air defense missions.
- Abstract(参考訳): 本研究は,bvr(beyond visual range)航空戦闘シミュレーション環境において動作可能な深層強化学習に基づくエージェントの開発に寄与する。
本稿では,実測値から算出した報酬に基づいて,bvr戦闘におけるその役割を学習し,改善できる高性能戦闘機のエージェントの構築について概説する。
また、セルフプレイ実験を通じて、これまで見たことのない新しい空戦戦術を生み出すことも期待しています。
最後に、仮想シミュレーションを用いて、訓練されたエージェントと同一環境で対話し、それらのパフォーマンスを比較する実際のパイロットの能力について検討する。
本研究は、実際のパイロットと対話し、航空防衛任務におけるパフォーマンスを改善するエージェントを開発することで、航空戦闘訓練の文脈に寄与する。
関連論文リスト
- Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Learned Tree Search for Long-Horizon Social Robot Navigation in Shared
Airspace [9.925701106706804]
Social Robot Tree Search (SoRTS)は、ソーシャルドメインにおける移動ロボットの安全なナビゲーションのためのアルゴリズムである。
X-PlaneROSは、フルスケールの航空自律性の研究を可能にする高忠実な空中シミュレータである。
論文 参考訳(メタデータ) (2023-04-04T00:22:17Z) - Reinforcement Learning Based Self-play and State Stacking Techniques for
Noisy Air Combat Environment [1.7403133838762446]
空気戦闘の複雑さは、攻撃的な近距離演習とアジャイルな敵の行動から生じる。
本研究では,エージェントに騒音を観測する空気戦闘シミュレーションを開発した。
ノイズ低減手法として,雑音の多いRL環境に対する状態積み重ね手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T12:23:23Z) - Towards Cooperative Flight Control Using Visual-Attention [61.99121057062421]
本稿では,パイロットと制御システム間の並列自律性を実現するための,視覚に基づくエアガードシステムを提案する。
我々の注意に基づく航空防衛システムは、飛行への関与レベルとパイロットの専門知識と注意のトレードオフをバランスさせることができる。
論文 参考訳(メタデータ) (2022-12-21T15:31:47Z) - The eyes and hearts of UAV pilots: observations of physiological
responses in real-life scenarios [64.0476282000118]
民間機や軍用機では、パイロットはリアルなシミュレーターで自分の反応や反射を調整できる。
この作業は、現場でパイロットの行動を収集し、パフォーマンスを向上させるソリューションを提供することを目的としています。
論文 参考訳(メタデータ) (2022-10-26T14:16:56Z) - Harfang3D Dog-Fight Sandbox: A Reinforcement Learning Research Platform
for the Customized Control Tasks of Fighter Aircrafts [0.0]
本研究では,戦闘機用の半現実的な飛行シミュレーション環境であるHarfang3D Dog-Fight Sandboxを提案する。
強化学習を用いた航空研究における主な課題を調査するための柔軟なツールボックスである。
ソフトウェアはまた、ボット航空機の配備とマルチエージェントタスクの開発を可能にする。
論文 参考訳(メタデータ) (2022-10-13T18:18:09Z) - Autonomous Aerial Robot for High-Speed Search and Intercept Applications [86.72321289033562]
高速物体把握のための完全自律飛行ロボットが提案されている。
追加のサブタスクとして、我々のシステムは、表面に近い極にある気球を自律的にピアスすることができる。
我々のアプローチは、挑戦的な国際競争で検証され、優れた結果が得られました。
論文 参考訳(メタデータ) (2021-12-10T11:49:51Z) - Automating Privilege Escalation with Deep Reinforcement Learning [71.87228372303453]
本研究では,エージェントの訓練に深層強化学習を用いることで,悪意あるアクターの潜在的な脅威を実証する。
本稿では,最先端の強化学習アルゴリズムを用いて,局所的な特権エスカレーションを行うエージェントを提案する。
我々のエージェントは、実際の攻撃センサーデータを生成し、侵入検知システムの訓練と評価に利用できる。
論文 参考訳(メタデータ) (2021-10-04T12:20:46Z) - Adversary agent reinforcement learning for pursuit-evasion [0.0]
本研究は,戦争の霧の中での追撃ゲームにおいて,敵エージェントによる強化学習環境を提案する。
最も人気のある学習環境の一つであるStarCraftがここで採用され、関連するミニゲームを分析して、敵エージェントのトレーニングの現在の制限を特定する。
提案したSAAC環境は、急速に発展する強化学習技術による追従回避研究の恩恵を受ける。
論文 参考訳(メタデータ) (2021-08-25T01:44:06Z) - Learning Affordance Landscapes for Interaction Exploration in 3D
Environments [101.90004767771897]
エージェントは環境の仕組みを習得できなければならない。
相互作用探索のための強化学習手法を提案する。
AI2-iTHORで私たちのアイデアを実証します。
論文 参考訳(メタデータ) (2020-08-21T00:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。