論文の概要: Autonomous Agent for Beyond Visual Range Air Combat: A Deep
Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2304.09669v1
- Date: Wed, 19 Apr 2023 13:54:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-20 14:13:42.558464
- Title: Autonomous Agent for Beyond Visual Range Air Combat: A Deep
Reinforcement Learning Approach
- Title(参考訳): beyond visual range air combatのための自律エージェント:深層強化学習アプローチ
- Authors: Joao P. A. Dantas, Marcos R. O. A. Maximo, Takashi Yoneyama
- Abstract要約: 本研究は, 遠近視域(BVR)空戦シミュレーション環境において動作可能な深層強化学習に基づくエージェントの開発に寄与する。
本稿では,BVR戦闘におけるその役割を学習し,改善することができる高性能戦闘機のエージェント構築の概要について述べる。
また、仮想シミュレーションを用いて実際のパイロットの能力を調べ、訓練されたエージェントと同じ環境で対話し、パフォーマンスを比較することを望んでいる。
- 参考スコア(独自算出の注目度): 0.2578242050187029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work contributes to developing an agent based on deep reinforcement
learning capable of acting in a beyond visual range (BVR) air combat simulation
environment. The paper presents an overview of building an agent representing a
high-performance fighter aircraft that can learn and improve its role in BVR
combat over time based on rewards calculated using operational metrics. Also,
through self-play experiments, it expects to generate new air combat tactics
never seen before. Finally, we hope to examine a real pilot's ability, using
virtual simulation, to interact in the same environment with the trained agent
and compare their performances. This research will contribute to the air combat
training context by developing agents that can interact with real pilots to
improve their performances in air defense missions.
- Abstract(参考訳): 本研究は,bvr(beyond visual range)航空戦闘シミュレーション環境において動作可能な深層強化学習に基づくエージェントの開発に寄与する。
本稿では,実測値から算出した報酬に基づいて,bvr戦闘におけるその役割を学習し,改善できる高性能戦闘機のエージェントの構築について概説する。
また、セルフプレイ実験を通じて、これまで見たことのない新しい空戦戦術を生み出すことも期待しています。
最後に、仮想シミュレーションを用いて、訓練されたエージェントと同一環境で対話し、それらのパフォーマンスを比較する実際のパイロットの能力について検討する。
本研究は、実際のパイロットと対話し、航空防衛任務におけるパフォーマンスを改善するエージェントを開発することで、航空戦闘訓練の文脈に寄与する。
関連論文リスト
- Autonomous Decision Making for UAV Cooperative Pursuit-Evasion Game with Reinforcement Learning [50.33447711072726]
本稿では,マルチロールUAV協調追従ゲームにおける意思決定のための深層強化学習モデルを提案する。
提案手法は,追従回避ゲームシナリオにおけるUAVの自律的意思決定を可能にする。
論文 参考訳(メタデータ) (2024-11-05T10:45:30Z) - Exploring reinforcement learning for incident response in autonomous military vehicles [0.62914438169038]
このトピックの研究は、軍事目的のためにこれらの車両の採用を加速するために必要とされる能力の1つとして、自律的なサイバー防衛を指摘している。
本稿では,無人車両に対するサイバー攻撃に自律的に対応できるエージェントを,軍事作戦の文脈で訓練するための強化学習について検討する。
我々の研究の重要な貢献は、強化学習が、単純なシミュレーション環境で訓練された場合でも、実際の無人地上車両上で自律的なサイバー防衛に使用できるエージェントを訓練するための、実行可能なアプローチであることを実証することである。
論文 参考訳(メタデータ) (2024-10-28T18:08:23Z) - An Imitative Reinforcement Learning Framework for Autonomous Dogfight [20.150691753213817]
無人戦闘空母(UCAV)は、空戦において決定的な役割を担っている。
本稿では,自律的な探索を可能にしつつ,専門家データを効率的に活用する,新しい擬似強化学習フレームワークを提案する。
提案した枠組みは,UCAVの「プール・ロック・ローンチ」におけるドッグファイト・ポリシーを成功に導くことができる。
論文 参考訳(メタデータ) (2024-06-17T13:59:52Z) - BVR Gym: A Reinforcement Learning Environment for Beyond-Visual-Range Air Combat [3.4311229392863463]
我々は、航空戦闘戦術の調査を支援するため、強化学習環境を構築します。
長距離ミサイルは、しばしば空中戦闘で使用される最初の兵器である。
この記事では、環境の構成要素といくつかのユースケースについて説明する。
論文 参考訳(メタデータ) (2024-03-26T09:39:21Z) - Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Reinforcement Learning Based Self-play and State Stacking Techniques for
Noisy Air Combat Environment [1.7403133838762446]
空気戦闘の複雑さは、攻撃的な近距離演習とアジャイルな敵の行動から生じる。
本研究では,エージェントに騒音を観測する空気戦闘シミュレーションを開発した。
ノイズ低減手法として,雑音の多いRL環境に対する状態積み重ね手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T12:23:23Z) - Towards Cooperative Flight Control Using Visual-Attention [61.99121057062421]
本稿では,パイロットと制御システム間の並列自律性を実現するための,視覚に基づくエアガードシステムを提案する。
我々の注意に基づく航空防衛システムは、飛行への関与レベルとパイロットの専門知識と注意のトレードオフをバランスさせることができる。
論文 参考訳(メタデータ) (2022-12-21T15:31:47Z) - The eyes and hearts of UAV pilots: observations of physiological
responses in real-life scenarios [64.0476282000118]
民間機や軍用機では、パイロットはリアルなシミュレーターで自分の反応や反射を調整できる。
この作業は、現場でパイロットの行動を収集し、パフォーマンスを向上させるソリューションを提供することを目的としています。
論文 参考訳(メタデータ) (2022-10-26T14:16:56Z) - Automating Privilege Escalation with Deep Reinforcement Learning [71.87228372303453]
本研究では,エージェントの訓練に深層強化学習を用いることで,悪意あるアクターの潜在的な脅威を実証する。
本稿では,最先端の強化学習アルゴリズムを用いて,局所的な特権エスカレーションを行うエージェントを提案する。
我々のエージェントは、実際の攻撃センサーデータを生成し、侵入検知システムの訓練と評価に利用できる。
論文 参考訳(メタデータ) (2021-10-04T12:20:46Z) - Learning Affordance Landscapes for Interaction Exploration in 3D
Environments [101.90004767771897]
エージェントは環境の仕組みを習得できなければならない。
相互作用探索のための強化学習手法を提案する。
AI2-iTHORで私たちのアイデアを実証します。
論文 参考訳(メタデータ) (2020-08-21T00:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。