論文の概要: Hierarchical Reinforcement Learning for Air-to-Air Combat
- arxiv url: http://arxiv.org/abs/2105.00990v1
- Date: Mon, 3 May 2021 16:40:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-04 13:55:39.794946
- Title: Hierarchical Reinforcement Learning for Air-to-Air Combat
- Title(参考訳): 空対空コンバットの階層的強化学習
- Authors: Adrian P. Pope, Jaime S. Ide, Daria Micovic, Henry Diaz, David
Rosenbluth, Lee Ritholtz, Jason C. Twedt, Thayne T. Walker, Kevin Alcedo and
Daniel Javorsek
- Abstract要約: lockheed martins(lm)アプローチは階層的アーキテクチャと最大エントロピー強化学習(rl)を組み合わせる
このアプローチは、最終DARPAのAlphaDogfight Trials(ADT)で2nd$のフィニッシュを達成しました。
アメリカ空軍(USAF)のF-16 Weapons Instructor Course(F-16 Weapons Instructor Course)を敗れた。
- 参考スコア(独自算出の注目度): 2.3566217399536002
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial Intelligence (AI) is becoming a critical component in the defense
industry, as recently demonstrated by DARPA`s AlphaDogfight Trials (ADT). ADT
sought to vet the feasibility of AI algorithms capable of piloting an F-16 in
simulated air-to-air combat. As a participant in ADT, Lockheed Martin`s (LM)
approach combines a hierarchical architecture with maximum-entropy
reinforcement learning (RL), integrates expert knowledge through reward
shaping, and supports modularity of policies. This approach achieved a $2^{nd}$
place finish in the final ADT event (among eight total competitors) and
defeated a graduate of the US Air Force's (USAF) F-16 Weapons Instructor Course
in match play.
- Abstract(参考訳): 人工知能(AI)は、DARPAのAlphaDogfight Trials(ADT)が最近示したように、防衛産業において重要なコンポーネントになりつつある。
ADTはF-16を模擬空対空戦闘で操縦できるAIアルゴリズムの可能性を検証しようとした。
ADTの参加者として、Lockheed Martin氏のLM(LM)アプローチは、階層アーキテクチャと最大エントロピー強化学習(RL)を組み合わせて、報酬形成を通じて専門家の知識を統合し、ポリシーのモジュラリティをサポートする。
このアプローチはADTの最終大会(合計8つの競技者を含む)で2-2ドルの成績を収め、アメリカ空軍(USAF)のF-16 Weapons Instructor Courseの卒業生をマッチプレーで破った。
関連論文リスト
- An Imitative Reinforcement Learning Framework for Autonomous Dogfight [20.150691753213817]
無人戦闘空母(UCAV)は、空戦において決定的な役割を担っている。
本稿では,自律的な探索を可能にしつつ,専門家データを効率的に活用する,新しい擬似強化学習フレームワークを提案する。
提案した枠組みは,UCAVの「プール・ロック・ローンチ」におけるドッグファイト・ポリシーを成功に導くことができる。
論文 参考訳(メタデータ) (2024-06-17T13:59:52Z) - Interpretable DRL-based Maneuver Decision of UCAV Dogfight [11.634531542098054]
本稿では, 深部強化学習(DRL)が高次機動決定に寄与する3層無人戦闘機(UCAV)のドッグファイトフレームを提案する。
4チャンネルの低レベル制御法が構築され、8つの基本的な飛行操作(BFM)を含むライブラリが続く。
UCAVドッグファイトにおけるBFM選択にはDouble Deep Q Network (DDQN) が適用される。
論文 参考訳(メタデータ) (2024-05-28T00:43:47Z) - DanZero+: Dominating the GuanDan Game through Reinforcement Learning [95.90682269990705]
我々は、GuanDanという、非常に複雑で人気のあるカードゲームのためのAIプログラムを開発した。
私たちはまず、DanZeroという名のAIプログラムをこのゲームのために提案しました。
AIの能力をさらに強化するために、政策に基づく強化学習アルゴリズムをGuanDanに適用する。
論文 参考訳(メタデータ) (2023-12-05T08:07:32Z) - A LLM Assisted Exploitation of AI-Guardian [57.572998144258705]
IEEE S&P 2023で発表された敵に対する最近の防衛であるAI-Guardianの堅牢性を評価する。
我々は、このモデルを攻撃するためのコードを書かず、代わりに、GPT-4に命令とガイダンスに従って全ての攻撃アルゴリズムを実装するよう促します。
このプロセスは驚くほど効果的で効率的であり、言語モデルでは、この論文の著者が実行したよりも高速に曖昧な命令からコードを生成することもあった。
論文 参考訳(メタデータ) (2023-07-20T17:33:25Z) - Autonomous Agent for Beyond Visual Range Air Combat: A Deep
Reinforcement Learning Approach [0.2578242050187029]
本研究は, 遠近視域(BVR)空戦シミュレーション環境において動作可能な深層強化学習に基づくエージェントの開発に寄与する。
本稿では,BVR戦闘におけるその役割を学習し,改善することができる高性能戦闘機のエージェント構築の概要について述べる。
また、仮想シミュレーションを用いて実際のパイロットの能力を調べ、訓練されたエージェントと同じ環境で対話し、パフォーマンスを比較することを望んでいる。
論文 参考訳(メタデータ) (2023-04-19T13:54:37Z) - AI Enabled Maneuver Identification via the Maneuver Identification
Challenge [5.628624906988051]
Maneuver IDは、現実の空軍のフライトシミュレーターデータを用いたAIチャレンジである。
このデータセットはManeuver-ID.mit.eduで公開されている。
我々は「良い」と「悪い」シミュレーターデータを分離し、操作の分類と特徴付けに様々なAI手法を適用した。
論文 参考訳(メタデータ) (2022-11-28T16:55:32Z) - Reinforcement Learning based Air Combat Maneuver Generation [0.0]
本研究では,2次元空間内を最適経路で移動するための双極体動特性を持つUAVを目標とした。
2つの異なる環境でテストを行い、シミュレーションを使用しました。
論文 参考訳(メタデータ) (2022-01-14T15:55:44Z) - Fixed Points in Cyber Space: Rethinking Optimal Evasion Attacks in the
Age of AI-NIDS [70.60975663021952]
ネットワーク分類器に対するブラックボックス攻撃について検討する。
我々は、アタッカー・ディフェンダーの固定点がそれ自体、複雑な位相遷移を持つ一般サムゲームであると主張する。
攻撃防御力学の研究には連続的な学習手法が必要であることを示す。
論文 参考訳(メタデータ) (2021-11-23T23:42:16Z) - Rethinking Drone-Based Search and Rescue with Aerial Person Detection [79.76669658740902]
航空ドローンの映像の視覚検査は、現在土地捜索救助(SAR)活動に不可欠な部分である。
本稿では,この空中人物検出(APD)タスクを自動化するための新しいディープラーニングアルゴリズムを提案する。
本稿では,Aerial Inspection RetinaNet (AIR) アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-11-17T21:48:31Z) - Adversarial Attacks on ML Defense Models Competition [82.37504118766452]
清華大学のTSAILグループとAlibaba Securityグループがこの競争を組織した。
この競争の目的は、敵の堅牢性を評価するために、新しい攻撃アルゴリズムを動機付けることである。
論文 参考訳(メタデータ) (2021-10-15T12:12:41Z) - Boosting Adversarial Training with Hypersphere Embedding [53.75693100495097]
敵対的訓練は、ディープラーニングモデルに対する敵対的攻撃に対する最も効果的な防御の1つである。
本研究では,超球埋め込み機構をATプロシージャに組み込むことを提唱する。
我々は,CIFAR-10 と ImageNet データセットに対する幅広い敵対攻撃の下で本手法を検証した。
論文 参考訳(メタデータ) (2020-02-20T08:42:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。