Fugu-MT 論文翻訳(概要): Hierarchical Reinforcement Learning for Air-to-Air Combat

論文の概要: Hierarchical Reinforcement Learning for Air-to-Air Combat

arxiv url: http://arxiv.org/abs/2105.00990v1
Date: Mon, 3 May 2021 16:40:00 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-04 13:55:39.794946
Title: Hierarchical Reinforcement Learning for Air-to-Air Combat
Title（参考訳）: 空対空コンバットの階層的強化学習
Authors: Adrian P. Pope, Jaime S. Ide, Daria Micovic, Henry Diaz, David Rosenbluth, Lee Ritholtz, Jason C. Twedt, Thayne T. Walker, Kevin Alcedo and Daniel Javorsek
Abstract要約: lockheed martins(lm)アプローチは階層的アーキテクチャと最大エントロピー強化学習(rl)を組み合わせるこのアプローチは、最終DARPAのAlphaDogfight Trials(ADT)で2nd$のフィニッシュを達成しました。アメリカ空軍(USAF)のF-16 Weapons Instructor Course(F-16 Weapons Instructor Course)を敗れた。
参考スコア（独自算出の注目度）: 2.3566217399536002
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Artificial Intelligence (AI) is becoming a critical component in the defense industry, as recently demonstrated by DARPA`s AlphaDogfight Trials (ADT). ADT sought to vet the feasibility of AI algorithms capable of piloting an F-16 in simulated air-to-air combat. As a participant in ADT, Lockheed Martin`s (LM) approach combines a hierarchical architecture with maximum-entropy reinforcement learning (RL), integrates expert knowledge through reward shaping, and supports modularity of policies. This approach achieved a $2^{nd}$ place finish in the final ADT event (among eight total competitors) and defeated a graduate of the US Air Force's (USAF) F-16 Weapons Instructor Course in match play.
Abstract（参考訳）: 人工知能(AI)は、DARPAのAlphaDogfight Trials(ADT)が最近示したように、防衛産業において重要なコンポーネントになりつつある。 ADTはF-16を模擬空対空戦闘で操縦できるAIアルゴリズムの可能性を検証しようとした。 ADTの参加者として、Lockheed Martin氏のLM(LM)アプローチは、階層アーキテクチャと最大エントロピー強化学習(RL)を組み合わせて、報酬形成を通じて専門家の知識を統合し、ポリシーのモジュラリティをサポートする。このアプローチはADTの最終大会(合計8つの競技者を含む)で2-2ドルの成績を収め、アメリカ空軍(USAF)のF-16 Weapons Instructor Courseの卒業生をマッチプレーで破った。

関連論文リスト

RL Is a Hammer and LLMs Are Nails: A Simple Reinforcement Learning Recipe for Strong Prompt Injection [82.41836544860833]
RL-Hammerは、攻撃モデルを訓練するためのシンプルなレシピで、強力なプロンプトインジェクションを実行するために自動的に学習する。我々は,高度に効果的で普遍的な攻撃を可能にする実用的手法のセットを提案する。 RL-Hammerは、GPT-4oに対して98%のASR、GPT-5に対して72%のASRに達した。
論文参考訳（メタデータ） (2025-10-06T15:06:04Z)
Reinforcement Learning for Decision-Level Interception Prioritization in Drone Swarm Defense [56.47577824219207]
本稿では,この課題に対処する上で,強化学習の実践的メリットを示すケーススタディを提案する。本研究では,現実的な運用制約を捉えた高忠実度シミュレーション環境を提案する。エージェントは最適なインターセプション優先順位付けのために複数のエフェクターを調整することを学ぶ。我々は、何百ものシミュレートされた攻撃シナリオにおいて、手作りルールベースのベースラインに対する学習ポリシーを評価する。
論文参考訳（メタデータ） (2025-08-01T13:55:39Z)
Training Environment for High Performance Reinforcement Learning [0.0]
トンネルは高性能航空機のための強化学習環境である。 F16の非線形飛行ダイナミクスをOpenAI Gymnasium pythonパッケージに統合する。
論文参考訳（メタデータ） (2025-05-04T01:09:15Z)
AVA: Attentive VLM Agent for Mastering StarCraft II [56.07921367623274]
Intentive VLM Agent (AVA) は、人工エージェントの認識と人間のゲームプレイ体験を一致させるマルチモーダルのStarCraft IIエージェントである。我々のエージェントは、ゲームプレイ中に人間の認知過程をより密にシミュレートするRGB視覚入力と自然言語観察を組み込むことにより、この制限に対処する。
論文参考訳（メタデータ） (2025-03-07T12:54:25Z)
An Imitative Reinforcement Learning Framework for Autonomous Dogfight [20.150691753213817]
無人戦闘空母(UCAV)は、空戦において決定的な役割を担っている。本稿では,自律的な探索を可能にしつつ,専門家データを効率的に活用する,新しい擬似強化学習フレームワークを提案する。提案した枠組みは,UCAVの「プール・ロック・ローンチ」におけるドッグファイト・ポリシーを成功に導くことができる。
論文参考訳（メタデータ） (2024-06-17T13:59:52Z)
Interpretable DRL-based Maneuver Decision of UCAV Dogfight [11.634531542098054]
本稿では, 深部強化学習(DRL)が高次機動決定に寄与する3層無人戦闘機(UCAV)のドッグファイトフレームを提案する。 4チャンネルの低レベル制御法が構築され、8つの基本的な飛行操作(BFM)を含むライブラリが続く。 UCAVドッグファイトにおけるBFM選択にはDouble Deep Q Network (DDQN) が適用される。
論文参考訳（メタデータ） (2024-05-28T00:43:47Z)
DanZero+: Dominating the GuanDan Game through Reinforcement Learning [95.90682269990705]
我々は、GuanDanという、非常に複雑で人気のあるカードゲームのためのAIプログラムを開発した。私たちはまず、DanZeroという名のAIプログラムをこのゲームのために提案しました。 AIの能力をさらに強化するために、政策に基づく強化学習アルゴリズムをGuanDanに適用する。
論文参考訳（メタデータ） (2023-12-05T08:07:32Z)
A LLM Assisted Exploitation of AI-Guardian [57.572998144258705]
IEEE S&P 2023で発表された敵に対する最近の防衛であるAI-Guardianの堅牢性を評価する。我々は、このモデルを攻撃するためのコードを書かず、代わりに、GPT-4に命令とガイダンスに従って全ての攻撃アルゴリズムを実装するよう促します。このプロセスは驚くほど効果的で効率的であり、言語モデルでは、この論文の著者が実行したよりも高速に曖昧な命令からコードを生成することもあった。
論文参考訳（メタデータ） (2023-07-20T17:33:25Z)
Autonomous Agent for Beyond Visual Range Air Combat: A Deep Reinforcement Learning Approach [0.2578242050187029]
本研究は, 遠近視域(BVR)空戦シミュレーション環境において動作可能な深層強化学習に基づくエージェントの開発に寄与する。本稿では,BVR戦闘におけるその役割を学習し,改善することができる高性能戦闘機のエージェント構築の概要について述べる。また、仮想シミュレーションを用いて実際のパイロットの能力を調べ、訓練されたエージェントと同じ環境で対話し、パフォーマンスを比較することを望んでいる。
論文参考訳（メタデータ） (2023-04-19T13:54:37Z)
AI Enabled Maneuver Identification via the Maneuver Identification Challenge [5.628624906988051]
Maneuver IDは、現実の空軍のフライトシミュレーターデータを用いたAIチャレンジである。このデータセットはManeuver-ID.mit.eduで公開されている。我々は「良い」と「悪い」シミュレーターデータを分離し、操作の分類と特徴付けに様々なAI手法を適用した。
論文参考訳（メタデータ） (2022-11-28T16:55:32Z)
Reinforcement Learning based Air Combat Maneuver Generation [0.0]
本研究では,2次元空間内を最適経路で移動するための双極体動特性を持つUAVを目標とした。 2つの異なる環境でテストを行い、シミュレーションを使用しました。
論文参考訳（メタデータ） (2022-01-14T15:55:44Z)
Fixed Points in Cyber Space: Rethinking Optimal Evasion Attacks in the Age of AI-NIDS [70.60975663021952]
ネットワーク分類器に対するブラックボックス攻撃について検討する。我々は、アタッカー・ディフェンダーの固定点がそれ自体、複雑な位相遷移を持つ一般サムゲームであると主張する。攻撃防御力学の研究には連続的な学習手法が必要であることを示す。
論文参考訳（メタデータ） (2021-11-23T23:42:16Z)
Rethinking Drone-Based Search and Rescue with Aerial Person Detection [79.76669658740902]
航空ドローンの映像の視覚検査は、現在土地捜索救助(SAR)活動に不可欠な部分である。本稿では,この空中人物検出(APD)タスクを自動化するための新しいディープラーニングアルゴリズムを提案する。本稿では,Aerial Inspection RetinaNet (AIR) アルゴリズムについて述べる。
論文参考訳（メタデータ） (2021-11-17T21:48:31Z)
Adversarial Attacks on ML Defense Models Competition [82.37504118766452]
清華大学のTSAILグループとAlibaba Securityグループがこの競争を組織した。この競争の目的は、敵の堅牢性を評価するために、新しい攻撃アルゴリズムを動機付けることである。
論文参考訳（メタデータ） (2021-10-15T12:12:41Z)
Boosting Adversarial Training with Hypersphere Embedding [53.75693100495097]
敵対的訓練は、ディープラーニングモデルに対する敵対的攻撃に対する最も効果的な防御の1つである。本研究では,超球埋め込み機構をATプロシージャに組み込むことを提唱する。我々は,CIFAR-10 と ImageNet データセットに対する幅広い敵対攻撃の下で本手法を検証した。
論文参考訳（メタデータ） (2020-02-20T08:42:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。