論文の概要: Reinforcement Learning for Decision-Level Interception Prioritization in Drone Swarm Defense
- arxiv url: http://arxiv.org/abs/2508.00641v1
- Date: Fri, 01 Aug 2025 13:55:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-04 18:08:53.903793
- Title: Reinforcement Learning for Decision-Level Interception Prioritization in Drone Swarm Defense
- Title(参考訳): ドローン群防御における決定レベルインターセプション優先化のための強化学習
- Authors: Alessandro Palmas,
- Abstract要約: 本稿では,この課題に対処する上で,強化学習の実践的メリットを示すケーススタディを提案する。
本研究では,現実的な運用制約を捉えた高忠実度シミュレーション環境を提案する。
エージェントは最適なインターセプション優先順位付けのために複数のエフェクターを調整することを学ぶ。
我々は、何百ものシミュレートされた攻撃シナリオにおいて、手作りルールベースのベースラインに対する学習ポリシーを評価する。
- 参考スコア(独自算出の注目度): 56.47577824219207
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing threat of low-cost kamikaze drone swarms poses a critical challenge to modern defense systems demanding rapid and strategic decision-making to prioritize interceptions across multiple effectors and high-value target zones. In this work, we present a case study demonstrating the practical advantages of reinforcement learning in addressing this challenge. We introduce a high-fidelity simulation environment that captures realistic operational constraints, within which a decision-level reinforcement learning agent learns to coordinate multiple effectors for optimal interception prioritization. Operating in a discrete action space, the agent selects which drone to engage per effector based on observed state features such as positions, classes, and effector status. We evaluate the learned policy against a handcrafted rule-based baseline across hundreds of simulated attack scenarios. The reinforcement learning based policy consistently achieves lower average damage and higher defensive efficiency in protecting critical zones. This case study highlights the potential of reinforcement learning as a strategic layer within defense architectures, enhancing resilience without displacing existing control systems. All code and simulation assets are publicly released for full reproducibility, and a video demonstration illustrates the policy's qualitative behavior.
- Abstract(参考訳): 低コストのカメカゼドローン群による脅威の増大は、複数のエフェクターと高価値ターゲットゾーンを横断するインターセプションを迅速かつ戦略的に優先順位付けすることを要求する現代の防衛システムにとって、重要な課題となっている。
本稿では,この課題に対処する上で,強化学習の実践的メリットを示すケーススタディを提案する。
決定レベル強化学習エージェントが複数のエフェクタを最適インターセプション優先順位付けのために調整することを学習する、現実的な運用制約を捕捉する高忠実なシミュレーション環境を提案する。
エージェントは、位置、クラス、エフェクターステータスといった観察された状態の特徴に基づいて、エフェクターごとにどのドローンをエンゲージするかを選択する。
我々は、何百ものシミュレートされた攻撃シナリオにおいて、手作りルールベースのベースラインに対する学習ポリシーを評価する。
強化学習に基づく政策は、クリティカルゾーンを保護する上で、平均的ダメージの低減と防御効率の向上を一貫して達成する。
このケーススタディでは、防衛アーキテクチャにおける戦略層としての強化学習の可能性を強調し、既存の制御システムに取って代わらずにレジリエンスを高める。
すべてのコードとシミュレーション資産は、完全な再現性のために公開され、ビデオデモではポリシーの質的な振る舞いが示されている。
関連論文リスト
- Learned Controllers for Agile Quadrotors in Pursuit-Evasion Games [46.53041975119627]
アジャイル 1v1 四元数追跡回避のための強化学習フレームワークを提案する。
我々は、ニューラルネットワークポリシーをトレーニングし、ボディレートと集団推力を指示し、高速な追尾と回避操作を可能にします。
その結果,速度に基づく政策は速度レベルベースラインよりも捕捉速度とピーク速度を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2025-06-03T13:19:23Z) - Enhancing Aerial Combat Tactics through Hierarchical Multi-Agent Reinforcement Learning [38.15185397658309]
本研究は,模擬空戦シナリオを解析するための階層型多エージェント強化学習フレームワークを提案する。
目的は、予め設定されたシミュレーションでミッションの成功につながる効果的な行動コースを特定することである。
論文 参考訳(メタデータ) (2025-05-13T22:13:48Z) - ARBoids: Adaptive Residual Reinforcement Learning With Boids Model for Cooperative Multi-USV Target Defense [0.918715978278858]
本稿では,適応型強化学習フレームワークであるABBoidsを紹介する。
深層強化学習と、生物学的にインスパイアされた力に基づくBoidsモデルを統合する。
提案手法は高忠実度ガゼボシミュレーション環境で検証される。
論文 参考訳(メタデータ) (2025-02-25T16:05:33Z) - A Hierarchical Reinforcement Learning Framework for Multi-UAV Combat Using Leader-Follower Strategy [3.095786524987445]
マルチUAV空戦は、複数の自律型UAVを含む複雑な作業である。
以前のアプローチは、主にアクション空間を事前定義されたアクションに識別する。
本稿では,リーダ・フォロワー・マルチエージェント・プロキシ・ポリシー最適化戦略を利用した階層型フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-22T02:41:36Z) - Mutual-modality Adversarial Attack with Semantic Perturbation [81.66172089175346]
本稿では,相互モダリティ最適化スキームにおける敵攻撃を生成する新しい手法を提案する。
我々の手法は最先端の攻撃方法より優れており、プラグイン・アンド・プレイ・ソリューションとして容易にデプロイできる。
論文 参考訳(メタデータ) (2023-12-20T05:06:01Z) - Hierarchical Multi-Agent Reinforcement Learning for Air Combat
Maneuvering [40.06500618820166]
複数の異種エージェントを用いた空対空戦闘のための階層型多エージェント強化学習フレームワークを提案する。
低レベルの政策は、正確な部隊戦闘制御のために訓練される。指揮官政策は、事前訓練された低レベルの政策が与えられたミッション目標に基づいて訓練される。
論文 参考訳(メタデータ) (2023-09-20T12:16:00Z) - Approximate Shielding of Atari Agents for Safe Exploration [83.55437924143615]
遮蔽の概念に基づく安全な探索のための原理的アルゴリズムを提案する。
本稿では,我々の近似遮蔽アルゴリズムが安全違反率を効果的に低減することを示す予備的な結果を示す。
論文 参考訳(メタデータ) (2023-04-21T16:19:54Z) - Fixed Points in Cyber Space: Rethinking Optimal Evasion Attacks in the
Age of AI-NIDS [70.60975663021952]
ネットワーク分類器に対するブラックボックス攻撃について検討する。
我々は、アタッカー・ディフェンダーの固定点がそれ自体、複雑な位相遷移を持つ一般サムゲームであると主張する。
攻撃防御力学の研究には連続的な学習手法が必要であることを示す。
論文 参考訳(メタデータ) (2021-11-23T23:42:16Z) - Disturbing Reinforcement Learning Agents with Corrupted Rewards [62.997667081978825]
強化学習アルゴリズムに対する報酬の摂動に基づく異なる攻撃戦略の効果を分析します。
敵対的な報酬をスムーズに作成することは学習者を誤解させることができ、低探査確率値を使用すると、学習した政策は報酬を腐敗させるのがより堅牢であることを示しています。
論文 参考訳(メタデータ) (2021-02-12T15:53:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。