論文の概要: Cyber Deception for Mission Surveillance via Hypergame-Theoretic Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2603.20981v1
- Date: Sat, 21 Mar 2026 23:57:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.178973
- Title: Cyber Deception for Mission Surveillance via Hypergame-Theoretic Deep Reinforcement Learning
- Title(参考訳): ハイパーゲーム理論による深層強化学習によるミッション監視のためのサイバー詐欺
- Authors: Zelin Wan, Jin-Hee Cho, Mu Zhu, Ahmed H. Anwar, Charles Kamhoua, Munindar P. Singh,
- Abstract要約: 無人航空機(UAV)は、監視、救助、輸送といったミッションクリティカルなシステムに有用である。
我々はサイバー詐欺を防衛戦略として採用し、ハニードローン(HD)が攻撃の餌食として提案される。
攻撃者および守備者に対して、エネルギー消費を最小化しつつ、ミッション性能を最大化するための各戦略を特定するための最適化問題を定式化する。
我々は,HT-DRLと呼ばれる新しい手法を提案する。HT-DRLは,ハイパーゲーム理論の解を深層強化学習のニューラルネットワークに取り入れることで,長い学習収束時間なしで最適な解を同定する。
- 参考スコア(独自算出の注目度): 12.065011969160587
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unmanned Aerial Vehicles (UAVs) are valuable for mission-critical systems like surveillance, rescue, or delivery. Not surprisingly, such systems attract cyberattacks, including Denial-of-Service (DoS) attacks to overwhelm the resources of mission drones (MDs). How can we defend UAV mission systems against DoS attacks? We adopt cyber deception as a defense strategy, in which honey drones (HDs) are proposed to bait and divert attacks. The attack and deceptive defense hinge upon radio signal strength: The attacker selects victim MDs based on their signals, and HDs attract the attacker from afar by emitting stronger signals, despite this reducing battery life. We formulate an optimization problem for the attacker and defender to identify their respective strategies for maximizing mission performance while minimizing energy consumption. To address this problem, we propose a novel approach, called HT-DRL. HT-DRL identifies optimal solutions without a long learning convergence time by taking the solutions of hypergame theory into the neural network of deep reinforcement learning. This achieves a systematic way to intelligently deceive attackers. We analyze the performance of diverse defense mechanisms under different attack strategies. Further, the HT-DRL-based HD approach outperforms existing non-HD counterparts up to two times better in mission performance while incurring low energy consumption.
- Abstract(参考訳): 無人航空機(UAV)は、監視、救助、輸送といったミッションクリティカルなシステムに有用である。
当然のことながら、こうしたシステムはDenial-of-Service(DoS)攻撃を含むサイバー攻撃を招き、ミッションドローン(MD)の資源を圧倒する。
DoS攻撃からUAVミッションシステムを守るには?
我々はサイバー詐欺を防衛戦略として採用し、ハニードローン(HD)が攻撃の餌食として提案される。
攻撃者は、その信号に基づいて被害者のMDを選択し、HDは、バッテリー寿命を減らしたにもかかわらず、強力な信号を出力することで攻撃者を遠方から惹きつける。
攻撃者および守備者に対して、エネルギー消費を最小化しつつ、ミッション性能を最大化するための各戦略を特定するための最適化問題を定式化する。
この問題に対処するため,HT-DRLと呼ばれる新しい手法を提案する。
HT-DRLは、ハイパーゲーム理論の解を深層強化学習のニューラルネットワークに取り入れることで、長い学習収束時間なしで最適な解を特定する。
これにより、攻撃者を知的に欺く体系的な方法が達成される。
本研究では,異なる攻撃戦略下での多種多様な防御機構の性能解析を行う。
さらに,HT-DRLをベースとしたHDアプローチでは,ミッション性能が最大2倍向上し,低消費電力化を実現している。
関連論文リスト
- The Attacker Moves Second: Stronger Adaptive Attacks Bypass Defenses Against Llm Jailbreaks and Prompt Injections [74.60337113759313]
現在のジェイルブレイクとプロンプトインジェクションに対する防御は、通常、有害な攻撃文字列の静的セットに対して評価される。
我々は,この評価プロセスに欠陥があることを論じる。代わりに,攻撃戦略を明示的に修正したアダプティブアタッカーに対する防御を,防衛設計に対抗して評価すべきである。
論文 参考訳(メタデータ) (2025-10-10T05:51:04Z) - RL Is a Hammer and LLMs Are Nails: A Simple Reinforcement Learning Recipe for Strong Prompt Injection [82.41836544860833]
RL-Hammerは、攻撃モデルを訓練するためのシンプルなレシピで、強力なプロンプトインジェクションを実行するために自動的に学習する。
我々は,高度に効果的で普遍的な攻撃を可能にする実用的手法のセットを提案する。
RL-Hammerは、GPT-4oに対して98%のASR、GPT-5に対して72%のASRに達した。
論文 参考訳(メタデータ) (2025-10-06T15:06:04Z) - From Static to Adaptive Defense: Federated Multi-Agent Deep Reinforcement Learning-Driven Moving Target Defense Against DoS Attacks in UAV Swarm Networks [23.908450903174725]
UAV群における能動的DoS緩和のための新しい枠組みを提案する。
我々は、リーダースイッチング、ルート突然変異、周波数ホッピングを含む軽量かつ協調的なMTD機構を設計する。
我々のアプローチは最先端のベースラインを大きく上回っている。
論文 参考訳(メタデータ) (2025-06-09T03:33:04Z) - Optimal Attack and Defense for Reinforcement Learning [11.36770403327493]
敵RLでは、外部攻撃者は、環境との相互作用を操作できる。
我々は、攻撃者が予想される報酬を最大化するステルス攻撃を設計する際の問題を示す。
被害者に対する最適な防衛方針は,Stackelbergゲームに対する解決策として計算できる,と我々は主張する。
論文 参考訳(メタデータ) (2023-11-30T21:21:47Z) - Fixed Points in Cyber Space: Rethinking Optimal Evasion Attacks in the
Age of AI-NIDS [70.60975663021952]
ネットワーク分類器に対するブラックボックス攻撃について検討する。
我々は、アタッカー・ディフェンダーの固定点がそれ自体、複雑な位相遷移を持つ一般サムゲームであると主張する。
攻撃防御力学の研究には連続的な学習手法が必要であることを示す。
論文 参考訳(メタデータ) (2021-11-23T23:42:16Z) - Improving Robustness of Reinforcement Learning for Power System Control
with Adversarial Training [71.7750435554693]
電力系統制御のために提案された最先端のRLエージェントが敵攻撃に対して脆弱であることを示す。
具体的には、敵のマルコフ決定プロセスを用いて攻撃方針を学習し、攻撃の有効性を実証する。
本稿では,RLエージェントの攻撃に対する堅牢性を高め,実行不可能な運用上の決定を回避するために,敵の訓練を利用することを提案する。
論文 参考訳(メタデータ) (2021-10-18T00:50:34Z) - Challenges and Countermeasures for Adversarial Attacks on Deep
Reinforcement Learning [48.49658986576776]
深層強化学習(Dep Reinforcement Learning, DRL)は、周囲の環境に適応する優れた能力のおかげで、現実世界に多くの応用がある。
その大きな利点にもかかわらず、DRLは現実のクリティカルシステムやアプリケーションでの使用を妨げている敵攻撃の影響を受けやすい。
本稿では,DRLベースのシステムにおける新たな攻撃と,これらの攻撃を防御するための潜在的対策について述べる。
論文 参考訳(メタデータ) (2020-01-27T10:53:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。