論文の概要: Belief-Space Quantum-Inspired Reinforcement Learning for Partially Observable Autonomous Cyber Defense in the Internet of Vehicles
- arxiv url: http://arxiv.org/abs/2606.07796v1
- Date: Fri, 05 Jun 2026 19:20:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.397185
- Title: Belief-Space Quantum-Inspired Reinforcement Learning for Partially Observable Autonomous Cyber Defense in the Internet of Vehicles
- Title(参考訳): 車両インターネットにおける部分観測型自律サイバーディフェンスのための空間量子インスパイアされた強化学習
- Authors: Anwar Shah, Rohan Farooq, Sajid Anwer, Tallha Akram, Usman Ghous, Sajid Ullah Khan,
- Abstract要約: Internet of Vehicles (IoV)は、攻撃者が防御に適応する動的で敵対的なセキュリティ環境に直面している。
我々は、IoVセキュリティをシーケンシャルアタック-ディフェンダー相互作用として定式化し、部分観測可能性下での強化学習問題としてモデルディフェンスを定式化する。
本稿では,量子インスパイアされた信念表現を用いたQ-BIRD(Quantum Belief-Integrated Reinforcement Defense)を提案する。
- 参考スコア(独自算出の注目度): 1.1411682827396572
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Internet of Vehicles (IoV) faces a dynamic, adversarial security environment where attackers adapt to defenses. Existing intrusion detection systems rely on static classifiers that fail to capture sequential decision-making, attacker adaptation, and uncertainty. We formulate IoV security as a sequential attacker-defender interaction and model defense as a reinforcement learning problem under partial observability. We propose Quantum Belief-Integrated Reinforcement Defense (Q-BIRD), using quantum-inspired belief representation to encode defender uncertainty about hidden attacker intent via amplitude-based states, enabling non-Bayesian belief evolution. Integrated into a Proximal Policy Optimization (PPO) defender, Q-BIRD selects cost-aware mitigation actions. In simulated environments with adaptive, probing attackers, Q-BIRD reduced cumulative mean damage, damage variance, and attack success rate (ASR) by 60.4%, 90.2%, and 50.0%, respectively, while increasing survival probability by 46.4%. Compared to classical Bayesian PPO, damage variance reduction and ASR improved by 10.2 times and 50%. Ablation and explainability analyses confirm that amplitude-based belief is the primary decision signal during strategy transitions when classical belief collapses, providing superior IoV security without additional hardware.
- Abstract(参考訳): 車両のインターネット(IoV)は、攻撃者が防御に適応する動的で敵対的なセキュリティ環境に直面している。
既存の侵入検知システムは、シーケンシャルな意思決定、アタック適応、不確実性を捕捉できない静的な分類器に依存している。
我々は、IoVセキュリティをシーケンシャルアタック-ディフェンダー相互作用として定式化し、部分観測可能性下での強化学習問題としてモデルディフェンスを定式化する。
本稿では,Q-BIRD(Quantum Belief-Integrated Reinforcement Defense)を提案する。
PPO(Proximal Policy Optimization)ディフェンダーに統合されたQ-BIRDは、コストを意識した緩和アクションを選択する。
適応的、調査的な攻撃者によるシミュレーション環境では、Q-BIRDは累積平均損傷、損傷分散、攻撃成功率(ASR)をそれぞれ60.4%、90.2%、および50.0%削減し、生存確率は46.4%向上した。
古典的ベイズPPOと比較して、損傷分散とASRは10.2倍50%改善した。
アブレーションと説明可能性分析により、振幅に基づく信念が古典的信念が崩壊する際の戦略移行における主要な決定信号であり、追加ハードウェアなしで優れたIoVセキュリティを提供することを確認した。
関連論文リスト
- Adaptive Defense Orchestration for RAG: A Sentinel-Strategist Architecture against Multi-Vector Attacks [0.0]
検索強化世代システムは、医療や法律などの機密性の高い領域にますます展開されている。
この機能は、メンバシップ推論、データ中毒、意図しないコンテンツのリークなど、重大なセキュリティリスクをもたらす。
本稿では,リスク分析と防衛選択のためのコンテキスト認識フレームワークであるSentinel-Strategistアーキテクチャを提案する。
論文 参考訳(メタデータ) (2026-04-22T11:17:10Z) - Cybersecurity AI: Evaluating Agentic Cybersecurity in Attack/Defense CTFs [3.6968315805917897]
我々は、サイバーセキュリティにおける攻撃や防御にAIシステムがより効果的であるかどうかを評価する。
統計分析によると、防御剤は54.3%の制約のないパッチング成功を達成している。
発見は、ディフェンダーがオープンソースのCybersecurity AIフレームワークを採用する緊急性を強調している。
論文 参考訳(メタデータ) (2025-10-20T13:21:09Z) - MISLEADER: Defending against Model Extraction with Ensembles of Distilled Models [56.09354775405601]
モデル抽出攻撃は、クエリアクセスを通じてブラックボックスモデルの機能を複製することを目的としている。
既存のディフェンスでは、アタッカークエリにはオフ・オブ・ディストリビューション(OOD)サンプルがあることを前提としており、不審な入力を検出し破壊することができる。
OOD仮定に依存しない新しい防衛戦略であるMISLEADERを提案する。
論文 参考訳(メタデータ) (2025-06-03T01:37:09Z) - AegisLLM: Scaling Agentic Systems for Self-Reflective Defense in LLM Security [74.22452069013289]
AegisLLMは、敵の攻撃や情報漏洩に対する協調的なマルチエージェント防御である。
テスト時のエージェント推論システムのスケーリングは,モデルの有用性を損なうことなく,ロバスト性を大幅に向上させることを示す。
アンラーニングやジェイルブレイクを含む主要な脅威シナリオに対する総合的な評価は、AegisLLMの有効性を示している。
論文 参考訳(メタデータ) (2025-04-29T17:36:05Z) - The Adaptive Arms Race: Redefining Robustness in AI Security [21.759075171536388]
我々は,ブラックボックス攻撃と防御を適応的に最適化するフレームワークを,彼らが形成する競争ゲームの下で導入する。
システム応答を動的に制御するアクティブディフェンスは、決定に基づく攻撃に対するモデル強化に不可欠である。
我々の発見は、広範囲な理論的および実証的な調査によって裏付けられ、適応的敵がブラックボックスAIベースのシステムに深刻な脅威をもたらすことを確認した。
論文 参考訳(メタデータ) (2023-12-20T21:24:52Z) - Fixed Points in Cyber Space: Rethinking Optimal Evasion Attacks in the
Age of AI-NIDS [70.60975663021952]
ネットワーク分類器に対するブラックボックス攻撃について検討する。
我々は、アタッカー・ディフェンダーの固定点がそれ自体、複雑な位相遷移を持つ一般サムゲームであると主張する。
攻撃防御力学の研究には連続的な学習手法が必要であることを示す。
論文 参考訳(メタデータ) (2021-11-23T23:42:16Z) - The Feasibility and Inevitability of Stealth Attacks [63.14766152741211]
我々は、攻撃者が汎用人工知能システムにおける決定を制御できる新しい敵の摂動について研究する。
敵対的なデータ修正とは対照的に、ここで考慮する攻撃メカニズムには、AIシステム自体の変更が含まれる。
論文 参考訳(メタデータ) (2021-06-26T10:50:07Z) - Policy Smoothing for Provably Robust Reinforcement Learning [109.90239627115336]
入力のノルム有界対向摂動に対する強化学習の証明可能な堅牢性について検討する。
我々は、スムーズなポリシーによって得られる全報酬が、入力の摂動のノルムバウンドな逆数の下で一定の閾値以下に収まらないことを保証した証明書を生成する。
論文 参考訳(メタデータ) (2021-06-21T21:42:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。