論文の概要: Learning Red Agent Policy from Observations for Neurosymbolic Autonomous Cyber Agents
- arxiv url: http://arxiv.org/abs/2606.18223v1
- Date: Tue, 16 Jun 2026 17:50:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.589494
- Title: Learning Red Agent Policy from Observations for Neurosymbolic Autonomous Cyber Agents
- Title(参考訳): ニューロシンボリックな自律型サイバーエージェントの観察からレッドエージェントポリシーを学ぶ
- Authors: Ankita Samaddar, Sandeep Neema, Daniel Balasubramanian, Xenofon Koutsoukos,
- Abstract要約: 現代のネットワークは、強化学習(RL)を通じて訓練されたインテリジェントなサイバー防御エージェントを必要とする
本稿では、模倣学習を用いたポリシー学習手法を提案し、離散状態と離散動作を持つ部分観測可能なRLエージェントのポリシーを学習する。
我々は,この手法を自律型サイバー環境に適用し,ネットワーク観測とディフェンダー行動からレッドエージェントの行動を予測する。
- 参考スコア(独自算出の注目度): 0.0761187029699472
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With sophisticated cyber-attacks becoming increasingly prevalent, modern networks require intelligent autonomous cyber-defense agents trained via Reinforcement Learning (RL). These agents employ neurosymbolic approaches such as behavior trees with learning-enabled components (LECs) to learn, reason, adapt, and implement security rules while maintaining critical operations. However, these autonomous networks are partially observable systems, i.e., the cyber-attacker's (red agent's) actions are not observable, making it difficult for the defender to predict red actions, learn red policies, or assess the attacker's intrusion levels. To address this, we propose a Policy Learning Technique using imitation learning to learn policies for partially observable RL agents with discrete states and discrete actions. We apply this technique in an autonomous cyber environment to predict red agent's actions from network observations and defender actions. Integrated with a neurosymbolic cyber-defense agent, our method effectively handles different red policies and achieves high prediction accuracy across diverse simulated scenarios.
- Abstract(参考訳): 高度なサイバー攻撃がますます普及するにつれて、現代のネットワークは、強化学習(RL)を通じて訓練されたインテリジェントな自律サイバー防御エージェントを必要とする。
これらのエージェントは、学習可能なコンポーネント(LEC)を備えた行動木のような神経象徴的なアプローチを使用して、重要な操作を維持しながら、学習、推論、適応、セキュリティルールの実装を行う。
しかしながら、これらの自律ネットワークは部分的に監視可能なシステムであり、サイバー攻撃者の(レッドエージェントの)アクションは監視できないため、防御者がレッドアクションを予測したり、レッドポリシーを学習したり、攻撃者の侵入レベルを評価することは困難である。
そこで本研究では、模倣学習を用いたポリシー学習手法を提案し、離散状態と離散動作を持つ部分観測可能なRLエージェントのポリシーを学習する。
我々は,この手法を自律型サイバー環境に適用し,ネットワーク観測とディフェンダー行動からレッドエージェントの行動を予測する。
本手法はニューロシンボリックサイバー防御剤と統合され,様々なレッドポリシーを効果的に処理し,多様なシミュレーションシナリオで高い予測精度を実現する。
関連論文リスト
- Towards a Multi-Agent Simulation of Cyber-attackers and Cyber-defenders Battles [0.0]
本稿では,ホストネットワークノード上に展開するサイバー攻撃エージェントとサイバー防御エージェントのシミュレーションによるマルコフモデルと実装について述べる。
現実的にコーディネートされたサイバー攻撃シナリオを実装するための実験的なフレームワークを提供することを目標としている。
論文 参考訳(メタデータ) (2025-06-05T10:17:17Z) - Out-of-Distribution Detection for Neurosymbolic Autonomous Cyber Agents [0.0]
本研究では,確率的ニューラルネットワーク(PNN)を用いて異常状況を検出するOODモニタリングアルゴリズムを開発した。
我々は,OODモニタリングアルゴリズムを,学習可能なコンポーネントを用いた行動木を用いたニューロシンボリックな自律サイバーエージェントと統合する。
論文 参考訳(メタデータ) (2024-12-03T22:20:52Z) - Designing Robust Cyber-Defense Agents with Evolving Behavior Trees [0.0]
本研究では,学習可能なコンポーネントを用いた行動木を用いた自律型サイバー防御エージェントの設計手法を開発する。
学習可能なコンポーネントは、様々なサイバー攻撃に適応し、セキュリティメカニズムをデプロイするために最適化されている。
EBTをベースとしたエージェントは、適応型サイバー攻撃に対して堅牢であり、その決定と行動の解釈に高レベルな説明を提供する。
論文 参考訳(メタデータ) (2024-10-21T18:00:38Z) - Multi-Agent Actor-Critics in Autonomous Cyber Defense [0.5261718469769447]
マルチエージェントディープ強化学習(MADRL)は、自律型サイバーオペレーションの有効性とレジリエンスを高めるための有望なアプローチである。
シミュレーションサイバー攻撃シナリオにおいて,各エージェントが迅速に学習し,MADRLを用いて自律的に脅威に対処できることを実証する。
論文 参考訳(メタデータ) (2024-10-11T15:15:09Z) - Investigating Human-Identifiable Features Hidden in Adversarial
Perturbations [54.39726653562144]
我々の研究では、最大5つの攻撃アルゴリズムを3つのデータセットにわたって探索する。
対人摂動における人間の識別可能な特徴を同定する。
画素レベルのアノテーションを用いて、そのような特徴を抽出し、ターゲットモデルに妥協する能力を実証する。
論文 参考訳(メタデータ) (2023-09-28T22:31:29Z) - Fixed Points in Cyber Space: Rethinking Optimal Evasion Attacks in the
Age of AI-NIDS [70.60975663021952]
ネットワーク分類器に対するブラックボックス攻撃について検討する。
我々は、アタッカー・ディフェンダーの固定点がそれ自体、複雑な位相遷移を持つ一般サムゲームであると主張する。
攻撃防御力学の研究には連続的な学習手法が必要であることを示す。
論文 参考訳(メタデータ) (2021-11-23T23:42:16Z) - Autonomous Attack Mitigation for Industrial Control Systems [25.894883701063055]
サイバー攻撃からコンピュータネットワークを守るには、警告や脅威情報に対するタイムリーな対応が必要である。
本稿では,大規模産業制御ネットワークにおける自律応答と回復に対する深層強化学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-03T18:08:06Z) - Automating Privilege Escalation with Deep Reinforcement Learning [71.87228372303453]
本研究では,エージェントの訓練に深層強化学習を用いることで,悪意あるアクターの潜在的な脅威を実証する。
本稿では,最先端の強化学習アルゴリズムを用いて,局所的な特権エスカレーションを行うエージェントを提案する。
我々のエージェントは、実際の攻撃センサーデータを生成し、侵入検知システムの訓練と評価に利用できる。
論文 参考訳(メタデータ) (2021-10-04T12:20:46Z) - The Feasibility and Inevitability of Stealth Attacks [63.14766152741211]
我々は、攻撃者が汎用人工知能システムにおける決定を制御できる新しい敵の摂動について研究する。
敵対的なデータ修正とは対照的に、ここで考慮する攻撃メカニズムには、AIシステム自体の変更が含まれる。
論文 参考訳(メタデータ) (2021-06-26T10:50:07Z) - Adversarial Machine Learning Attacks and Defense Methods in the Cyber
Security Domain [58.30296637276011]
本稿では,機械学習技術に基づくセキュリティソリューションに対する敵攻撃に関する最新の研究を要約する。
サイバーセキュリティドメインでエンドツーエンドの敵攻撃を実装するという、ユニークな課題を議論するのは、これが初めてである。
論文 参考訳(メタデータ) (2020-07-05T18:22:40Z) - Adversarial vs behavioural-based defensive AI with joint, continual and
active learning: automated evaluation of robustness to deception, poisoning
and concept drift [62.997667081978825]
人工知能(AI)の最近の進歩は、サイバーセキュリティのための行動分析(UEBA)に新たな能力をもたらした。
本稿では、検出プロセスを改善し、人間の専門知識を効果的に活用することにより、この攻撃を効果的に軽減するソリューションを提案する。
論文 参考訳(メタデータ) (2020-01-13T13:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。