論文の概要: Towards a Generalisable Cyber Defence Agent for Real-World Computer Networks
- arxiv url: http://arxiv.org/abs/2511.09114v1
- Date: Thu, 13 Nov 2025 01:32:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.415086
- Title: Towards a Generalisable Cyber Defence Agent for Real-World Computer Networks
- Title(参考訳): リアルワールドコンピュータネットワークのための汎用サイバー防御エージェントを目指して
- Authors: Tim Dudman, Martyn Bull,
- Abstract要約: 本研究では,Topological Extensions for Reinforcement Learning Agents (TERLA)を紹介する。
TERLAは、トポロジとサイズが異なるネットワークの防衛において、再訓練を必要とせず、汎用性を提供する。
汎用性は、すべてのTERLAエージェントが同じネットワークに依存しないニューラルネットワークアーキテクチャを持っていることを示すことで実証されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in deep reinforcement learning for autonomous cyber defence have resulted in agents that can successfully defend simulated computer networks against cyber-attacks. However, many of these agents would need retraining to defend networks with differing topology or size, making them poorly suited to real-world networks where topology and size can vary over time. In this research we introduce a novel set of Topological Extensions for Reinforcement Learning Agents (TERLA) that provide generalisability for the defence of networks with differing topology and size, without the need for retraining. Our approach involves the use of heterogeneous graph neural network layers to produce a fixed-size latent embedding representing the observed network state. This representation learning stage is coupled with a reduced, fixed-size, semantically meaningful and interpretable action space. We apply TERLA to a standard deep reinforcement learning Proximal Policy Optimisation (PPO) agent model, and to reduce the sim-to-real gap, conduct our research using Cyber Autonomy Gym for Experimentation (CAGE) Challenge 4. This Cyber Operations Research Gym environment has many of the features of a real-world network, such as realistic Intrusion Detection System (IDS) events and multiple agents defending network segments of differing topology and size. TERLA agents retain the defensive performance of vanilla PPO agents whilst showing improved action efficiency. Generalisability has been demonstrated by showing that all TERLA agents have the same network-agnostic neural network architecture, and by deploying a single TERLA agent multiple times to defend network segments with differing topology and size, showing improved defensive performance and efficiency.
- Abstract(参考訳): 自律型サイバー防御のための深層強化学習の最近の進歩は、シミュレーションされたコンピュータネットワークをサイバー攻撃から防衛できるエージェントを生み出している。
しかし、これらのエージェントの多くは、トポロジやサイズが異なるネットワークを防衛するために再訓練する必要があるため、トポロジやサイズが異なる実世界のネットワークには適さない。
本研究では,ネットワークのトポロジとサイズが異なる場合,再トレーニングを必要とせず,ネットワークの防御に汎用性を提供する,強化学習エージェントのためのトポロジ的拡張セット(TERLA)を提案する。
我々のアプローチでは、観測されたネットワーク状態を表す固定サイズの潜伏埋め込みを生成するために、異種グラフニューラルネットワーク層を用いる。
この表現学習段階は、縮小、固定サイズ、意味論的、解釈可能な行動空間と結合する。
TERLAをPPOエージェントモデルに適用し、シミュレーションと現実のギャップを減らすために、CAGE(Cyber Autonomy Gym for Experimentation) Challenge 4を用いて研究を行っている。
このCyber Operations Research Gym環境は、現実的な侵入検知システム(IDS)イベントや、異なるトポロジと大きさのネットワークセグメントを保護する複数のエージェントなど、現実世界のネットワークの多くの特徴を持っている。
TERLA剤はバニラPPO剤の防御性能を保ちながら、作用効率は向上した。
汎用性は、すべてのTERLAエージェントが同じネットワーク非依存のニューラルネットワークアーキテクチャを持つことを示すとともに、異なるトポロジとサイズでネットワークセグメントを保護するために単一のTERLAエージェントを複数回デプロイすることで、防御性能と効率が向上することを示した。
関連論文リスト
- Exploiting Edge Features for Transferable Adversarial Attacks in Distributed Machine Learning [54.26807397329468]
この研究は、分散ディープラーニングシステムにおいて、これまで見過ごされていた脆弱性を探究する。
中間的特徴をインターセプトする敵は、依然として深刻な脅威となる可能性がある。
本稿では,分散環境に特化して設計されたエクスプロイト戦略を提案する。
論文 参考訳(メタデータ) (2025-07-09T20:09:00Z) - Network Sparsity Unlocks the Scaling Potential of Deep Reinforcement Learning [57.3885832382455]
静的ネットワークの疎結合を単独で導入することで,最先端アーキテクチャの高密度化を超えて,さらなるスケーリング可能性を実現することができることを示す。
解析の結果,高密度DRLネットワークをネーティブにスケールアップするのとは対照的に,疎ネットワークは高いパラメータ効率とネットワーク表現性を両立させることがわかった。
論文 参考訳(メタデータ) (2025-06-20T17:54:24Z) - An Attentive Graph Agent for Topology-Adaptive Cyber Defence [1.0812794909131096]
我々は,ネットワーク状態を有向グラフとして符号化するCyber Operations Research Gym(CybORG)環境のカスタムバージョンを開発する。
我々は、ノード、エッジ、グローバル機能を処理するために、グラフ注意ネットワーク(GAT)アーキテクチャを使用し、その出力を強化学習におけるポリシー勾配手法と互換性に適応させる。
我々は,シミュレーション中に予期せぬ接続が発生した場合でも,低レベル指向グラフ観測を用いてGAT防御ポリシーを訓練できることを実証した。
論文 参考訳(メタデータ) (2025-01-24T18:22:37Z) - Entity-based Reinforcement Learning for Autonomous Cyber Defence [0.22499166814992438]
自律的なサイバー防衛の鍵となる課題は、防御エージェントが様々なネットワークトポロジや構成をまたいで一般化する能力を確保することである。
深層強化学習への標準的アプローチは、一定の大きさの観測と行動空間を期待する。
自律型サイバー防衛では、訓練対象と異なるネットワークトポロジを持つ環境に一般化するエージェントを開発することが困難になる。
論文 参考訳(メタデータ) (2024-10-23T08:04:12Z) - Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [86.99017195607077]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Graph Neural Networks for Decentralized Multi-Agent Perimeter Defense [111.9039128130633]
我々は,防御者の地域認識とコミュニケーショングラフから行動へのマッピングを学習する模倣学習フレームワークを開発した。
学習ネットワークの性能を実証するために、異なるチームサイズと構成のシナリオで周辺防衛ゲームを実行します。
論文 参考訳(メタデータ) (2023-01-23T19:35:59Z) - Learn2Perturb: an End-to-end Feature Perturbation Learning to Improve
Adversarial Robustness [79.47619798416194]
Learn2Perturbは、ディープニューラルネットワークの対角的堅牢性を改善するために、エンドツーエンドの機能摂動学習アプローチである。
予測最大化にインスパイアされ、ネットワークと雑音パラメータを連続的にトレーニングするために、交互にバックプロパゲーショントレーニングアルゴリズムが導入された。
論文 参考訳(メタデータ) (2020-03-02T18:27:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。