Fugu-MT 論文翻訳(概要): Deep Reinforcement Learning for Autonomous Cyber Defence: A Survey

論文の概要: Deep Reinforcement Learning for Autonomous Cyber Defence: A Survey

arxiv url: http://arxiv.org/abs/2310.07745v3
Date: Fri, 27 Sep 2024 07:26:27 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-09 10:01:09.822358
Title: Deep Reinforcement Learning for Autonomous Cyber Defence: A Survey
Title（参考訳）: 自律型サイバー防衛のための深層強化学習
Authors: Gregory Palmer, Chris Parry, Daniel J. B. Harrold, Chris Willis,
Abstract要約: 近年のサイバー攻撃の急増により、ネットワークを悪意ある行為者から守るための原則的な方法の必要性が高まっている。深層強化学習は、これらの攻撃を緩和するための有望なアプローチとして現れている。 DRLはサイバー防衛に大きな可能性を示しているが、DRLが大規模に自律的なサイバー防衛問題に適用される前には、多くの課題が克服されなければならない。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: The rapid increase in the number of cyber-attacks in recent years raises the need for principled methods for defending networks against malicious actors. Deep reinforcement learning (DRL) has emerged as a promising approach for mitigating these attacks. However, while DRL has shown much potential for cyber defence, numerous challenges must be overcome before DRL can be applied to the autonomous cyber defence (ACD) problem at scale. Principled methods are required for environments that confront learners with very high-dimensional state spaces, large multi-discrete action spaces, and adversarial learning. Recent works have reported success in solving these problems individually. There have also been impressive engineering efforts towards solving all three for real-time strategy games. However, applying DRL to the full ACD problem remains an open challenge. Here, we survey the relevant DRL literature and conceptualize an idealised ACD-DRL agent. We provide: i.) A summary of the domain properties that define the ACD problem; ii.) A comprehensive comparison of current ACD environments used for benchmarking DRL approaches; iii.) An overview of state-of-the-art approaches for scaling DRL to domains that confront learners with the curse of dimensionality, and; iv.) A survey and critique of current methods for limiting the exploitability of agents within adversarial settings from the perspective of ACD. We conclude with open research questions that we hope will motivate future directions for researchers and practitioners working on ACD.
Abstract（参考訳）: 近年のサイバー攻撃の急増により、ネットワークを悪意ある行為者から守るための原則的な方法の必要性が高まっている。深層強化学習(DRL)はこれらの攻撃を緩和するための有望なアプローチである。しかし、DRLはサイバー防衛の可能性をかなり示しているが、DRLが大規模に自律サイバー防衛(ACD)問題に適用されるまでには、多くの課題が克服されなければならない。原理的手法は,高次元状態空間,大規模多面的行動空間,対人学習など,学習者と対面する環境において必要である。最近の研究は、これらの問題を個別に解決することに成功していると報告している。また、リアルタイム戦略ゲームのために3つすべてを解決するための素晴らしいエンジニアリング努力も行われている。しかし、完全なACD問題にDRLを適用することは未解決の課題である。本稿では、DRLに関する文献を調査し、理想化されたACD-DRLエージェントを概念化する。以下に示す。 t) ACD問題を定義するドメインプロパティの要約。 4) DRLアプローチのベンチマークに用いる現在のACD環境を総合的に比較した。 DRLを学習者に対して次元性の呪いに直面する領域に拡張するための最先端アプローチの概要,および, iv。一相手方設定におけるエージェントの搾取性を制限するための現在の方法に関する調査及び批判を、ACDの観点から見よ。我々は、ACDに取り組む研究者や実践者に将来の方向性を動機付けることを願っているオープンリサーチの質問で締めくくります。

関連論文リスト

Large Language Models are Autonomous Cyber Defenders [0.1884913108327873]
自律サイバーディフェンス(ACD)は、人工知能(AI)エージェントによるインシデント対応を自動化することを目的としている。ほとんどのACDアプローチは単一エージェントシナリオにフォーカスし、強化学習(RL)を活用する。大きな言語モデル(LLM)は、一般的なセキュリティコンテキストで説明可能なアクションを提供することによって、これらの問題に対処することができる。
論文参考訳（メタデータ） (2025-05-07T22:42:37Z)
An Empirical Game-Theoretic Analysis of Autonomous Cyber-Defence Agents [0.0]
我々は、このプロセスの迅速化のために理論的に正しいポテンシャルに基づく報酬形成手法を導入し、評価する。さらに,オープンソース ACD-DRL のアプローチが増加していることを踏まえ,複数の応答オラクルを扱えるように DO の定式化を拡張した。
論文参考訳（メタデータ） (2025-01-31T15:15:02Z)
A Survey for Deep Reinforcement Learning Based Network Intrusion Detection [3.493620624883548]
本稿では,ネットワーク侵入検出における深部強化学習(DRL)の可能性と課題について考察する。 DRLモデルの性能は分析され、DRLは将来性を持っているが、近年の多くの技術は未解明のままである。この論文は、現実世界のネットワークシナリオにおけるDRLの展開とテストを強化するための推奨事項で締めくくっている。
論文参考訳（メタデータ） (2024-09-25T13:39:30Z)
A Comprehensive Survey on Inverse Constrained Reinforcement Learning: Definitions, Progress and Challenges [27.681999552782372]
逆制約強化学習(英: Inverse Constrained Reinforcement Learning, ICRL)は、暗黙の制約を推論し、その実証データから専門家エージェントが続くタスクである。本論では, ICRLの最近の進歩について分類学的に考察する。 ICRLの定義、進歩、重要な課題を理解しようとする初心者だけでなく、機械学習の研究者や実践者にとっても包括的な参照として機能する。
論文参考訳（メタデータ） (2024-09-11T18:49:03Z)
Generative AI for Deep Reinforcement Learning: Framework, Analysis, and Use Cases [60.30995339585003]
深部強化学習(DRL)は様々な分野に広く適用されており、優れた成果を上げている。 DRLは、サンプル効率の低下や一般化の低さなど、いくつかの制限に直面している。本稿では、これらの問題に対処し、DRLアルゴリズムの性能を向上させるために、生成AI(GAI)を活用する方法について述べる。
論文参考訳（メタデータ） (2024-05-31T01:25:40Z)
Toward Safe and Accelerated Deep Reinforcement Learning for Next-Generation Wireless Networks [21.618559590818236]
本稿では,DRL ベースの RRM ソリューションを開発する際に直面する2つの課題について論じる。特に,DRLアルゴリズムが示す遅延収束と性能不安定性を緩和する,安全かつ高速化されたDRLベースのRRMソリューションの必要性について論じる。
論文参考訳（メタデータ） (2022-09-16T04:50:49Z)
A Survey on Offline Reinforcement Learning: Taxonomy, Review, and Open Problems [0.0]
強化学習(RL)は、急速に人気が高まっている。高いコストと環境との相互作用の危険性のため、RLにはアクセスできない領域がまだ広い範囲にある。オフラインRLは、以前に収集されたインタラクションの静的データセットからのみ学習するパラダイムである。
論文参考訳（メタデータ） (2022-03-02T20:05:11Z)
Pessimistic Model Selection for Offline Deep Reinforcement Learning [56.282483586473816]
深層強化学習(DRL)は多くのアプリケーションにおいてシーケンシャルな意思決定問題を解決する大きな可能性を示している。主要な障壁の1つは、DRLが学んだ政策の一般化性の低下につながる過度に適合する問題である。理論的保証のあるオフラインDRLに対する悲観的モデル選択(PMS)手法を提案する。
論文参考訳（メタデータ） (2021-11-29T06:29:49Z)
URLB: Unsupervised Reinforcement Learning Benchmark [82.36060735454647]
教師なし強化学習ベンチマーク(URLB)を紹介する。 URLBは2つのフェーズで構成されている。評価のために3つのドメインから12の連続制御タスクを提供し、8つの主要な教師なしRLメソッドに対してオープンソースコードを提供する。
論文参考訳（メタデータ） (2021-10-28T15:07:01Z)
Robust Deep Reinforcement Learning through Adversarial Loss [74.20501663956604]
近年の研究では、深層強化学習剤は、エージェントの入力に対する小さな逆方向の摂動に弱いことが示されている。敵攻撃に対する堅牢性を向上した強化学習エージェントを訓練するための原則的フレームワークであるRADIAL-RLを提案する。
論文参考訳（メタデータ） (2020-08-05T07:49:42Z)
Robust Deep Reinforcement Learning against Adversarial Perturbations on State Observations [88.94162416324505]
深部強化学習(DRL)エージェントは、自然な測定誤差や対向雑音を含む観測を通して、その状態を観察する。観測は真の状態から逸脱するので、エージェントを誤解させ、準最適行動を起こすことができる。本研究は, 従来の手法を, 対人訓練などの分類タスクの堅牢性向上に応用することは, 多くのRLタスクには有効でないことを示す。
論文参考訳（メタデータ） (2020-03-19T17:59:59Z)
Challenges and Countermeasures for Adversarial Attacks on Deep Reinforcement Learning [48.49658986576776]
深層強化学習(Dep Reinforcement Learning, DRL)は、周囲の環境に適応する優れた能力のおかげで、現実世界に多くの応用がある。その大きな利点にもかかわらず、DRLは現実のクリティカルシステムやアプリケーションでの使用を妨げている敵攻撃の影響を受けやすい。本稿では,DRLベースのシステムにおける新たな攻撃と,これらの攻撃を防御するための潜在的対策について述べる。
論文参考訳（メタデータ） (2020-01-27T10:53:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。