論文の概要: Behaviour-Diverse Automatic Penetration Testing: A Curiosity-Driven
Multi-Objective Deep Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2202.10630v1
- Date: Tue, 22 Feb 2022 02:34:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-24 03:48:08.161169
- Title: Behaviour-Diverse Automatic Penetration Testing: A Curiosity-Driven
Multi-Objective Deep Reinforcement Learning Approach
- Title(参考訳): ビヘイビア・ディバース自動浸透試験:好奇心駆動型多目的深層強化学習アプローチ
- Authors: Yizhou Yang, Xin Liu
- Abstract要約: 侵入テストは、実際のアクティブな敵をエミュレートすることで、ターゲットネットワークのセキュリティを評価する上で重要な役割を果たす。
深層強化学習(Deep Reinforcement Learning)は,浸透テストのプロセスを自動化するための,有望なソリューションだと考えられている。
我々は,チェビシェフ分解批判者に対して,侵入試験における異なる目的のバランスをとる多様な敵戦略を見出すことを提案する。
- 参考スコア(独自算出の注目度): 3.5071575478443435
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Penetration Testing plays a critical role in evaluating the security of a
target network by emulating real active adversaries. Deep Reinforcement
Learning (RL) is seen as a promising solution to automating the process of
penetration tests by reducing human effort and improving reliability. Existing
RL solutions focus on finding a specific attack path to impact the target
hosts. However, in reality, a diverse range of attack variations are needed to
provide comprehensive assessments of the target network's security level.
Hence, the attack agents must consider multiple objectives when penetrating the
network. Nevertheless, this challenge is not adequately addressed in the
existing literature. To this end, we formulate the automatic penetration
testing in the Multi-Objective Reinforcement Learning (MORL) framework and
propose a Chebyshev decomposition critic to find diverse adversary strategies
that balance different objectives in the penetration test. Additionally, the
number of available actions increases with the agent consistently probing the
target network, making the training process intractable in many practical
situations. Thus, we introduce a coverage-based masking mechanism that reduces
attention on previously selected actions to help the agent adapt to future
exploration. Experimental evaluation on a range of scenarios demonstrates the
superiority of our proposed approach when compared to adapted algorithms in
terms of multi-objective learning and performance efficiency.
- Abstract(参考訳): 侵入テストは、実際のアクティブな敵をエミュレートすることで、ターゲットネットワークのセキュリティを評価する上で重要な役割を果たす。
深層強化学習(Deep Reinforcement Learning, RL)は、人的労力を削減し、信頼性を向上させることによって、侵入テストのプロセスを自動化するための有望なソリューションであると考えられている。
既存のRLソリューションでは、ターゲットホストに影響を与える特定の攻撃パスを見つけることに重点を置いている。
しかし、実際には、ターゲットネットワークのセキュリティレベルを包括的に評価するために、さまざまな攻撃のバリエーションが必要である。
したがって、攻撃エージェントはネットワークを貫通する際に複数の目的を考慮する必要がある。
しかしながら、この課題は既存の文献では十分に解決されていない。
そこで本研究では,多目的強化学習 (morl) フレームワークにおける自動浸透試験を定式化し,chebyshev分解批判法を提案する。
さらに、エージェントが常にターゲットネットワークを探索することで、利用可能なアクションの数が増加し、多くの実践的な状況でトレーニングプロセスが難解になる。
そこで,本稿では,これまで選択された行動に対する注意を減らし,エージェントが将来の探索に適応するのに役立つマスキング機構を提案する。
提案手法は,多目的学習と性能効率の観点から,適応型アルゴリズムと比較した場合,様々なシナリオに対する実験的評価が優れていることを示す。
関連論文リスト
- Multi-agent Reinforcement Learning-based Network Intrusion Detection System [3.4636217357968904]
侵入検知システム(IDS)は,コンピュータネットワークのセキュリティ確保において重要な役割を担っている。
本稿では,自動,効率的,堅牢なネットワーク侵入検出が可能な,新しいマルチエージェント強化学習(RL)アーキテクチャを提案する。
我々のソリューションは、新しい攻撃の追加に対応し、既存の攻撃パターンの変更に効果的に適応するように設計されたレジリエントなアーキテクチャを導入します。
論文 参考訳(メタデータ) (2024-07-08T09:18:59Z) - Enhancing Robotic Navigation: An Evaluation of Single and
Multi-Objective Reinforcement Learning Strategies [0.9208007322096532]
本研究では,ロボットが目的達成に向けて効果的に移動できるよう訓練するための単目的と多目的の強化学習法の比較分析を行った。
報酬関数を変更して報酬のベクターを返却し、それぞれ異なる目的に関連付けることで、ロボットはそれぞれの目標を効果的にバランスさせるポリシーを学ぶ。
論文 参考訳(メタデータ) (2023-12-13T08:00:26Z) - Adversarial Attacks and Defenses in Machine Learning-Powered Networks: A
Contemporary Survey [114.17568992164303]
機械学習とディープニューラルネットワークにおけるアドリアックと防御が注目されている。
本調査は、敵攻撃・防衛技術分野における最近の進歩を包括的に概観する。
検索ベース、意思決定ベース、ドロップベース、物理世界攻撃など、新たな攻撃方法も検討されている。
論文 参考訳(メタデータ) (2023-03-11T04:19:31Z) - Downlink Power Allocation in Massive MIMO via Deep Learning: Adversarial
Attacks and Training [62.77129284830945]
本稿では,無線環境における回帰問題を考察し,敵攻撃がDLベースのアプローチを損なう可能性があることを示す。
また,攻撃に対するDLベースの無線システムの堅牢性が著しく向上することを示す。
論文 参考訳(メタデータ) (2022-06-14T04:55:11Z) - Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation [78.17108227614928]
本研究では,水文ナビゲーションに着目した安全強化学習のためのベンチマーク環境を提案する。
価値に基づく政策段階の深層強化学習(DRL)について考察する。
また,学習したモデルの振る舞いを所望の特性の集合上で検証する検証戦略を提案する。
論文 参考訳(メタデータ) (2021-12-16T16:53:56Z) - Adversarial Machine Learning In Network Intrusion Detection Domain: A
Systematic Review [0.0]
ディープラーニングモデルは、誤った分類決定を行うためにモデルを誤解させる可能性のあるデータインスタンスに対して脆弱であることがわかった。
本調査では,ネットワーク侵入検出分野における敵機械学習のさまざまな側面を利用した研究について検討する。
論文 参考訳(メタデータ) (2021-12-06T19:10:23Z) - Deep Q-Learning based Reinforcement Learning Approach for Network
Intrusion Detection [1.7205106391379026]
本稿では,Qラーニングに基づく強化学習と,ネットワーク侵入検出のためのディープフィードフォワードニューラルネットワークを併用したネットワーク侵入検出手法を提案する。
提案するDeep Q-Learning(DQL)モデルは,ネットワーク環境に対する継続的な自動学習機能を提供する。
実験の結果,提案したDQLは,異なる侵入クラスを検出し,他の類似した機械学習手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-11-27T20:18:00Z) - Model-Agnostic Meta-Attack: Towards Reliable Evaluation of Adversarial
Robustness [53.094682754683255]
モデル非依存型メタアタック(MAMA)アプローチにより,より強力な攻撃アルゴリズムを自動検出する。
本手法は、繰り返しニューラルネットワークによってパラメータ化された逆攻撃を学習する。
本研究では,未知の防御を攻撃した場合の学習能力を向上させるために,モデルに依存しない訓練アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-13T13:54:24Z) - Increasing the Confidence of Deep Neural Networks by Coverage Analysis [71.57324258813674]
本稿では、異なる安全でない入力に対してモデルを強化するために、カバレッジパラダイムに基づく軽量な監視アーキテクチャを提案する。
実験結果から,提案手法は強力な対向例とアウト・オブ・ディストリビューション・インプットの両方を検出するのに有効であることが示唆された。
論文 参考訳(メタデータ) (2021-01-28T16:38:26Z) - Automatic Curriculum Learning through Value Disagreement [95.19299356298876]
新しい未解決タスクを継続的に解決することが、多様な行動を学ぶための鍵です。
エージェントが複数の目標を達成する必要があるマルチタスク領域では、トレーニング目標の選択はサンプル効率に大きな影響を与える可能性がある。
そこで我々は,エージェントが解決すべき目標のための自動カリキュラムを作成することを提案する。
提案手法は,13のマルチゴールロボットタスクと5つのナビゲーションタスクにまたがって評価し,現在の最先端手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2020-06-17T03:58:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。