論文の概要: Exposing Surveillance Detection Routes via Reinforcement Learning,
Attack Graphs, and Cyber Terrain
- arxiv url: http://arxiv.org/abs/2211.03027v1
- Date: Sun, 6 Nov 2022 05:05:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 19:17:08.975260
- Title: Exposing Surveillance Detection Routes via Reinforcement Learning,
Attack Graphs, and Cyber Terrain
- Title(参考訳): 強化学習, 攻撃グラフ, サイバー地形によるサーベイランス検出経路の抽出
- Authors: Lanxiao Huang, Tyler Cody, Christopher Redino, Abdul Rahman, Akshay
Kakkar, Deepak Kushwaha, Cheng Wang, Ryan Clark, Daniel Radke, Peter Beling,
Edward Bowen
- Abstract要約: この作業は、リスク回避を図りながらネットワークサービスの探索に重点を置くSDRの構築に重点を置いている。
RLアルゴリズムは、ネットワークのどの領域が安全に探索できるかを初期探索で決定する、新しいウォームアップフェーズを持つように修正されている。
- 参考スコア(独自算出の注目度): 6.0943983217923945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning (RL) operating on attack graphs leveraging cyber
terrain principles are used to develop reward and state associated with
determination of surveillance detection routes (SDR). This work extends
previous efforts on developing RL methods for path analysis within enterprise
networks. This work focuses on building SDR where the routes focus on exploring
the network services while trying to evade risk. RL is utilized to support the
development of these routes by building a reward mechanism that would help in
realization of these paths. The RL algorithm is modified to have a novel
warm-up phase which decides in the initial exploration which areas of the
network are safe to explore based on the rewards and penalty scale factor.
- Abstract(参考訳): サイバー地形原理を利用した攻撃グラフを用いた強化学習(RL)は、監視検出経路(SDR)の決定に関連する報酬と状態を開発するために用いられる。
本研究は,企業ネットワークにおける経路解析のためのRL手法開発への取り組みを拡大する。
この作業は、リスクを避けながらネットワークサービスの探索に重点を置くSDRの構築に焦点を当てている。
RLは、これらの経路の実現に役立つ報酬メカニズムを構築することで、これらの経路の開発を支援するために利用される。
RLアルゴリズムは、報酬とペナルティスケール係数に基づいて、ネットワークのどの領域が安全に探索できるかを初期探索で決定する新しいウォームアップフェーズを持つように修正される。
関連論文リスト
- A Survey for Deep Reinforcement Learning Based Network Intrusion Detection [3.493620624883548]
本稿では,ネットワーク侵入検出における深部強化学習(DRL)の可能性と課題について考察する。
DRLモデルの性能は分析され、DRLは将来性を持っているが、近年の多くの技術は未解明のままである。
この論文は、現実世界のネットワークシナリオにおけるDRLの展開とテストを強化するための推奨事項で締めくくっている。
論文 参考訳(メタデータ) (2024-09-25T13:39:30Z) - Random Latent Exploration for Deep Reinforcement Learning [71.88709402926415]
本稿ではRLE(Random Latent Exploration)と呼ばれる新しい探査手法を紹介する。
RLEはボーナスベースとノイズベース(ディープRLを効果的に探索するための2つの一般的なアプローチ)の強みを組み合わせたものである。
AtariとIsaacGymのベンチマークで評価し、RLEは他の手法よりも全タスクの総合スコアが高いことを示した。
論文 参考訳(メタデータ) (2024-07-18T17:55:22Z) - Multi-Agent Deep Reinforcement Learning for Distributed Satellite
Routing [7.793857269225969]
本稿では、低軌道衛星コンステレーション(LSatC)におけるルーティングのためのマルチエージェント深部強化学習(MA-DRL)手法を提案する。
その結果,MA-DRLはオフラインで最適な経路を効率よく学習し,効率の良い分散ルーティングのためにロードすることがわかった。
論文 参考訳(メタデータ) (2024-02-27T16:36:53Z) - Box-based Refinement for Weakly Supervised and Unsupervised Localization
Tasks [57.70351255180495]
我々は、画像データの代わりにネットワーク出力の上の検出器を訓練し、適切な損失バックプロパゲーションを適用する。
本研究は,課題の見地に対するフレーズ接頭辞の大幅な改善を明らかにした。
論文 参考訳(メタデータ) (2023-09-07T17:36:02Z) - When does return-conditioned supervised learning work for offline
reinforcement learning? [51.899892382786526]
本研究では,リターン条件付き教師あり学習の能力と限界について検討する。
RCSLは、より伝統的な動的プログラミングベースのアルゴリズムに必要なものよりも強い仮定のセットで最適なポリシーを返す。
論文 参考訳(メタデータ) (2022-06-02T15:05:42Z) - Discovering Exfiltration Paths Using Reinforcement Learning with Attack
Graphs [0.3431096786139342]
この研究は、最適経路を計算するという目標に焦点をあてた、以前のクラウンジュエリー(CJ)識別に基づいている。
その結果,大規模ネットワーク環境における有望な性能が示された。
論文 参考訳(メタデータ) (2022-01-28T21:01:06Z) - Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation [78.17108227614928]
本研究では,水文ナビゲーションに着目した安全強化学習のためのベンチマーク環境を提案する。
価値に基づく政策段階の深層強化学習(DRL)について考察する。
また,学習したモデルの振る舞いを所望の特性の集合上で検証する検証戦略を提案する。
論文 参考訳(メタデータ) (2021-12-16T16:53:56Z) - Reinforcement Learning for Datacenter Congestion Control [50.225885814524304]
渋滞制御アルゴリズムの成功は、レイテンシとネットワーク全体のスループットを劇的に改善する。
今日まで、このような学習ベースのアルゴリズムはこの領域で実用的な可能性を示さなかった。
実世界のデータセンターネットワークの様々な構成に一般化することを目的としたRLに基づくアルゴリズムを考案する。
本稿では,この手法が他のRL手法よりも優れており,トレーニング中に見られなかったシナリオに一般化可能であることを示す。
論文 参考訳(メタデータ) (2021-02-18T13:49:28Z) - Reannealing of Decaying Exploration Based On Heuristic Measure in Deep
Q-Network [82.20059754270302]
本稿では,再熱処理の概念に基づくアルゴリズムを提案し,必要なときにのみ探索を促進することを目的とする。
我々は、訓練を加速し、より良い政策を得る可能性を示す実証的なケーススタディを実施している。
論文 参考訳(メタデータ) (2020-09-29T20:40:00Z) - Towards Cognitive Routing based on Deep Reinforcement Learning [17.637357380527583]
本稿では,Deep Reinforcement Learning(DRL)に基づく認知的ルーティングの定義と実装アプローチを提案する。
DRLに基づく認知ルーティングの研究を容易にするために,DRLに基づくルーティングアルゴリズムの開発とシミュレーションのためのシミュレータRL4Netを導入する。
実例ネットワークトポロジのシミュレーション結果から,DDPGに基づくルーティングアルゴリズムはOSPFやランダムウェイトアルゴリズムよりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2020-03-19T03:32:43Z) - Vehicle Tracking in Wireless Sensor Networks via Deep Reinforcement
Learning [15.252556567830215]
追跡精度と省エネの両方を改善するために、分散車両追跡戦略が考案されている。
活性化領域半径の動的選択に依存する2つの深部強化学習法(DRL)を提案する。
論文 参考訳(メタデータ) (2020-02-22T10:01:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。