Fugu-MT 論文翻訳(概要): Deep Reinforcement Learning for Cyber System Defense under Dynamic Adversarial Uncertainties

論文の概要: Deep Reinforcement Learning for Cyber System Defense under Dynamic Adversarial Uncertainties

arxiv url: http://arxiv.org/abs/2302.01595v1
Date: Fri, 3 Feb 2023 08:33:33 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-06 16:55:07.827415
Title: Deep Reinforcement Learning for Cyber System Defense under Dynamic Adversarial Uncertainties
Title（参考訳）: 動的不確実性を考慮したサイバーシステム防御のための深層強化学習
Authors: Ashutosh Dutta, Samrat Chatterjee, Arnab Bhattacharya, Mahantesh Halappanavar
Abstract要約: 本稿では,データ駆動型深層強化学習フレームワークを提案する。動的防御最適化問題は、異なる種類の敵に対する複数の保護姿勢で定式化される。
参考スコア（独自算出の注目度）: 5.78419291062552
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Development of autonomous cyber system defense strategies and action recommendations in the real-world is challenging, and includes characterizing system state uncertainties and attack-defense dynamics. We propose a data-driven deep reinforcement learning (DRL) framework to learn proactive, context-aware, defense countermeasures that dynamically adapt to evolving adversarial behaviors while minimizing loss of cyber system operations. A dynamic defense optimization problem is formulated with multiple protective postures against different types of adversaries with varying levels of skill and persistence. A custom simulation environment was developed and experiments were devised to systematically evaluate the performance of four model-free DRL algorithms against realistic, multi-stage attack sequences. Our results suggest the efficacy of DRL algorithms for proactive cyber defense under multi-stage attack profiles and system uncertainties.
Abstract（参考訳）: 自律型サイバーシステム防衛戦略と実世界でのアクションレコメンデーションの開発は困難であり、システム状態の不確実性と攻撃防御のダイナミクスを特徴づける。サイバーシステム操作の損失を最小限に抑えつつ、進化する敵行動に動的に適応する、積極的なコンテキスト認識、防御対策を学ぶためのデータ駆動型深層強化学習(drl)フレームワークを提案する。動的防御最適化問題は、異なる種類の敵に対して異なるレベルのスキルと永続性を持つ複数の保護姿勢で定式化される。カスタムシミュレーション環境を開発し、4つのモデルフリーDRLアルゴリズムの性能を現実的なマルチステージ攻撃シーケンスに対して体系的に評価する実験を行った。本研究は,多段階攻撃プロファイルとシステム不確実性に基づくプロアクティブサイバー防御のためのDRLアルゴリズムの有効性を示唆する。

関連論文リスト

Large Language Model-Based Reward Design for Deep Reinforcement Learning-Driven Autonomous Cyber Defense [3.2661946789427314]
本稿では,大規模言語モデル(LLM)に基づく報酬設計手法を提案する。以上の結果から, LLM誘導型報酬設計は, 多様な敵行動に対する効果的な防衛戦略につながる可能性が示唆された。
論文参考訳（メタデータ） (2025-11-20T15:54:08Z)
Reinforcement Learning for Decision-Level Interception Prioritization in Drone Swarm Defense [56.47577824219207]
本稿では,この課題に対処する上で,強化学習の実践的メリットを示すケーススタディを提案する。本研究では,現実的な運用制約を捉えた高忠実度シミュレーション環境を提案する。エージェントは最適なインターセプション優先順位付けのために複数のエフェクターを調整することを学ぶ。我々は、何百ものシミュレートされた攻撃シナリオにおいて、手作りルールベースのベースラインに対する学習ポリシーを評価する。
論文参考訳（メタデータ） (2025-08-01T13:55:39Z)
Robust Deep Reinforcement Learning in Robotics via Adaptive Gradient-Masked Adversarial Attacks [15.825229211045647]
本稿では、DRLとグラデーションベースのソフトマスキング機構を組み合わせたホワイトボックス攻撃手法であるAGMRアタックを提案し、臨界状態次元を動的に識別し、敵のポリシーを最適化する。 AGMRは、被害者エージェントのパフォーマンスを低下させ、敵防御機構を通じて被害者エージェントの堅牢性を高める、最先端の敵攻撃方法より優れる。
論文参考訳（メタデータ） (2025-03-26T15:08:58Z)
Quantitative Resilience Modeling for Autonomous Cyber Defense [7.6078202493877205]
サイバーレジリエンス(サイバーレジリエンス)とは、システムがシステム操作に最小限の影響で攻撃から回復する能力である。多様なネットワークトポロジやアタックパターンに適用可能な、レジリエンスの正式な定義はありません。複数のディフェンダ運用目標を考慮したレジリエンスの定量的定式化を提案する。
論文参考訳（メタデータ） (2025-03-04T16:52:25Z)
Sustainable Self-evolution Adversarial Training [51.25767996364584]
対戦型防衛モデルのための持続的自己進化支援訓練(SSEAT)フレームワークを提案する。本研究は,様々な種類の対角的事例から学習を実現するために,連続的な対向防衛パイプラインを導入する。また,より多様で重要な再学習データを選択するために,逆データ再生モジュールを提案する。
論文参考訳（メタデータ） (2024-12-03T08:41:11Z)
Optimizing Cyber Defense in Dynamic Active Directories through Reinforcement Learning [10.601458163651582]
本稿では,動的実世界のネットワークにおけるエッジブロッキングACO戦略の欠如に対処する。具体的には、組織的Active Directory(AD)システムのサイバーセキュリティ脆弱性を対象とする。 ADシステムを静的エンティティとみなす、エッジブロッキング防衛に関する既存の文献とは異なり、本研究では、それらの動的性質を認識してこれに対応する。
論文参考訳（メタデータ） (2024-06-28T01:37:46Z)
Efficient Adversarial Training in LLMs with Continuous Attacks [99.5882845458567]
大規模言語モデル(LLM)は、安全ガードレールをバイパスできる敵攻撃に対して脆弱である。本稿では,2つの損失からなる高速対向訓練アルゴリズム(C-AdvUL)を提案する。 C-AdvIPOは、対向的に堅牢なアライメントのためのユーティリティデータを必要としない、対向型のIPOである。
論文参考訳（メタデータ） (2024-05-24T14:20:09Z)
Continual Adversarial Defense [37.37029638528458]
防衛システムは、敵データをオンラインで継続的に収集し、迅速に自己改善する。新たな攻撃への継続的な適応は、壊滅的な忘れ、少数ショット適応、メモリ効率適応、クリーンデータと逆データの両方において高い精度である。特にCADは、前回の攻撃に対して優れた性能を維持しつつ、最小限の予算と低コストの防衛失敗に迅速に適応することができる。
論文参考訳（メタデータ） (2023-12-15T01:38:26Z)
Towards Adversarial Realism and Robust Learning for IoT Intrusion Detection and Classification [0.0]
IoT(Internet of Things)は、重大なセキュリティ上の課題に直面している。敵の攻撃による脅威の増大は、信頼できる防衛戦略の必要性を回復させる。本研究は、敵のサイバー攻撃事例が現実的であるために必要な制約の種類について述べる。
論文参考訳（メタデータ） (2023-01-30T18:00:28Z)
Fixed Points in Cyber Space: Rethinking Optimal Evasion Attacks in the Age of AI-NIDS [70.60975663021952]
ネットワーク分類器に対するブラックボックス攻撃について検討する。我々は、アタッカー・ディフェンダーの固定点がそれ自体、複雑な位相遷移を持つ一般サムゲームであると主張する。攻撃防御力学の研究には連続的な学習手法が必要であることを示す。
論文参考訳（メタデータ） (2021-11-23T23:42:16Z)
Improving Robustness of Reinforcement Learning for Power System Control with Adversarial Training [71.7750435554693]
電力系統制御のために提案された最先端のRLエージェントが敵攻撃に対して脆弱であることを示す。具体的には、敵のマルコフ決定プロセスを用いて攻撃方針を学習し、攻撃の有効性を実証する。本稿では,RLエージェントの攻撃に対する堅牢性を高め,実行不可能な運用上の決定を回避するために,敵の訓練を利用することを提案する。
論文参考訳（メタデータ） (2021-10-18T00:50:34Z)
Model-Agnostic Meta-Attack: Towards Reliable Evaluation of Adversarial Robustness [53.094682754683255]
モデル非依存型メタアタック(MAMA)アプローチにより,より強力な攻撃アルゴリズムを自動検出する。本手法は、繰り返しニューラルネットワークによってパラメータ化された逆攻撃を学習する。本研究では,未知の防御を攻撃した場合の学習能力を向上させるために,モデルに依存しない訓練アルゴリズムを開発した。
論文参考訳（メタデータ） (2021-10-13T13:54:24Z)
A Secure Learning Control Strategy via Dynamic Camouflaging for Unknown Dynamical Systems under Attacks [0.0]
本稿では、未知の線形時間不変サイバー物理システム(CPS)に対するセキュア強化学習(RL)に基づく制御手法を提案する。本研究では,設計者による学習の探索段階において,攻撃者が動的モデルについて学習する攻撃シナリオについて考察する。本稿では,動的カモフラージュに基づく攻撃耐性強化学習(ARRL)アルゴリズムを提案する。
論文参考訳（メタデータ） (2021-02-01T00:34:38Z)
Automated Adversary Emulation for Cyber-Physical Systems via Reinforcement Learning [4.763175424744536]
我々は,サイバー物理システムに対する敵エミュレーションに対するドメイン認識の自動化手法を開発した。我々は、マルコフ決定プロセス(MDP)モデルを定式化し、ハイブリッドアタックグラフ上で最適なアタックシーケンスを決定する。モデルベースおよびモデルフリー強化学習(RL)法を用いて,離散連続型MDPをトラクタブルな方法で解く。
論文参考訳（メタデータ） (2020-11-09T18:44:29Z)
Learn2Perturb: an End-to-end Feature Perturbation Learning to Improve Adversarial Robustness [79.47619798416194]
Learn2Perturbは、ディープニューラルネットワークの対角的堅牢性を改善するために、エンドツーエンドの機能摂動学習アプローチである。予測最大化にインスパイアされ、ネットワークと雑音パラメータを連続的にトレーニングするために、交互にバックプロパゲーショントレーニングアルゴリズムが導入された。
論文参考訳（メタデータ） (2020-03-02T18:27:35Z)
Enhanced Adversarial Strategically-Timed Attacks against Deep Reinforcement Learning [91.13113161754022]
本稿では,DRLに基づくナビゲーションシステムに対して,選択した時間フレーム上の物理ノイズパターンを妨害することにより,タイミングに基づく逆方向戦略を導入する。実験結果から, 対向タイミング攻撃は性能低下を引き起こす可能性が示唆された。
論文参考訳（メタデータ） (2020-02-20T21:39:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。