論文の概要: Automated Adversary Emulation for Cyber-Physical Systems via
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2011.04635v1
- Date: Mon, 9 Nov 2020 18:44:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 02:46:16.141269
- Title: Automated Adversary Emulation for Cyber-Physical Systems via
Reinforcement Learning
- Title(参考訳): 強化学習によるサイバー物理システムの自動逆エミュレーション
- Authors: Arnab Bhattacharya, Thiagarajan Ramachandran, Sandeep Banik, Chase P.
Dowling, Shaunak D. Bopardikar
- Abstract要約: 我々は,サイバー物理システムに対する敵エミュレーションに対するドメイン認識の自動化手法を開発した。
我々は、マルコフ決定プロセス(MDP)モデルを定式化し、ハイブリッドアタックグラフ上で最適なアタックシーケンスを決定する。
モデルベースおよびモデルフリー強化学習(RL)法を用いて,離散連続型MDPをトラクタブルな方法で解く。
- 参考スコア(独自算出の注目度): 4.763175424744536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adversary emulation is an offensive exercise that provides a comprehensive
assessment of a system's resilience against cyber attacks. However, adversary
emulation is typically a manual process, making it costly and hard to deploy in
cyber-physical systems (CPS) with complex dynamics, vulnerabilities, and
operational uncertainties. In this paper, we develop an automated, domain-aware
approach to adversary emulation for CPS. We formulate a Markov Decision Process
(MDP) model to determine an optimal attack sequence over a hybrid attack graph
with cyber (discrete) and physical (continuous) components and related physical
dynamics. We apply model-based and model-free reinforcement learning (RL)
methods to solve the discrete-continuous MDP in a tractable fashion. As a
baseline, we also develop a greedy attack algorithm and compare it with the RL
procedures. We summarize our findings through a numerical study on sensor
deception attacks in buildings to compare the performance and solution quality
of the proposed algorithms.
- Abstract(参考訳): 敵対的エミュレーション(adversary emulation)は、サイバー攻撃に対するシステムのレジリエンスを包括的に評価する攻撃的エクササイズである。
しかしながら、敵エミュレーションは典型的には手動のプロセスであり、複雑なダイナミクス、脆弱性、運用上の不確実性を備えたサイバー物理システム(CPS)への展開が高価かつ困難である。
本稿では,CPSの敵エミュレーションに対するドメイン認識の自動化手法を提案する。
我々はマルコフ決定過程(MDP)モデルを定式化し、サイバー(離散)と物理的(連続)成分と関連する物理力学を持つハイブリッド攻撃グラフ上で最適な攻撃シーケンスを決定する。
モデルベースおよびモデルフリー強化学習(RL)を用いて,離散連続型MDPを抽出可能な方法で解く。
ベースラインとして、グリーディ攻撃アルゴリズムを開発し、RLプロシージャと比較する。
本研究は,建物内におけるセンサ偽装攻撃の数値的研究を通じて,提案アルゴリズムの性能と解の質を比較した。
関連論文リスト
- Efficient Adversarial Training in LLMs with Continuous Attacks [99.5882845458567]
大規模言語モデル(LLM)は、安全ガードレールをバイパスできる敵攻撃に対して脆弱である。
本稿では,2つの損失からなる高速対向訓練アルゴリズム(C-AdvUL)を提案する。
C-AdvIPOは、対向的に堅牢なアライメントのためのユーティリティデータを必要としない、対向型のIPOである。
論文 参考訳(メタデータ) (2024-05-24T14:20:09Z) - Robustness and Generalization Performance of Deep Learning Models on
Cyber-Physical Systems: A Comparative Study [71.84852429039881]
調査は、センサーの故障やノイズなど、様々な摂動を扱うモデルの能力に焦点を当てている。
我々は,これらのモデルの一般化と伝達学習能力を,アウト・オブ・ディストリビューション(OOD)サンプルに公開することによって検証する。
論文 参考訳(メタデータ) (2023-06-13T12:43:59Z) - Deep Reinforcement Learning for Cyber System Defense under Dynamic
Adversarial Uncertainties [5.78419291062552]
本稿では,データ駆動型深層強化学習フレームワークを提案する。
動的防御最適化問題は、異なる種類の敵に対する複数の保護姿勢で定式化される。
論文 参考訳(メタデータ) (2023-02-03T08:33:33Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Improving robustness of jet tagging algorithms with adversarial training [56.79800815519762]
本研究では,フレーバータグ付けアルゴリズムの脆弱性について,敵攻撃による検証を行った。
シミュレーション攻撃の影響を緩和する対人訓練戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T19:57:19Z) - Reinforcement learning for automatic quadrilateral mesh generation: a
soft actor-critic approach [26.574242660728864]
本稿では、自動メッシュ生成のための強化学習に基づく計算フレームワークを提案し、実装し、評価する。
有限要素解析(FEA)と計算流体力学(CFD)の領域におけるメッシュ生成は数値シミュレーションにおいて基本的な役割を果たす
論文 参考訳(メタデータ) (2022-03-19T21:49:05Z) - Model-Agnostic Meta-Attack: Towards Reliable Evaluation of Adversarial
Robustness [53.094682754683255]
モデル非依存型メタアタック(MAMA)アプローチにより,より強力な攻撃アルゴリズムを自動検出する。
本手法は、繰り返しニューラルネットワークによってパラメータ化された逆攻撃を学習する。
本研究では,未知の防御を攻撃した場合の学習能力を向上させるために,モデルに依存しない訓練アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-13T13:54:24Z) - Learning-Based Vulnerability Analysis of Cyber-Physical Systems [10.066594071800337]
本研究は,サイバー物理システムの脆弱性解析におけるディープラーニングの利用に焦点を当てる。
我々は,低レベル制御が拡張カルマンフィルタ(ekf)や異常検出器(anomaly detector)などに基づくcpsにおいて広く用いられている制御アーキテクチャを考える。
潜在的なセンシング攻撃が持つ影響を分析することを容易にするため、学習可能な攻撃生成器の開発が目的である。
論文 参考訳(メタデータ) (2021-03-10T06:52:26Z) - A Secure Learning Control Strategy via Dynamic Camouflaging for Unknown
Dynamical Systems under Attacks [0.0]
本稿では、未知の線形時間不変サイバー物理システム(CPS)に対するセキュア強化学習(RL)に基づく制御手法を提案する。
本研究では,設計者による学習の探索段階において,攻撃者が動的モデルについて学習する攻撃シナリオについて考察する。
本稿では,動的カモフラージュに基づく攻撃耐性強化学習(ARRL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-01T00:34:38Z) - Covert Model Poisoning Against Federated Learning: Algorithm Design and
Optimization [76.51980153902774]
フェデレーテッド・ラーニング(FL)はパラメータ伝達中にFLモデルに対する外部攻撃に対して脆弱である。
本稿では,最先端の防御アグリゲーション機構に対処する有効なMPアルゴリズムを提案する。
実験の結果,提案したCMPアルゴリズムは,既存の攻撃機構よりも効果的で,かなり優れていることが示された。
論文 参考訳(メタデータ) (2021-01-28T03:28:18Z) - Adversarial Training for a Continuous Robustness Control Problem in
Power Systems [1.0742675209112622]
今後のサイバー物理パワーシステムのコントローラ設計において、堅牢性を注入するための新たな敵対的トレーニングアプローチを提案します。
敵フレームワークをモデル化し,固定された対向ポリシーの実装を提案し,l2rpn(learning to run a power network)環境上でテストする。
本研究は,L2RPNコンペティションのロバスト性トラックから,提案したトレーニングエージェントの結果を分析した。
論文 参考訳(メタデータ) (2020-12-21T14:42:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。