論文の概要: Multiple Domain Cyberspace Attack and Defense Game Based on Reward
Randomization Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2205.10990v1
- Date: Mon, 23 May 2022 01:38:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 18:24:44.913086
- Title: Multiple Domain Cyberspace Attack and Defense Game Based on Reward
Randomization Reinforcement Learning
- Title(参考訳): 逆ランダム化強化学習に基づくマルチドメインサイバースペース攻撃と防衛ゲーム
- Authors: Lei Zhang, Yu Pan, Yi Liu, Qibin Zheng and Zhisong Pan
- Abstract要約: 本稿では,強化学習に基づくマルチドメインサイバースペース攻撃と防衛ゲームモデルを提案する。
実験の結果,ゲームモデルは複数のドメイン・サイバー空間の攻撃および防御状態を効果的にシミュレートできることが示唆された。
- 参考スコア(独自算出の注目度): 13.26410704945674
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The existing network attack and defense method can be regarded as game, but
most of the game only involves network domain, not multiple domain cyberspace.
To address this challenge, this paper proposed a multiple domain cyberspace
attack and defense game model based on reinforcement learning. We define the
multiple domain cyberspace include physical domain, network domain and digital
domain. By establishing two agents, representing the attacker and the defender
respectively, defender will select the multiple domain actions in the multiple
domain cyberspace to obtain defender's optimal reward by reinforcement
learning. In order to improve the defense ability of defender, a game model
based on reward randomization reinforcement learning is proposed. When the
defender takes the multiple domain defense action, the reward is randomly given
and subject to linear distribution, so as to find the better defense policy and
improve defense success rate. The experimental results show that the game model
can effectively simulate the attack and defense state of multiple domain
cyberspace, and the proposed method has a higher defense success rate than DDPG
and DQN.
- Abstract(参考訳): 既存のネットワーク攻撃と防御方法はゲームと見なすことができるが、ゲームの大半は複数のドメインのサイバースペースではなくネットワークドメインに限られる。
そこで本稿では,強化学習に基づく複数ドメインのサイバースペース攻撃と防御ゲームモデルを提案する。
物理ドメイン、ネットワークドメイン、デジタルドメインを含む複数のドメインサイバースペースを定義します。
攻撃者を代表する2つのエージェントを確立することで、ディフェンダーは複数のドメインサイバー空間における複数のドメインアクションを選択し、強化学習によってディフェンダーの最適な報酬を得る。
ディフェンダーの防御能力を向上させるために,報酬ランダム化強化学習に基づくゲームモデルを提案する。
ディフェンダーが複数のドメイン防衛行動を行う場合、報酬はランダムに与えられ、線形分配されるので、より優れた防御方針を見つけ、防御成功率を向上させる。
実験の結果,ゲームモデルは複数のドメインサイバースペースの攻撃・防御状態を効果的にシミュレートでき,提案手法はDDPGやDQNよりも高い防御成功率を有することがわかった。
関連論文リスト
- Hindering Adversarial Attacks with Multiple Encrypted Patch Embeddings [13.604830818397629]
効率性とロバスト性の両方に着目したキーベースの新たな防衛手法を提案する。
我々は,(1)効率的なトレーニングと(2)任意ランダム化という2つの大きな改善をともなう,以前の防衛基盤を構築した。
実験はImageNetデータセット上で行われ、提案された防御は最先端の攻撃兵器に対して評価された。
論文 参考訳(メタデータ) (2023-09-04T14:08:34Z) - Cooperation or Competition: Avoiding Player Domination for Multi-Target
Robustness via Adaptive Budgets [76.20705291443208]
我々は、敵攻撃を、異なるプレイヤーがパラメータ更新の合同方向で合意に達するために交渉する交渉ゲームであると見なしている。
我々は、プレイヤーの優位性を避けるために、異なる敵の予算を調整する新しいフレームワークを設計する。
標準ベンチマークの実験では、提案したフレームワークを既存のアプローチに適用することで、マルチターゲットロバスト性が大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-06-27T14:02:10Z) - The Best Defense is a Good Offense: Adversarial Augmentation against
Adversarial Attacks [91.56314751983133]
A5$は、手元の入力に対する攻撃が失敗することを保証するために防御的摂動を構築するためのフレームワークである。
我々は,地上の真理ラベルを無視するロバスト化ネットワークを用いて,実機での防御強化を効果的に示す。
また、A5$を適用して、確実に堅牢な物理オブジェクトを作成する方法も示します。
論文 参考訳(メタデータ) (2023-05-23T16:07:58Z) - Randomness in ML Defenses Helps Persistent Attackers and Hinders
Evaluators [49.52538232104449]
堅牢なMLディフェンスを設計することがますます重要になっている。
近年の研究では、当初最先端の攻撃に抵抗する多くの防衛は、適応的な敵によって破壊される可能性があることが判明している。
我々は、防御設計をシンプルにし、ホワイトボックスの防御は可能な限りランダム性を損なうべきだと論じる。
論文 参考訳(メタデータ) (2023-02-27T01:33:31Z) - Game Theoretic Mixed Experts for Combinational Adversarial Machine
Learning [10.368343314144553]
我々は、敵の攻撃と防御をアンサンブルするためのゲーム理論の枠組みを提供する。
本稿では, ランダム化変換, マルチモデル投票方式, 対向検出器アーキテクチャによる防御を目標とする3つの新しい攻撃アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-26T21:35:01Z) - Defending Active Directory by Combining Neural Network based Dynamic
Program and Evolutionary Diversity Optimisation [14.326083603965278]
我々は、AD攻撃グラフ上で、1人の攻撃者と1人のディフェンダーの間でスタックルバーグのゲームモデルを研究する。
攻撃者は発見される前に目的地に到達する確率を最大化する。
ディフェンダーの任務は、攻撃者が成功する確率を減らすために、一定数のエッジをブロックすることである。
論文 参考訳(メタデータ) (2022-04-07T12:36:11Z) - Fixed Points in Cyber Space: Rethinking Optimal Evasion Attacks in the
Age of AI-NIDS [70.60975663021952]
ネットワーク分類器に対するブラックボックス攻撃について検討する。
我々は、アタッカー・ディフェンダーの固定点がそれ自体、複雑な位相遷移を持つ一般サムゲームであると主張する。
攻撃防御力学の研究には連続的な学習手法が必要であることを示す。
論文 参考訳(メタデータ) (2021-11-23T23:42:16Z) - Adversarial Online Learning with Variable Plays in the Pursuit-Evasion
Game: Theoretical Foundations and Application in Connected and Automated
Vehicle Cybersecurity [5.9774834479750805]
対戦型・非確率型マルチアームバンディット(MPMAB)は,演奏するアームの数が変動している場合に拡張する。
この作業は、相互接続された輸送システムにおいて、異なる重要な場所をスキャンするために割り当てられたリソースが、時間とともに、環境によって動的に変化するという事実によって動機付けられている。
論文 参考訳(メタデータ) (2021-10-26T23:09:42Z) - Game Theory for Adversarial Attacks and Defenses [0.0]
敵攻撃は、データセットのサンプルに小さなが故意に最悪の摂動を適用することで、敵の入力を生成することができる。
いくつかの敵防衛技術は、モデルの安全性と堅牢性を改善し、攻撃を避けるために開発されている。
論文 参考訳(メタデータ) (2021-10-08T07:38:33Z) - Fighting Gradients with Gradients: Dynamic Defenses against Adversarial
Attacks [72.59081183040682]
我々は,防御エントロピー最小化(dent)により,テスト中にモデルと入力に適応する動的防御を提案する。
dentは、CIFAR-10/100およびImageNetに対する、敵に訓練された防御と名指しで訓練されたモデルの堅牢性を改善する。
論文 参考訳(メタデータ) (2021-05-18T17:55:07Z) - AdvMS: A Multi-source Multi-cost Defense Against Adversarial Attacks [81.45930614122925]
ディープニューラルネットワークは、マルウェア検出や自動運転車など、多くのセキュリティクリティカルな領域で急速に普及している。
従来の防衛手法は有望だが、単一ソースの単一コストの性質によってほとんど制限されている。
本稿では,AdvMSのマルチソース特性が性能評価問題を緩和し,多コスト特性が柔軟性と調整可能なコストの組み合わせによるロバスト性の向上を可能にすることを示す。
論文 参考訳(メタデータ) (2020-02-19T20:46:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。