論文の概要: An Intrusion Response System utilizing Deep Q-Networks and System
Partitions
- arxiv url: http://arxiv.org/abs/2202.08182v1
- Date: Wed, 16 Feb 2022 16:38:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-17 15:29:29.962948
- Title: An Intrusion Response System utilizing Deep Q-Networks and System
Partitions
- Title(参考訳): ディープQネットワークとシステム分割を利用した侵入応答システム
- Authors: Valeria Cardellini, Emiliano Casalicchio, Stefano Iannucci, Matteo
Lucantonio, Sudip Mittal, Damodar Panigrahi, Andrea Silvi
- Abstract要約: irs-partitionというIRSソフトウェアプロトタイプを導入・開発する。
非定常系の進化に追従するために移動学習を利用する。
- 参考スコア(独自算出の注目度): 0.415623340386296
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intrusion Response is a relatively new field of research. Recent approaches
for the creation of Intrusion Response Systems (IRSs) use Reinforcement
Learning (RL) as a primary technique for the optimal or near-optimal selection
of the proper countermeasure to take in order to stop or mitigate an ongoing
attack. However, most of them do not consider the fact that systems can change
over time or, in other words, that systems exhibit a non-stationary behavior.
Furthermore, stateful approaches, such as those based on RL, suffer the curse
of dimensionality, due to a state space growing exponentially with the size of
the protected system.
In this paper, we introduce and develop an IRS software prototype, named
irs-partition. It leverages the partitioning of the protected system and Deep
Q-Networks to address the curse of dimensionality by supporting a multi-agent
formulation. Furthermore, it exploits transfer learning to follow the evolution
of non-stationary systems.
- Abstract(参考訳): 侵入反応は比較的新しい研究分野である。
侵入応答システム(IRS)の創出に対する最近のアプローチは、現在進行中の攻撃を阻止または緩和するために、適切な対策を最適又はほぼ最適に選択するための第一の手法として強化学習(RL)を使用している。
しかし、それらのほとんどは、システムが時間とともに変化するという事実や、言い換えれば、システムが非定常な振る舞いを示すという事実を考慮していない。
さらに、RLに基づくようなステートフルなアプローチは、保護されたシステムのサイズとともに指数関数的に増加する状態空間のために、次元性の呪いを被る。
本稿では,IRSソフトウェアプロトタイプ irs-partition について紹介する。
保護されたシステムとDeep Q-Networksのパーティショニングを活用し、マルチエージェントの定式化をサポートすることで次元の呪いに対処する。
さらに、転送学習を利用して非定常システムの進化に追随する。
関連論文リスト
- Multi-agent Reinforcement Learning-based Network Intrusion Detection System [3.4636217357968904]
侵入検知システム(IDS)は,コンピュータネットワークのセキュリティ確保において重要な役割を担っている。
本稿では,自動,効率的,堅牢なネットワーク侵入検出が可能な,新しいマルチエージェント強化学習(RL)アーキテクチャを提案する。
我々のソリューションは、新しい攻撃の追加に対応し、既存の攻撃パターンの変更に効果的に適応するように設計されたレジリエントなアーキテクチャを導入します。
論文 参考訳(メタデータ) (2024-07-08T09:18:59Z) - Analyzing Adversarial Inputs in Deep Reinforcement Learning [53.3760591018817]
本稿では, 正当性検証のレンズを用いて, 逆入力の特性を包括的に解析する。
このような摂動に対する感受性に基づいてモデルを分類するために、新しい計量である逆数率(Adversarial Rate)を導入する。
本分析は, 直交入力が所定のDRLシステムの安全性にどのように影響するかを実証的に示す。
論文 参考訳(メタデータ) (2024-02-07T21:58:40Z) - Adopting the Actor Model for Antifragile Serverless Architectures [2.602613712854636]
反脆弱性(英語: antifragility)とは、ソフトウェアシステムが障害のような持続的な有害事象に基づいて、時間とともに学習し、改善することに焦点を当てた概念である。
本稿では、サーバーレスシステムにおける監視戦略の導入を支援するための新しい考え方を提案する。
論文 参考訳(メタデータ) (2023-06-26T14:49:10Z) - Interactive System-wise Anomaly Detection [66.3766756452743]
異常検出は様々なアプリケーションにおいて基本的な役割を果たす。
既存のメソッドでは、インスタンスがデータとして容易に観察できないシステムであるシナリオを扱うのが難しい。
システム埋め込みを学習するエンコーダデコーダモジュールを含むエンドツーエンドアプローチを開発する。
論文 参考訳(メタデータ) (2023-04-21T02:20:24Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Large-Scale Sequential Learning for Recommender and Engineering Systems [91.3755431537592]
本稿では,現在の状況に適応してパーソナライズされたランキングを提供する自動アルゴリズムの設計に焦点を当てる。
前者はSAROSと呼ばれる新しいアルゴリズムを提案し,インタラクションの順序を学習するためのフィードバックの種類を考慮に入れている。
提案手法は, 電力網の故障検出に対する初期アプローチと比較して, 統計的に有意な結果を示す。
論文 参考訳(メタデータ) (2022-05-13T21:09:41Z) - A Novel Online Incremental Learning Intrusion Prevention System [2.5234156040689237]
本稿では,自己組織型インクリメンタルニューラルネットワークとサポートベクトルマシンを併用したネットワーク侵入防止システムを提案する。
提案システムは,その構造上,シグネチャやルールに依存しないセキュリティソリューションを提供するとともに,既知の攻撃や未知の攻撃を高精度にリアルタイムに軽減することができる。
論文 参考訳(メタデータ) (2021-09-20T13:30:11Z) - Supervised DKRC with Images for Offline System Identification [77.34726150561087]
現代の力学系はますます非線形で複雑なものになりつつある。
予測と制御のためのコンパクトで包括的な表現でこれらのシステムをモデル化するフレームワークが必要である。
本手法は,教師付き学習手法を用いてこれらの基礎関数を学習する。
論文 参考訳(メタデータ) (2021-09-06T04:39:06Z) - Learning Dependencies in Distributed Cloud Applications to Identify and
Localize Anomalies [58.88325379746632]
本稿では、システムコンポーネントをノードとしてモデル化し、その依存関係をエッジとしてモデル化し、異常の識別と局在を改善するニューラルグラフ変換手法であるArvalusとその変種D-Arvalusを紹介します。
一連のメトリックを考えると、私たちの方法は最も可能性の高いシステム状態 - 正常または異常クラス - を予測し、異常が検出されたときにローカライズを行います。
この評価は、一般にArvalusの良好な予測性能を示し、システムコンポーネント依存性に関する情報を組み込んだD-Arvalusの利点を明らかにします。
論文 参考訳(メタデータ) (2021-03-09T06:34:05Z) - Explicitly Encouraging Low Fractional Dimensional Trajectories Via
Reinforcement Learning [6.548580592686076]
モデル自由強化学習エージェントによって誘導される軌道の次元性は,エージェント報酬信号にポストプロセッシング関数を追加することで影響できることを示す。
システムに付加されるノイズに対して寸法の低減が堅牢であることを検証するとともに, 改良されたエージェントは, 一般に, 騒音や押圧障害に対してより現実的に堅牢であることを示す。
論文 参考訳(メタデータ) (2020-12-21T20:09:17Z) - Robustifying Reinforcement Learning Agents via Action Space Adversarial
Training [23.284452331353894]
機械学習(ML)を応用したサイバー物理システム(CPS)の採用は、現代社会の様々な分野に広まっている。
深層強化学習(DRL)の最近の研究は、様々なデータ駆動型意思決定と制御アプリケーションにおいてその利点を実証している。
動作空間摂動の影響を受けやすいDRLエージェントを, 対向訓練により, 同様の摂動に対して堅牢化できることを示す。
論文 参考訳(メタデータ) (2020-07-14T16:50:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。