論文の概要: Hybrid Deep Learning Model using SPCAGAN Augmentation for Insider Threat
Analysis
- arxiv url: http://arxiv.org/abs/2203.02855v1
- Date: Sun, 6 Mar 2022 02:08:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-09 08:42:37.839922
- Title: Hybrid Deep Learning Model using SPCAGAN Augmentation for Insider Threat
Analysis
- Title(参考訳): 内部脅威分析のためのSPCAGAN拡張を用いたハイブリッドディープラーニングモデル
- Authors: R G Gayathri, Atul Sajjanhar, Yong Xiang
- Abstract要約: ディープラーニングを用いた異常検出には包括的データが必要であるが、機密性に関する懸念からインサイダー脅威データは利用できない。
本研究では,不均一なデータソースから入力を受ける線形多様体学習に基づく生成逆ネットワークSPCAGANを提案する。
提案手法は誤差が低く,精度が高く,従来のモデルよりもはるかに優れた合成インサイダー脅威データを生成する。
- 参考スコア(独自算出の注目度): 7.576808824987132
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cyberattacks from within an organization's trusted entities are known as
insider threats. Anomaly detection using deep learning requires comprehensive
data, but insider threat data is not readily available due to confidentiality
concerns of organizations. Therefore, there arises demand to generate synthetic
data to explore enhanced approaches for threat analysis. We propose a linear
manifold learning-based generative adversarial network, SPCAGAN, that takes
input from heterogeneous data sources and adds a novel loss function to train
the generator to produce high-quality data that closely resembles the original
data distribution. Furthermore, we introduce a deep learning-based hybrid model
for insider threat analysis. We provide extensive experiments for data
synthesis, anomaly detection, adversarial robustness, and synthetic data
quality analysis using benchmark datasets. In this context, empirical
comparisons show that GAN-based oversampling is competitive with numerous
typical oversampling regimes. For synthetic data generation, our SPCAGAN model
overcame the problem of mode collapse and converged faster than previous GAN
models. Results demonstrate that our proposed approach has a lower error, is
more accurate, and generates substantially superior synthetic insider threat
data than previous models.
- Abstract(参考訳): 組織内の信頼できる組織からのサイバー攻撃はインサイダー脅威として知られている。
ディープラーニングを使用した異常検出には包括的なデータが必要だが、組織の機密性に関する懸念から、インサイダー脅威データは容易に利用できない。
そのため、脅威分析のための高度なアプローチを探るため、合成データを生成する必要が生じる。
本研究では,不均一なデータソースから入力を受信し,生成元のデータ分布によく似た高品質なデータを生成するために,生成器を訓練するための新たな損失関数を付加する,線形多様体学習に基づく生成逆ネットワークSPCAGANを提案する。
さらに,インサイダー脅威分析のための深層学習に基づくハイブリッドモデルを提案する。
ベンチマークデータセットを用いたデータ合成,異常検出,逆ロバスト性,合成データ品質解析のための広範な実験を行う。
この文脈において、実証的な比較は、GANに基づくオーバーサンプリングは多くの典型的なオーバーサンプリング体制と競合していることを示している。
合成データ生成において,SPCAGANモデルはモード崩壊の問題を克服し,従来のGANモデルよりも高速に収束する。
その結果,提案手法は誤差が低く,精度が高く,従来モデルよりもはるかに優れた合成インサイダー脅威データを生成することがわかった。
関連論文リスト
- Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - Let's Synthesize Step by Step: Iterative Dataset Synthesis with Large
Language Models by Extrapolating Errors from Small Models [69.76066070227452]
※データ合成*はラベル付きデータの少ない小さなモデルをトレーニングするための有望な方法です。
本稿では,この分散ギャップを縮めるデータ合成フレームワークであるStep* (**S3**) による合成ステップを提案する。
提案手法は,合成データセットと実データとのギャップを小さくすることで,小型モデルの性能を向上させる。
論文 参考訳(メタデータ) (2023-10-20T17:14:25Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - FairGen: Fair Synthetic Data Generation [0.3149883354098941]
本稿では,GANアーキテクチャに依存しないより公平な合成データを生成するパイプラインを提案する。
合成データを生成する場合、ほとんどのGANはトレーニングデータに存在するバイアスを増幅するが、これらのバイアスを誘発するサンプルを除去することで、GANは本質的に真の情報的サンプルに重点を置いている、と我々は主張する。
論文 参考訳(メタデータ) (2022-10-24T08:13:47Z) - Deceive D: Adaptive Pseudo Augmentation for GAN Training with Limited
Data [125.7135706352493]
GAN(Generative Adversarial Network)は、高忠実度画像を合成するために、訓練に十分なデータを必要とする。
近年の研究では、差別者の過度な適合により、限られたデータでGANを訓練することは困難であることが示されている。
本稿では,APA (Adaptive Pseudo Augmentation) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-11-12T18:13:45Z) - Towards Synthetic Multivariate Time Series Generation for Flare
Forecasting [5.098461305284216]
データ駆動・レアイベント予測アルゴリズムのトレーニングにおける制限要因の1つは、関心のあるイベントの不足である。
本研究では,データインフォームド・オーバーサンプリングを行う手段として,条件付き生成逆数ネットワーク(CGAN)の有用性を検討する。
論文 参考訳(メタデータ) (2021-05-16T22:23:23Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z) - Differentially Private Synthetic Medical Data Generation using
Convolutional GANs [7.2372051099165065]
R'enyiの差分プライバシーを用いた合成データ生成のための差分プライベートフレームワークを開発する。
提案手法は, 畳み込み自己エンコーダと畳み込み生成対向ネットワークを利用して, 生成した合成データの重要な特性をある程度保存する。
私たちのモデルは、同じプライバシー予算の下で既存の最新モデルを上回ることを実証します。
論文 参考訳(メタデータ) (2020-12-22T01:03:49Z) - Firearm Detection via Convolutional Neural Networks: Comparing a
Semantic Segmentation Model Against End-to-End Solutions [68.8204255655161]
武器の脅威検出とライブビデオからの攻撃的な行動は、潜在的に致命的な事故の迅速検出と予防に使用できる。
これを実現する一つの方法は、人工知能と、特に画像分析のための機械学習を使用することです。
従来のモノリシックなエンド・ツー・エンドのディープラーニングモデルと、セマンティクスセグメンテーションによって火花を検知する単純なニューラルネットワークのアンサンブルに基づく前述したモデルを比較した。
論文 参考訳(メタデータ) (2020-12-17T15:19:29Z) - Foundations of Bayesian Learning from Synthetic Data [1.6249267147413522]
我々はベイズパラダイムを用いて、合成データから学習する際のモデルパラメータの更新を特徴付ける。
ベイジアン・アップデートの最近の成果は、決定理論に基づく新しい、堅牢な合成学習のアプローチを支持している。
論文 参考訳(メタデータ) (2020-11-16T21:49:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。