論文の概要: Hybrid Deep Learning Model using SPCAGAN Augmentation for Insider Threat
Analysis
- arxiv url: http://arxiv.org/abs/2203.02855v1
- Date: Sun, 6 Mar 2022 02:08:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-09 08:42:37.839922
- Title: Hybrid Deep Learning Model using SPCAGAN Augmentation for Insider Threat
Analysis
- Title(参考訳): 内部脅威分析のためのSPCAGAN拡張を用いたハイブリッドディープラーニングモデル
- Authors: R G Gayathri, Atul Sajjanhar, Yong Xiang
- Abstract要約: ディープラーニングを用いた異常検出には包括的データが必要であるが、機密性に関する懸念からインサイダー脅威データは利用できない。
本研究では,不均一なデータソースから入力を受ける線形多様体学習に基づく生成逆ネットワークSPCAGANを提案する。
提案手法は誤差が低く,精度が高く,従来のモデルよりもはるかに優れた合成インサイダー脅威データを生成する。
- 参考スコア(独自算出の注目度): 7.576808824987132
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cyberattacks from within an organization's trusted entities are known as
insider threats. Anomaly detection using deep learning requires comprehensive
data, but insider threat data is not readily available due to confidentiality
concerns of organizations. Therefore, there arises demand to generate synthetic
data to explore enhanced approaches for threat analysis. We propose a linear
manifold learning-based generative adversarial network, SPCAGAN, that takes
input from heterogeneous data sources and adds a novel loss function to train
the generator to produce high-quality data that closely resembles the original
data distribution. Furthermore, we introduce a deep learning-based hybrid model
for insider threat analysis. We provide extensive experiments for data
synthesis, anomaly detection, adversarial robustness, and synthetic data
quality analysis using benchmark datasets. In this context, empirical
comparisons show that GAN-based oversampling is competitive with numerous
typical oversampling regimes. For synthetic data generation, our SPCAGAN model
overcame the problem of mode collapse and converged faster than previous GAN
models. Results demonstrate that our proposed approach has a lower error, is
more accurate, and generates substantially superior synthetic insider threat
data than previous models.
- Abstract(参考訳): 組織内の信頼できる組織からのサイバー攻撃はインサイダー脅威として知られている。
ディープラーニングを使用した異常検出には包括的なデータが必要だが、組織の機密性に関する懸念から、インサイダー脅威データは容易に利用できない。
そのため、脅威分析のための高度なアプローチを探るため、合成データを生成する必要が生じる。
本研究では,不均一なデータソースから入力を受信し,生成元のデータ分布によく似た高品質なデータを生成するために,生成器を訓練するための新たな損失関数を付加する,線形多様体学習に基づく生成逆ネットワークSPCAGANを提案する。
さらに,インサイダー脅威分析のための深層学習に基づくハイブリッドモデルを提案する。
ベンチマークデータセットを用いたデータ合成,異常検出,逆ロバスト性,合成データ品質解析のための広範な実験を行う。
この文脈において、実証的な比較は、GANに基づくオーバーサンプリングは多くの典型的なオーバーサンプリング体制と競合していることを示している。
合成データ生成において,SPCAGANモデルはモード崩壊の問題を克服し,従来のGANモデルよりも高速に収束する。
その結果,提案手法は誤差が低く,精度が高く,従来モデルよりもはるかに優れた合成インサイダー脅威データを生成することがわかった。
関連論文リスト
- Debiasing Synthetic Data Generated by Deep Generative Models [40.165159490379146]
合成データ生成のための深部生成モデル(DGM)は、合成データ解析においてバイアスと不正確性を誘導する。
本稿では,DGMが生成する合成データを,特定のデータ解析のためにターゲットとする新たな戦略を提案する。
提案手法は, 偏差を考慮し, 収束率を向上し, 容易に近似された大きなサンプル分散を持つ推定器の計算を容易にする。
論文 参考訳(メタデータ) (2024-11-06T19:24:34Z) - zGAN: An Outlier-focused Generative Adversarial Network For Realistic Synthetic Data Generation [0.0]
ブラックスワン」は古典的な機械学習モデルの性能に挑戦している。
本稿では、外部特性を持つ合成データを生成する目的で開発されたzGANモデルアーキテクチャの概要について述べる。
リアルな合成データ生成の有望な結果と、モデル性能のアップリフト能力を示す。
論文 参考訳(メタデータ) (2024-10-28T07:55:11Z) - Synthetic Data Generation in Cybersecurity: A Comparative Analysis [0.0]
GANベースの手法、特にCTGANとCopulaGANは、忠実性と実用性の観点から非AIおよび従来のAIアプローチより優れている。
本研究は,サイバーセキュリティネットワークトラフィックデータに特化して,これらの手法の比較評価を行うことにより,この分野に寄与する。
論文 参考訳(メタデータ) (2024-10-18T14:19:25Z) - Unveiling the Flaws: Exploring Imperfections in Synthetic Data and Mitigation Strategies for Large Language Models [89.88010750772413]
大規模言語モデル(LLM)の学習における高品質なデータ不足問題に対する解決法として,合成データを提案する。
我々の研究は、Q-A(Q-A)ペア、一般的な合成データに関連するこれらの特定の欠陥を掘り下げ、これらの欠陥を軽減するための未学習技術に基づく方法を提案する。
我々の研究は、より堅牢で効率的なLLMトレーニングを促進することを目的として、合成データの効果的な利用に関する重要な洞察を得た。
論文 参考訳(メタデータ) (2024-06-18T08:38:59Z) - Synthetic Oversampling: Theory and A Practical Approach Using LLMs to Address Data Imbalance [16.047084318753377]
不均衡なデータと急激な相関は、機械学習とデータサイエンスにおける一般的な課題である。
過度に表現されていないクラスのインスタンス数を人工的に増加させるオーバーサンプリングは、これらの課題に対処するために広く採用されている。
我々は,大規模言語モデルの能力を活用して,少数グループを対象とした高品質な合成データを生成する,体系的なオーバーサンプリング手法であるOPALを紹介する。
論文 参考訳(メタデータ) (2024-06-05T21:24:26Z) - Let's Synthesize Step by Step: Iterative Dataset Synthesis with Large
Language Models by Extrapolating Errors from Small Models [69.76066070227452]
※データ合成*はラベル付きデータの少ない小さなモデルをトレーニングするための有望な方法です。
本稿では,この分散ギャップを縮めるデータ合成フレームワークであるStep* (**S3**) による合成ステップを提案する。
提案手法は,合成データセットと実データとのギャップを小さくすることで,小型モデルの性能を向上させる。
論文 参考訳(メタデータ) (2023-10-20T17:14:25Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Deceive D: Adaptive Pseudo Augmentation for GAN Training with Limited
Data [125.7135706352493]
GAN(Generative Adversarial Network)は、高忠実度画像を合成するために、訓練に十分なデータを必要とする。
近年の研究では、差別者の過度な適合により、限られたデータでGANを訓練することは困難であることが示されている。
本稿では,APA (Adaptive Pseudo Augmentation) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-11-12T18:13:45Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z) - Firearm Detection via Convolutional Neural Networks: Comparing a
Semantic Segmentation Model Against End-to-End Solutions [68.8204255655161]
武器の脅威検出とライブビデオからの攻撃的な行動は、潜在的に致命的な事故の迅速検出と予防に使用できる。
これを実現する一つの方法は、人工知能と、特に画像分析のための機械学習を使用することです。
従来のモノリシックなエンド・ツー・エンドのディープラーニングモデルと、セマンティクスセグメンテーションによって火花を検知する単純なニューラルネットワークのアンサンブルに基づく前述したモデルを比較した。
論文 参考訳(メタデータ) (2020-12-17T15:19:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。