論文の概要: Improving Android Malware Detection Through Data Augmentation Using
Wasserstein Generative Adversarial Networks
- arxiv url: http://arxiv.org/abs/2403.00890v2
- Date: Tue, 5 Mar 2024 14:33:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 11:28:14.369768
- Title: Improving Android Malware Detection Through Data Augmentation Using
Wasserstein Generative Adversarial Networks
- Title(参考訳): Wasserstein生成逆数ネットワークを用いたデータ拡張によるAndroidマルウェア検出の改善
- Authors: Kawana Stalin, Mikias Berhanu Mekoya
- Abstract要約: GAN(Generative Adversarial Networks)は、様々なアプリケーションにまたがる汎用性を実証している。
本研究は,GAN生成データを用いたAndroidマルウェア検出モデルのトレーニングの有効性について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative Adversarial Networks (GANs) have demonstrated their versatility
across various applications, including data augmentation and malware detection.
This research explores the effectiveness of utilizing GAN-generated data to
train a model for the detection of Android malware. Given the considerable
storage requirements of Android applications, the study proposes a method to
synthetically represent data using GANs, thereby reducing storage demands. The
proposed methodology involves creating image representations of features
extracted from an existing dataset. A GAN model is then employed to generate a
more extensive dataset consisting of realistic synthetic grayscale images.
Subsequently, this synthetic dataset is utilized to train a Convolutional
Neural Network (CNN) designed to identify previously unseen Android malware
applications. The study includes a comparative analysis of the CNN's
performance when trained on real images versus synthetic images generated by
the GAN. Furthermore, the research explores variations in performance between
the Wasserstein Generative Adversarial Network (WGAN) and the Deep
Convolutional Generative Adversarial Network (DCGAN). The investigation extends
to studying the impact of image size and malware obfuscation on the
classification model's effectiveness. The data augmentation approach
implemented in this study resulted in a notable performance enhancement of the
classification model, ranging from 1.5% to 7%, depending on the dataset. The
highest achieved F1 score reached 0.975.
Keywords--Generative Adversarial Networks, Android Malware, Data
Augmentation, Wasserstein Generative Adversarial Network
- Abstract(参考訳): Generative Adversarial Networks (GAN) は、データ拡張やマルウェア検出など、様々なアプリケーションでその汎用性を実証している。
本研究は,GAN生成データを用いたAndroidマルウェア検出モデルのトレーニングの有効性について検討する。
この研究は,Androidアプリケーションの相当なストレージ要件を考慮し,GANを用いてデータを合成的に表現し,ストレージ要求を低減させる手法を提案する。
提案手法では,既存のデータセットから抽出した特徴のイメージ表現を作成する。
GANモデルを使用して、現実的な合成グレースケール画像からなるより広範なデータセットを生成する。
その後、この合成データセットを使用して、これまで目に見えないAndroidマルウェアアプリケーションを特定するように設計された畳み込みニューラルネットワーク(CNN)をトレーニングする。
本研究は,ganが生成する合成画像と実画像で訓練したcnnの性能の比較分析を含む。
さらに,Wasserstein Generative Adversarial Network (WGAN)とDeep Convolutional Generative Adversarial Network (DCGAN)のパフォーマンスの変動について検討した。
この調査は、画像サイズとマルウェアの難読化が分類モデルの有効性に与える影響について研究している。
この研究で実装されたデータ拡張アプローチは、データセットに依存する1.5%から7%までの分類モデルの顕著な性能向上をもたらした。
F1の最高得点は0.975点に達した。
キーワード--生成型adversarial network、androidマルウェア、データ拡張、wasserstein生成型adversarial network
関連論文リスト
- GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross
Appearance-Edge Learning [49.93362169016503]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - ADASR: An Adversarial Auto-Augmentation Framework for Hyperspectral and
Multispectral Data Fusion [54.668445421149364]
HSI(Deep Learning-based Hyperspectral Image)は、HSI(Hyperspectral Image)とMSI(Multispectral Image)を深層ニューラルネットワーク(DNN)に融合させることにより、高空間分解能HSI(HR-HSI)を生成することを目的としている。
本稿では, HSI-MSI 融合のためのデータ多様性を向上するために, HSI-MSI サンプルペアの自動最適化と拡張を行う新しい逆自動データ拡張フレームワーク ADASR を提案する。
論文 参考訳(メタデータ) (2023-10-11T07:30:37Z) - Generative Adversarial Networks for Data Augmentation [0.0]
GANは、データ拡張、画像生成、ドメイン適応など、さまざまなタスクで医療画像解析に利用されてきた。
GANは利用可能なデータセットを増やすために使用できる合成サンプルを生成することができる。
医用画像におけるGANの使用は, 画像が高品質で, 臨床現場での使用に適していることを保証するために, 依然として研究の活発な領域である点に留意する必要がある。
論文 参考訳(メタデータ) (2023-06-03T06:33:33Z) - How far generated data can impact Neural Networks performance? [2.578242050187029]
ニューラルネットワークの性能向上において、生成したデータが実際のデータにどの程度役立つかを検討する。
実験の結果,実データに対する5倍の合成データが精度16%向上することが判明した。
論文 参考訳(メタデータ) (2023-03-27T14:02:43Z) - Intriguing Property and Counterfactual Explanation of GAN for Remote
Sensing Image Generation [16.05744622269697]
GAN(Generative Adversarial Network)は、自然画像の分野で顕著な進歩を遂げている。
GANモデルは、自然な画像生成よりも、RS画像生成のためのトレーニングデータのサイズに敏感である。
本稿では,一様正則化(UR)とエントロピー正則化(ER)という2つの革新的な調整手法を提案する。
論文 参考訳(メタデータ) (2023-03-09T13:22:50Z) - An Adversarial Active Sampling-based Data Augmentation Framework for
Manufacturable Chip Design [55.62660894625669]
リソグラフィーモデリングは、チップ設計マスクが製造可能であることを保証するため、チップ設計において重要な問題である。
機械学習の最近の進歩は、時間を要するリソグラフィーシミュレーションをディープニューラルネットワークに置き換えるための代替ソリューションを提供している。
本稿では,限られたデータのジレンマを解消し,機械学習モデルの性能を向上させるために,データ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-27T20:53:39Z) - Generative Adversarial Networks for Data Generation in Structural Health
Monitoring [0.8250374560598496]
AIでは、機械学習(ML)とディープラーニング(DL)アルゴリズムは、トレーニングに多くのデータセットを必要とする。
SHMアプリケーションでは、センサを介して土木構造物からデータを収集することは高価であり、有用なデータ(損傷関連データ)を得ることは困難である。
本稿では, DLやMLに基づく損傷診断において不十分なデータに対して, 1次元WDCGAN-GPがトレーニング対象モデルのデータを生成可能であることを示す。
論文 参考訳(メタデータ) (2021-12-07T03:39:31Z) - Convolutional generative adversarial imputation networks for
spatio-temporal missing data in storm surge simulations [86.5302150777089]
GAN(Generative Adversarial Imputation Nets)とGANベースの技術は、教師なし機械学習手法として注目されている。
提案手法を Con Conval Generative Adversarial Imputation Nets (Conv-GAIN) と呼ぶ。
論文 参考訳(メタデータ) (2021-11-03T03:50:48Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z) - Generative Adversarial Networks (GANs): An Overview of Theoretical
Model, Evaluation Metrics, and Recent Developments [9.023847175654602]
GAN(Generative Adversarial Network)は,大規模データ分散のサンプルを作成する上で有効な手法である。
GANはラベル付きトレーニングデータを広く使用せずにディープ表現を学習する適切な方法を提供する。
GANでは、ジェネレータと識別器のネットワークを同時にトレーニングする競合プロセスを通じて生成モデルを推定する。
論文 参考訳(メタデータ) (2020-05-27T05:56:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。