論文の概要: Enhancing Malware Detection with Generative AI: Using Variational Autoencoders to Boost Machine Learning Classifiers' Performance
- arxiv url: http://arxiv.org/abs/2606.06501v1
- Date: Sun, 17 May 2026 05:14:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.652211
- Title: Enhancing Malware Detection with Generative AI: Using Variational Autoencoders to Boost Machine Learning Classifiers' Performance
- Title(参考訳): 生成AIによるマルウェア検出の強化:変分オートエンコーダを用いた機械学習分類器の性能向上
- Authors: Mohammad Alharbi, Jeremy Straub,
- Abstract要約: 本稿では,生成人工知能モデルを用いたマルウェア検出手法を提案する。
提案手法は、VAEを用いて、現実世界のマルウェアデータを忠実に模倣する高品質な多様な合成データセットを作成する。
その結果,拡張データセットを用いてトレーニングした場合,分類器の精度,精度,リコール,F1スコアが顕著に改善された。
- 参考スコア(独自算出の注目度): 0.5156484100374058
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The advancement of malware poses obstacles for cybersecurity, necessitating the development of advanced detection techniques. This paper proposes an approach to enhance malware detection through the use of a generative artificial intelligence model. Specifically, variational autoencoders (VAEs) are used with the random forest, XGBoost and sequential model machine learning classifiers. Generated synthetic malware samples are used to address the critical issue of data scarcity for new or less common malware types. This approach can be used to augment datasets to improve classifier robustness. The proposed methodology uses VAEs to create high-quality diverse synthetic datasets that closely mimic real-world malware data. The effectiveness of these augmented datasets is evaluated by comparing the performance of the machine learning classifiers when they are trained with the original data and when they are trained with the synthetic data-augmented datasets. The results demonstrate a notable improvement in the accuracy, precision, recall and F1-scores of the classifiers, when they are trained using the augmented datasets. The enhanced performance for detecting various malware classes shows the potential of this approach to facilitate adaptation to evolving malware threats effectively. This work demonstrates the utility of generative AI for cybersecurity. It also provides a foundation for future research aimed at developing more resilient and adaptive malware detection systems.
- Abstract(参考訳): マルウェアの進化はサイバーセキュリティの障害となり、高度な検出技術の開発を必要としている。
本稿では,生成人工知能モデルを用いたマルウェア検出手法を提案する。
具体的には、変分オートエンコーダ(VAE)はランダムフォレスト、XGBoost、シーケンシャルモデル機械学習分類器で使用される。
生成した合成マルウェアサンプルは、新しいまたはあまり一般的なマルウェアのデータの不足に対処するために使用される。
このアプローチは、データセットを拡張して分類器の堅牢性を改善するために使用することができる。
提案手法は、VAEを用いて、現実世界のマルウェアデータを忠実に模倣する高品質な多様な合成データセットを作成する。
これらの強化データセットの有効性は、原データでトレーニングされた機械学習分類器のパフォーマンスと、合成されたデータセットでトレーニングされた機械学習分類器のパフォーマンスを比較して評価する。
その結果,拡張データセットを用いてトレーニングした場合,分類器の精度,精度,リコール,F1スコアが顕著に改善された。
様々なマルウェアクラスを検出するための性能向上は、進化するマルウェアの脅威への適応を効果的に促進するためのこのアプローチの可能性を示している。
この研究は、サイバーセキュリティのための生成AIの有用性を実証する。
また、よりレジリエントで適応的なマルウェア検出システムを開発することを目的とした将来の研究の基盤も提供する。
関連論文リスト
- Generating Synthetic Malware Samples Using Generative AI [5.191851016078567]
そこで我々は,不均衡なマルウェアデータセットを増大させるために,合成マルウェアサンプルを生成する新しいシステムを提案する。
実験結果から, 学習データを合成データで強化することで, マイノリティの分類性能が著しく向上することが示された。
論文 参考訳(メタデータ) (2026-04-23T21:33:05Z) - Understanding AI Methods for Intrusion Detection and Cryptographic Leakage [42.8384136157456]
機械学習技術が悪意あるネットワーク活動を検知し、暗号実装における潜在的な情報漏洩を特定する方法について評価する。
この結果から,安定したネットワーク環境下でのAIモデルによるほぼ完璧な検出精度が得られた。
また、学習したモデルがサイドチャネルリークと整合したパターンを識別し、AIが実装レベルの脆弱性を明らかにするのに役立つことを示唆した。
論文 参考訳(メタデータ) (2026-03-26T18:42:57Z) - CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing [51.56484100374058]
CLAIREは、教師なしの深層表現学習と、スマート製造システムにおけるインテリジェントな品質管理のための教師付き分類を統合したハイブリッドエンドツーエンド学習フレームワークである。
最適化されたディープオートエンコーダを使用して、生の入力をコンパクトな潜伏空間に変換し、不適切な特徴やノイズを抑えながら本質的なデータ構造を効果的にキャプチャする。
提案したフレームワークは、堅牢な障害検出のために、説明可能なAIと機能認識の正規化を統合する可能性を強調している。
論文 参考訳(メタデータ) (2026-03-06T15:11:58Z) - Synthetic Data: AI's New Weapon Against Android Malware [0.0]
攻撃者は人工知能を使って、従来の検出技術を回避できる高度なマルウェアのバリエーションを作成している。
MalSynGenは、条件付き生成逆数ネットワーク(cGAN)を使用して合成データを生成する、Malware Synthetic Data Generation方法論である。
このデータは,実世界のデータの統計特性を保存し,Androidマルウェア分類器の性能を向上させる。
論文 参考訳(メタデータ) (2025-11-24T19:27:58Z) - Enhancing Feature Selection and Interpretability in AI Regression Tasks Through Feature Attribution [38.53065398127086]
本研究では、回帰問題に対する入力データの非形式的特徴をフィルタリングする特徴属性法の可能性について検討する。
我々は、初期データ空間から最適な変数セットを選択するために、統合グラディエントとk平均クラスタリングを組み合わせた機能選択パイプラインを導入する。
提案手法の有効性を検証するため, ターボ機械の開発過程における羽根振動解析を実世界の産業問題に適用した。
論文 参考訳(メタデータ) (2024-09-25T09:50:51Z) - Leveraging LSTM and GAN for Modern Malware Detection [0.4799822253865054]
本稿では,マルウェア検出精度と速度を向上するために,ディープラーニングモデル,LSTMネットワーク,GAN分類器の利用を提案する。
研究結果は98%の精度で行われ、ディープラーニングの効率が積極的なサイバーセキュリティ防衛において決定的な役割を担っていることを示している。
論文 参考訳(メタデータ) (2024-05-07T14:57:24Z) - Comprehensive evaluation of Mal-API-2019 dataset by machine learning in malware detection [0.5475886285082937]
本研究では,機械学習技術を用いたマルウェア検出の徹底的な検討を行う。
その目的は、脅威をより効果的に識別し緩和することで、サイバーセキュリティの能力を向上させることである。
論文 参考訳(メタデータ) (2024-03-04T17:22:43Z) - DiffusionEngine: Diffusion Model is Scalable Data Engine for Object
Detection [41.436817746749384]
Diffusion Modelはオブジェクト検出のためのスケーラブルなデータエンジンである。
DiffusionEngine(DE)は、高品質な検出指向のトレーニングペアを単一のステージで提供する。
論文 参考訳(メタデータ) (2023-09-07T17:55:01Z) - Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。
提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文 参考訳(メタデータ) (2021-03-23T19:45:26Z) - Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。
ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文 参考訳(メタデータ) (2021-03-08T10:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。