論文の概要: CNN-LSTM and Transfer Learning Models for Malware Classification based on Opcodes and API Calls
- arxiv url: http://arxiv.org/abs/2405.02548v1
- Date: Sat, 4 May 2024 03:13:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-07 19:30:33.343033
- Title: CNN-LSTM and Transfer Learning Models for Malware Classification based on Opcodes and API Calls
- Title(参考訳): OpcodeとAPIコールに基づくCNN-LSTMとマルウェア分類のための移動学習モデル
- Authors: Ahmed Bensaoud, Jugal Kalita,
- Abstract要約: アプリケーションプログラミングインタフェース(API)コールとオペコードに基づくマルウェア分類システムのための新しいモデルを提案する。
分類のためのWindowsマルウェアサンプルからオプコードシーケンスとAPIコールを抽出する。
9,749,57サンプルのデータセットに対する実験では,8グラムの配列を用いて99.91%の精度で得られた。
- 参考スコア(独自算出の注目度): 7.136205674624813
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a novel model for a malware classification system based on Application Programming Interface (API) calls and opcodes, to improve classification accuracy. This system uses a novel design of combined Convolutional Neural Network and Long Short-Term Memory. We extract opcode sequences and API Calls from Windows malware samples for classification. We transform these features into N-grams (N = 2, 3, and 10)-gram sequences. Our experiments on a dataset of 9,749,57 samples produce high accuracy of 99.91% using the 8-gram sequences. Our method significantly improves the malware classification performance when using a wide range of recent deep learning architectures, leading to state-of-the-art performance. In particular, we experiment with ConvNeXt-T, ConvNeXt-S, RegNetY-4GF, RegNetY-8GF, RegNetY-12GF, EfficientNetV2, Sequencer2D-L, Swin-T, ViT-G/14, ViT-Ti, ViT-S, VIT-B, VIT-L, and MaxViT-B. Among these architectures, Swin-T and Sequencer2D-L architectures achieved high accuracies of 99.82% and 99.70%, respectively, comparable to our CNN-LSTM architecture although not surpassing it.
- Abstract(参考訳): 本稿では,アプリケーションプログラミングインタフェース(API)コールとオプコードに基づくマルウェア分類システムの新しいモデルを提案し,分類精度を向上させる。
このシステムは畳み込みニューラルネットワークとLong Short-Term Memoryを組み合わせた新しい設計を用いる。
分類のためのWindowsマルウェアサンプルからオプコードシーケンスとAPIコールを抽出する。
これらの特徴を N-gram (N = 2, 3, 10)-gram 列に変換する。
9,749,57サンプルのデータセットに対する実験では,8グラムの配列を用いて99.91%の精度で得られた。
本手法は,近年のディープラーニングアーキテクチャを用いてマルウェア分類性能を大幅に向上させ,最先端性能を実現する。
特にConvNeXt-T, ConvNeXt-S, RegNetY-4GF, RegNetY-12GF, EfficientNetV2, Sequencer2D-L, Swin-T, ViT-G/14, ViT-Ti, ViT-S, VIT-B, VIT-L, MaxViT-Bを実験した。
これらのアーキテクチャのうち、Swin-TとSequencer2D-Lアーキテクチャは99.82%と99.70%という高い精度を達成した。
関連論文リスト
- Quasar-ViT: Hardware-Oriented Quantization-Aware Architecture Search for Vision Transformers [56.37495946212932]
視覚変換器(ViT)は、畳み込みニューラルネットワーク(CNN)と比較して、コンピュータビジョンタスクにおいて優れた精度を示す。
ハードウェア指向の量子化対応アーキテクチャ検索フレームワークであるQuasar-ViTを提案する。
論文 参考訳(メタデータ) (2024-07-25T16:35:46Z) - ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders [104.05133094625137]
完全畳み込み型マスク付きオートエンコーダフレームワークと,新たなグローバル応答正規化層を提案する。
この自己教師付き学習技術とアーキテクチャ改善の共設計により、純粋なConvNetの性能を大幅に向上させるConvNeXt V2と呼ばれる新しいモデルファミリが生まれる。
論文 参考訳(メタデータ) (2023-01-02T18:59:31Z) - Automatic Machine Learning for Multi-Receiver CNN Technology Classifiers [16.244541005112747]
畳み込みニューラルネットワーク(CNN)は、信号分類のための最も研究されているディープラーニングモデルの1つである。
我々は、複数の同期受信機から収集した生のI/Qサンプルに基づく技術分類に焦点を当てた。
論文 参考訳(メタデータ) (2022-04-28T23:41:38Z) - Improving Time Series Classification Algorithms Using
Octave-Convolutional Layers [0.0]
我々は,OctoConvとの畳み込みに代えて,時系列分類タスクの精度を大幅に向上させることを実験的に示した。
さらに、更新されたALSTM-OctFCNは、上位2つの時系列分類器と統計的に同一である。
論文 参考訳(メタデータ) (2021-09-28T13:12:09Z) - Greedy Network Enlarging [53.319011626986004]
本稿では,計算のリアルタイム化に基づくグリーディ・ネットワーク拡大手法を提案する。
異なる段階の計算をステップバイステップで修正することで、拡張されたネットワークはMACの最適な割り当てと利用を提供する。
GhostNetへの我々の手法の適用により、最先端の80.9%と84.3%のImageNet Top-1アキュラシーを実現する。
論文 参考訳(メタデータ) (2021-07-31T08:36:30Z) - Quantized Neural Networks via {-1, +1} Encoding Decomposition and
Acceleration [83.84684675841167]
本稿では,量子化されたニューラルネットワーク(QNN)をマルチブランチバイナリネットワークに分解するために,-1,+1を用いた新しい符号化方式を提案する。
本稿では,大規模画像分類,オブジェクト検出,セマンティックセグメンテーションにおける提案手法の有効性を検証する。
論文 参考訳(メタデータ) (2021-06-18T03:11:15Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - Improving Calibration for Long-Tailed Recognition [68.32848696795519]
このようなシナリオにおけるキャリブレーションとパフォーマンスを改善する2つの方法を提案します。
異なるサンプルによるデータセットバイアスに対して,シフトバッチ正規化を提案する。
提案手法は,複数の長尾認識ベンチマークデータセットに新しいレコードをセットする。
論文 参考訳(メタデータ) (2021-04-01T13:55:21Z) - NSGANetV2: Evolutionary Multi-Objective Surrogate-Assisted Neural
Architecture Search [22.848528877480796]
複数の競合対象下で競合するタスク固有モデルを生成するための効率的なNASアルゴリズムを提案する。
2つのサロゲートで構成され、1つはサンプル効率を改善するためにアーキテクチャレベルで、1つはスーパーネットを介して重量レベルで、勾配降下訓練効率を改善する。
提案手法の有効性と汎用性を6つの非標準データセットで示す。
論文 参考訳(メタデータ) (2020-07-20T18:30:11Z) - AutoFCL: Automatically Tuning Fully Connected Layers for Handling Small
Dataset [13.909484906513102]
提案したAutoFCLモデルは,ベイズ最適化を用いてCNNのFC層の構造を自動学習する。
新しく学習された(ターゲットに依存しない)FC層の微調整は、最先端のパフォーマンスをもたらす。
提案したAutoFCL法は,CalTech-101とOxford-102 Flowersデータセット上で既存の手法より優れている。
論文 参考訳(メタデータ) (2020-01-22T08:39:00Z) - Inferring Convolutional Neural Networks' accuracies from their
architectural characterizations [0.0]
CNNのアーキテクチャと性能の関係について検討する。
本稿では,2つのコンピュータビジョンに基づく物理問題において,その特性がネットワークの性能を予測できることを示す。
我々は機械学習モデルを用いて、トレーニング前にネットワークが一定のしきい値精度よりも優れた性能を発揮できるかどうかを予測する。
論文 参考訳(メタデータ) (2020-01-07T16:41:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。