論文の概要: A Natural Language Processing Approach to Malware Classification
- arxiv url: http://arxiv.org/abs/2307.11032v1
- Date: Fri, 7 Jul 2023 23:16:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-23 11:09:56.803443
- Title: A Natural Language Processing Approach to Malware Classification
- Title(参考訳): 自然言語処理によるマルウェア分類
- Authors: Ritik Mehta and Olha Jure\v{c}kov\'a and Mark Stamp
- Abstract要約: 本研究では,ハイドデンマルコフモデル (HMM) をオプコードシーケンスで訓練するハイブリッドアーキテクチャについて考察する。
HMMの隠された状態列を抽出することは、機能工学の一形態と見なすことができる。
このNLPベースのアプローチは、他の一般的なテクニックよりも優れていることが分かりました。
- 参考スコア(独自算出の注目度): 2.707154152696381
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many different machine learning and deep learning techniques have been
successfully employed for malware detection and classification. Examples of
popular learning techniques in the malware domain include Hidden Markov Models
(HMM), Random Forests (RF), Convolutional Neural Networks (CNN), Support Vector
Machines (SVM), and Recurrent Neural Networks (RNN) such as Long Short-Term
Memory (LSTM) networks. In this research, we consider a hybrid architecture,
where HMMs are trained on opcode sequences, and the resulting hidden states of
these trained HMMs are used as feature vectors in various classifiers. In this
context, extracting the HMM hidden state sequences can be viewed as a form of
feature engineering that is somewhat analogous to techniques that are commonly
employed in Natural Language Processing (NLP). We find that this NLP-based
approach outperforms other popular techniques on a challenging malware dataset,
with an HMM-Random Forrest model yielding the best results.
- Abstract(参考訳): 多くの異なる機械学習とディープラーニング技術がマルウェアの検出と分類に成功している。
マルウェア領域における一般的な学習技術としては、HMM(Hidden Markov Models)、RF(Random Forests)、CNN(Convolutional Neural Networks)、SVM(Support Vector Machines)、Long Short-Term Memory(LSTM)ネットワークのようなリカレントニューラルネットワーク(Recurrent Neural Networks)などがある。
本研究では,HMMがオプコードシーケンスで訓練されるハイブリッドアーキテクチャについて考察し,これらの訓練されたHMMの隠れ状態は,様々な分類器の特徴ベクトルとして使用される。
この文脈では、HMM隠れ状態列を抽出することは、自然言語処理(NLP)で一般的に用いられる技術と幾分類似した特徴工学の一形態と見なすことができる。
このNLPベースのアプローチは、HMM-Random Forrestモデルが最良の結果をもたらすため、挑戦的なマルウェアデータセット上で、他の一般的なテクニックよりも優れています。
関連論文リスト
- Enhancing Malware Detection by Integrating Machine Learning with Cuckoo
Sandbox [0.0]
本研究の目的は,APIコールシーケンスを含むデータセットから抽出されたマルウェアを分類し,同定することである。
ディープラーニングと機械学習の両方のアルゴリズムは、極めて高いレベルの精度を実現し、特定のケースでは最大99%に達する。
論文 参考訳(メタデータ) (2023-11-07T22:33:17Z) - Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - How neural networks learn to classify chaotic time series [77.34726150561087]
本研究では,通常の逆カオス時系列を分類するために訓練されたニューラルネットワークの内部動作について検討する。
入力周期性とアクティベーション周期の関係は,LKCNNモデルの性能向上の鍵となる。
論文 参考訳(メタデータ) (2023-06-04T08:53:27Z) - Intelligence Processing Units Accelerate Neuromorphic Learning [52.952192990802345]
スパイキングニューラルネットワーク(SNN)は、エネルギー消費と遅延の観点から、桁違いに改善されている。
我々は、カスタムSNN PythonパッケージsnnTorchのIPU最適化リリースを提示する。
論文 参考訳(メタデータ) (2022-11-19T15:44:08Z) - Concurrent Neural Tree and Data Preprocessing AutoML for Image
Classification [0.5735035463793008]
現在のSOTA (State-of-the-art) には、アルゴリズム検索空間の一部として入力データを操作するための従来の手法は含まれていない。
進化的多目的アルゴリズム設計エンジン(EMADE, Evolutionary Multi-objective Algorithm Design Engine)は、従来の機械学習手法のための多目的進化的検索フレームワークである。
CIFAR-10画像分類ベンチマークデータセットにおいて,これらの手法を検索空間の一部として含めることで,性能向上の可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-25T20:03:09Z) - Low-bit Quantization of Recurrent Neural Network Language Models Using
Alternating Direction Methods of Multipliers [67.688697838109]
本稿では、乗算器の交互方向法(ADMM)を用いて、スクラッチから量子化RNNLMを訓練する新しい手法を提案する。
2つのタスクの実験から、提案されたADMM量子化は、完全な精度ベースライン RNNLM で最大31倍のモデルサイズ圧縮係数を達成したことが示唆された。
論文 参考訳(メタデータ) (2021-11-29T09:30:06Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Malware Classification with Word Embedding Features [6.961253535504979]
現代のマルウェア分類技術は、オプコードシーケンスなどの機能でトレーニングできる機械学習モデルに依存しています。
我々は、隠れマルコフモデルをトレーニングすることで特徴ベクトルを設計するハイブリッド機械学習手法を実装した。
さまざまなマルウェアファミリーについて実質的な実験を行っています。
論文 参考訳(メタデータ) (2021-03-03T21:57:11Z) - Introducing the Hidden Neural Markov Chain framework [7.85426761612795]
本稿では,ニューラルモデルの新しいファミリーであるHNMC(Hidden Neural Markov Chain)フレームワークを提案する。
クラシックなHNMC、HNMC2、HNMC-CNの3つのモデルを提案します。
この新しいニューラルネットワークシーケンシャルフレームワークの可能性を示すもので、新しいモデルへの道を開き、最終的には一般的なBiLSTMやBiGRUと競合する可能性がある。
論文 参考訳(メタデータ) (2021-02-17T20:13:45Z) - A Convolutional Deep Markov Model for Unsupervised Speech Representation
Learning [32.59760685342343]
確率的潜在変数モデルは、音声からの言語表現学習のための自己教師付き学習アプローチの代替を提供する。
本研究では,深いニューラルネットワークによってモデル化された非線形放出と遷移関数を持つガウス状態空間モデルであるConvDMMを提案する。
大規模音声データセット(LibriSpeech)で訓練すると、ConvDMMは複数の自己教師付き特徴抽出法よりもはるかに優れた特徴を生成する。
論文 参考訳(メタデータ) (2020-06-03T21:50:20Z) - The Microsoft Toolkit of Multi-Task Deep Neural Networks for Natural
Language Understanding [97.85957811603251]
MT-DNNはオープンソースの自然言語理解(NLU)ツールキットであり、研究者や開発者がカスタマイズされたディープラーニングモデルを訓練しやすくする。
PyTorchとTransformersをベースとして開発されたMT-DNNは、幅広いNLUタスクの迅速なカスタマイズを容易にするように設計されている。
MT-DNNのユニークな特徴は、対戦型マルチタスク学習パラダイムを用いた堅牢で移動可能な学習のサポートである。
論文 参考訳(メタデータ) (2020-02-19T03:05:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。