論文の概要: Malware Classification Leveraging NLP & Machine Learning for Enhanced Accuracy
- arxiv url: http://arxiv.org/abs/2506.16224v1
- Date: Thu, 19 Jun 2025 11:32:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.042968
- Title: Malware Classification Leveraging NLP & Machine Learning for Enhanced Accuracy
- Title(参考訳): 精度向上のためのNLPと機械学習を活用したマルウェア分類
- Authors: Bishwajit Prasad Gond, Rajneekant, Pushkar Kishore, Durga Prasad Mohapatra,
- Abstract要約: 本稿では,NLPを用いたn-gram解析と機械学習によるマルウェア分類の強化について検討する。
n-gramアプローチを実装することで、さまざまな機械学習アルゴリズムで99.02%の精度を実現しました。
- 参考スコア(独自算出の注目度): 0.7999703756441756
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper investigates the application of natural language processing (NLP)-based n-gram analysis and machine learning techniques to enhance malware classification. We explore how NLP can be used to extract and analyze textual features from malware samples through n-grams, contiguous string or API call sequences. This approach effectively captures distinctive linguistic patterns among malware and benign families, enabling finer-grained classification. We delve into n-gram size selection, feature representation, and classification algorithms. While evaluating our proposed method on real-world malware samples, we observe significantly improved accuracy compared to the traditional methods. By implementing our n-gram approach, we achieved an accuracy of 99.02% across various machine learning algorithms by using hybrid feature selection technique to address high dimensionality. Hybrid feature selection technique reduces the feature set to only 1.6% of the original features.
- Abstract(参考訳): 本稿では,NLPを用いたn-gram解析と機械学習によるマルウェア分類の強化について検討する。
我々はNLPを用いて,n-grams,contiguous string,APIコールシーケンスを通じて,マルウェアサンプルからテキストの特徴を抽出し,解析する方法について検討する。
このアプローチは、マルウェアや良性家族の間で特徴的な言語パターンを効果的に捉え、よりきめ細かい分類を可能にする。
n-gramサイズ選択、特徴表現、分類アルゴリズムについて検討する。
提案手法を実世界のマルウェアサンプルで評価しながら,従来の方法に比べて精度が有意に向上した。
n-gramアプローチを実装することで、高次元に対処するためにハイブリッド特徴選択技術を用いて、さまざまな機械学習アルゴリズムで99.02%の精度を実現した。
ハイブリッド機能選択技術は、機能セットを元の機能の1.6%に減らす。
関連論文リスト
- OpCode-Based Malware Classification Using Machine Learning and Deep Learning Techniques [0.0]
本報告では,OpCodeシークエンスを用いたマルウェア分類の包括的解析を行う。
Support Vector Machine(SVM)を用いたn-gram解析を用いた従来の機械学習、K-Nearest Neighbors(KNN)、Decision Tree分類器、畳み込みニューラルネットワーク(CNN)を用いたディープラーニングアプローチの2つのアプローチが評価されている。
論文 参考訳(メタデータ) (2025-04-18T02:09:57Z) - k-fold Subsampling based Sequential Backward Feature Elimination [11.640238391159118]
このアルゴリズムはフィルタとラッパー法の利点を組み合わせたハイブリッドな特徴選択手法である。
SVM分類器の検出速度は50%以上向上し、検出精度は最大2%向上する。
また, このアルゴリズムは, 変形可能な部品モデルで導入された等価システムよりも約9%の精度で性能を向上する。
論文 参考訳(メタデータ) (2025-03-14T23:10:08Z) - Provably Efficient Representation Learning with Tractable Planning in
Low-Rank POMDP [81.00800920928621]
部分的に観測可能なマルコフ決定過程(POMDP)における表現学習の研究
まず,不確実性(OFU)に直面した最大推定(MLE)と楽観性を組み合わせた復調性POMDPのアルゴリズムを提案する。
次に、このアルゴリズムをより広範な$gamma$-observable POMDPのクラスで機能させる方法を示す。
論文 参考訳(メタデータ) (2023-06-21T16:04:03Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Towards Diverse Evaluation of Class Incremental Learning: A Representation Learning Perspective [67.45111837188685]
クラスインクリメンタル学習(CIL)アルゴリズムは、インクリメンタルに到着したデータから新しいオブジェクトクラスを継続的に学習することを目的としている。
表現学習における様々な評価プロトコルを用いて,CILアルゴリズムによって訓練されたニューラルネットワークモデルを実験的に解析する。
論文 参考訳(メタデータ) (2022-06-16T11:44:11Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - A concise method for feature selection via normalized frequencies [0.0]
本稿では,普遍的特徴選択のための簡潔な手法を提案する。
提案手法は, フィルタ法とラッパー法を融合して行う。
評価結果から,提案手法は,精度,精度,リコール,Fスコア,AUCの点で,いくつかの最先端技術に優れた性能を示した。
論文 参考訳(メタデータ) (2021-06-10T15:29:54Z) - Hybrid Method Based on NARX models and Machine Learning for Pattern
Recognition [0.0]
本研究は,機械学習とシステム識別の方法論を統合した新しい手法を提案する。
本手法の効率は,機械学習におけるケーススタディにより検証され,古典的分類アルゴリズムと比較して絶対的な結果が得られた。
論文 参考訳(メタデータ) (2021-06-08T00:17:36Z) - Optimizing Speech Emotion Recognition using Manta-Ray Based Feature
Selection [1.4502611532302039]
既存の特徴抽出手法を用いて抽出した特徴の連結により,分類精度が向上することを示す。
また,音声感情認識タスクにおけるマンタレイ最適化の新たな応用を行い,その結果を得た。
論文 参考訳(メタデータ) (2020-09-18T16:09:34Z) - Information Theoretic Meta Learning with Gaussian Processes [74.54485310507336]
情報理論の概念,すなわち相互情報と情報のボトルネックを用いてメタ学習を定式化する。
相互情報に対する変分近似を用いることで、メタ学習のための汎用的かつトラクタブルな枠組みを導出する。
論文 参考訳(メタデータ) (2020-09-07T16:47:30Z) - Strong Generalization and Efficiency in Neural Programs [69.18742158883869]
本稿では,ニューラルプログラム誘導の枠組みを強く一般化する効率的なアルゴリズムを学習する問題について検討する。
ニューラルネットワークの入力/出力インターフェースを慎重に設計し、模倣することで、任意の入力サイズに対して正しい結果を生成するモデルを学ぶことができる。
論文 参考訳(メタデータ) (2020-07-07T17:03:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。