論文の概要: A Comprehensive Study on Learning-Based PE Malware Family Classification
Methods
- arxiv url: http://arxiv.org/abs/2110.15552v1
- Date: Fri, 29 Oct 2021 05:32:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-01 15:33:53.561331
- Title: A Comprehensive Study on Learning-Based PE Malware Family Classification
Methods
- Title(参考訳): 学習型PEマルウェア家族分類法に関する総合的研究
- Authors: Yixuan Ma, Shuang Liu, Jiajun Jiang, Guanhong Chen, Keqiu Li
- Abstract要約: Portable Executable (PE) マルウェアは、ボリュームと洗練の両方の観点から一貫して進化してきた。
学習ベースのアルゴリズムを使用する3つの主流のアプローチは、各メソッドが取る入力形式によって分類される。
本研究では,4つの異なるデータセットと一貫した実験設定に基づいて,学習に基づくPEマルウェア分類手法の徹底的な実証的研究を行う。
- 参考スコア(独自算出の注目度): 9.142578100395909
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Driven by the high profit, Portable Executable (PE) malware has been
consistently evolving in terms of both volume and sophistication. PE malware
family classification has gained great attention and a large number of
approaches have been proposed. With the rapid development of machine learning
techniques and the exciting results they achieved on various tasks, machine
learning algorithms have also gained popularity in the PE malware family
classification task. Three mainstream approaches that use learning based
algorithms, as categorized by the input format the methods take, are
image-based, binary-based and disassembly-based approaches. Although a large
number of approaches are published, there is no consistent comparisons on those
approaches, especially from the practical industry adoption perspective.
Moreover, there is no comparison in the scenario of concept drift, which is a
fact for the malware classification task due to the fast evolving nature of
malware. In this work, we conduct a thorough empirical study on learning-based
PE malware classification approaches on 4 different datasets and consistent
experiment settings. Based on the experiment results and an interview with our
industry partners, we find that (1) there is no individual class of methods
that significantly outperforms the others; (2) All classes of methods show
performance degradation on concept drift (by an average F1-score of 32.23%);
and (3) the prediction time and high memory consumption hinder existing
approaches from being adopted for industry usage.
- Abstract(参考訳): 高い利益により、ポータブル実行可能(PE)マルウェアは、ボリュームと洗練の両面で一貫して進化してきた。
PEマルウェアファミリー分類は注目され、多くのアプローチが提案されている。
機械学習技術の急速な発展と、それらが様々なタスクで達成したエキサイティングな成果により、機械学習アルゴリズムはPEマルウェアファミリー分類タスクでも人気を集めている。
学習ベースのアルゴリズムを使用する3つの主流のアプローチは、各メソッドが取る入力形式によって分類される。
多数のアプローチが公表されているが、これらのアプローチについて、特に実践的な業界採用の観点から、一貫した比較は行われていない。
さらに, マルウェアの急激な進化により, マルウェア分類タスクの事実である, コンセプトドリフトのシナリオは比較されていない。
本研究では,4つの異なるデータセットと一貫した実験設定に基づいて,学習に基づくPEマルウェア分類手法の徹底的な実証的研究を行う。
実験結果と業界パートナーとのインタビューの結果から,(1)他よりも著しく優れた手法は存在しないこと,(2)コンセプトドリフトにおける性能低下(平均F1スコア32.23%)を示す手法がすべて存在すること,(3)予測時間と高メモリ消費により,既存の手法が産業利用に採用されなくなること,などが判明した。
関連論文リスト
- Preview-based Category Contrastive Learning for Knowledge Distillation [53.551002781828146]
知識蒸留(PCKD)のための新しい予見型カテゴリーコントラスト学習法を提案する。
まず、インスタンスレベルの特徴対応と、インスタンスの特徴とカテゴリ中心の関係の両方の構造的知識を蒸留する。
カテゴリ表現を明示的に最適化し、インスタンスとカテゴリの表現を明確に関連付けることができる。
論文 参考訳(メタデータ) (2024-10-18T03:31:00Z) - A Survey of Malware Detection Using Deep Learning [6.349503549199403]
本稿では,ディープラーニング(DL)を用いたWindows,iOS,Android,Linuxにおけるマルウェア検出の進歩について検討する。
本稿では,DL分類器を用いたマルウェア検出の問題点と課題について論じる。
各種データセットに対する8つの一般的なDLアプローチについて検討する。
論文 参考訳(メタデータ) (2024-07-27T02:49:55Z) - POGEMA: A Benchmark Platform for Cooperative Multi-Agent Navigation [76.67608003501479]
主評価指標の基礎に基づいて計算された領域関連メトリクスの範囲を定義する評価プロトコルを導入・指定する。
このような比較の結果は、様々な最先端のMARL、検索ベース、ハイブリッド手法を含むものである。
論文 参考訳(メタデータ) (2024-07-20T16:37:21Z) - Continual Learning with Pre-Trained Models: A Survey [61.97613090666247]
継続的な学習は、新しい知識を学ぶ際に、かつての知識の破滅的な忘れを克服することを目的としている。
本稿では, PTM を用いた CL の最近の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2024-01-29T18:27:52Z) - Malicious code detection in android: the role of sequence characteristics and disassembling methods [0.0]
本研究では,研究者が管理するモデルの精度に影響を及ぼす要因について検討・強調する。
その結果, 分解法と異なる入力表現がモデル結果に影響を及ぼすことが明らかとなった。
論文 参考訳(メタデータ) (2023-12-02T11:55:05Z) - Predicted Embedding Power Regression for Large-Scale Out-of-Distribution
Detection [77.1596426383046]
本研究では,学習過程において学習したラベル分布に基づいて,予測されたクラスラベルの確率を計算する手法を開発した。
提案手法は,計算コストの最小化のみで,現在の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2023-03-07T18:28:39Z) - Evaluating Machine Unlearning via Epistemic Uncertainty [78.27542864367821]
本研究では,不確実性に基づく機械学習アルゴリズムの評価を行う。
これは私たちの最良の知識の一般的な評価の最初の定義です。
論文 参考訳(メタデータ) (2022-08-23T09:37:31Z) - On the Limitations of Continual Learning for Malware Classification [18.567946765007658]
一般的なインクリメンタル学習シナリオをカバーする3つのマルウェアタスクに適用した11個のCL手法について検討した。
本研究では,バイナリマルウェア分類(Domain-IL)とマルチクラスマルウェアファミリー分類(Task-ILとClass-IL)の両方におけるCL手法の性能を評価する。
論文 参考訳(メタデータ) (2022-08-13T04:23:19Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z) - Fair Meta-Learning For Few-Shot Classification [7.672769260569742]
バイアスデータに基づいてトレーニングされた機械学習アルゴリズムは、不公平な予測を行う傾向がある。
本稿では,メタトレイン中のバイアスを効果的に軽減する,高速適応型数ショットメタラーニング手法を提案する。
提案手法は,モデル出力のバイアスを効果的に軽減し,不明瞭なタスクに対して精度と公平性の両方を一般化することを実証的に実証する。
論文 参考訳(メタデータ) (2020-09-23T22:33:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。