論文の概要: CNS-Net: Conservative Novelty Synthesizing Network for Malware
Recognition in an Open-set Scenario
- arxiv url: http://arxiv.org/abs/2305.01236v1
- Date: Tue, 2 May 2023 07:31:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-03 15:03:49.013107
- Title: CNS-Net: Conservative Novelty Synthesizing Network for Malware
Recognition in an Open-set Scenario
- Title(参考訳): CNS-Net:オープンセットシナリオにおけるマルウェア認識のための保守的ノベルティ合成ネットワーク
- Authors: Jingcai Guo, Song Guo, Shiheng Ma, Yuxia Sun, Yuanyuan Xu
- Abstract要約: マルウェアオープンセット認識(MOSR)という,既知の未知の未知のマルウェア群と未知の未知のマルウェア群の両方に対するマルウェア認識の課題について検討する。
本稿では,未知のマルウェア群を模倣するマルウェアインスタンスを保存的に合成する新しいモデルを提案する。
我々はまた、大規模なオープンセットマルウェアベンチマークデータセットの欠如を埋めるために、MAL-100という新しい大規模マルウェアデータセットを構築した。
- 参考スコア(独自算出の注目度): 14.059646012441313
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the challenging task of malware recognition on both known and novel
unknown malware families, called malware open-set recognition (MOSR). Previous
works usually assume the malware families are known to the classifier in a
close-set scenario, i.e., testing families are the subset or at most identical
to training families. However, novel unknown malware families frequently emerge
in real-world applications, and as such, require to recognize malware instances
in an open-set scenario, i.e., some unknown families are also included in the
test-set, which has been rarely and non-thoroughly investigated in the
cyber-security domain. One practical solution for MOSR may consider jointly
classifying known and detecting unknown malware families by a single classifier
(e.g., neural network) from the variance of the predicted probability
distribution on known families. However, conventional well-trained classifiers
usually tend to obtain overly high recognition probabilities in the outputs,
especially when the instance feature distributions are similar to each other,
e.g., unknown v.s. known malware families, and thus dramatically degrades the
recognition on novel unknown malware families. In this paper, we propose a
novel model that can conservatively synthesize malware instances to mimic
unknown malware families and support a more robust training of the classifier.
Moreover, we also build a new large-scale malware dataset, named MAL-100, to
fill the gap of lacking large open-set malware benchmark dataset. Experimental
results on two widely used malware datasets and our MAL-100 demonstrate the
effectiveness of our model compared with other representative methods.
- Abstract(参考訳): 本研究では,既知の未知のマルウェア群と未知の未知のマルウェア群の両方に対するマルウェア認識の課題について検討した。
従来の研究では、マルウェアのファミリーは密集したシナリオで分類器として知られており、例えば、テストファミリーはサブセットであり、トレーニングファミリーとほとんど同じである。
しかし、新しい未知のマルウェアファミリーが現実世界のアプリケーションで頻繁に出現し、したがって、オープンセットのシナリオでマルウェアのインスタンスを認識する必要がある。
mosrの実用的な解決策の一つは、未知のマルウェアファミリーを単一の分類器(ニューラルネットワークなど)で分類し、既知の家族に対する予測確率分布の分散から分類することである。
しかし、従来のよく訓練された分類器は、特にインスタンスの特徴分布が未知のマルウェアファミリーと類似している場合、出力において過度に高い認識確率を得る傾向があるため、未知のマルウェアファミリーに対する認識は劇的に低下する。
本稿では,未知のマルウェア群を模倣するマルウェアインスタンスを保守的に合成し,分類器のより堅牢な訓練を支援する新しいモデルを提案する。
さらに,mal-100と呼ばれる新たな大規模マルウェアデータセットを構築し,大規模なオープンセットマルウェアベンチマークデータセットの欠如のギャップを埋める。
汎用マルウェアデータセット2セットとmal-100を用いた実験結果から,本モデルの有効性を他の代表的な手法と比較した。
関連論文リスト
- Catch'em all: Classification of Rare, Prominent, and Novel Malware Families [3.147175286021779]
マルウェアは依然として最も危険でコストのかかるサイバー脅威の1つだ。
昨年、13億の既知のマルウェアの標本が報告された。
これらの課題には、新しいマルウェアの検出と、クラス不均衡に直面してマルウェア分類を実行する能力が含まれる。
論文 参考訳(メタデータ) (2024-03-04T23:46:19Z) - Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.668411293817464]
業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。
学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。
利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文 参考訳(メタデータ) (2023-12-25T21:25:55Z) - EMBERSim: A Large-Scale Databank for Boosting Similarity Search in
Malware Analysis [48.5877840394508]
近年,定量化によるマルウェア検出から機械学習への移行が進んでいる。
本稿では、EMBERから始まるバイナリファイルの類似性研究の領域における欠陥に対処することを提案する。
我々は、EMBERに類似情報とマルウェアのクラスタグを付与し、類似性空間のさらなる研究を可能にする。
論文 参考訳(メタデータ) (2023-10-03T06:58:45Z) - Semi-supervised Classification of Malware Families Under Extreme Class Imbalance via Hierarchical Non-Negative Matrix Factorization with Automatic Model Selection [34.7994627734601]
マルウェアファミリーラベリングプロセスの初期段階で使用できる新しい階層型半教師付きアルゴリズムを提案する。
HNMFkでは、マルウェアデータの階層構造と半教師付き設定を併用し、極度のクラス不均衡の条件下でマルウェアファミリーを分類することができる。
我々のソリューションは、新しいマルウェアファミリーの同定において有望な結果をもたらす、断固とした予測または拒絶オプションを実行することができる。
論文 参考訳(メタデータ) (2023-09-12T23:45:59Z) - MDENet: Multi-modal Dual-embedding Networks for Malware Open-set
Recognition [17.027132477210092]
本稿では,MDENetと呼ばれるマルチモーダルデュアルエンベッドネットワークを提案する。
また、以前提案した大規模マルウェアデータセットであるMAL-100をマルチモーダル特性で強化する。
論文 参考訳(メタデータ) (2023-05-02T08:09:51Z) - DRSM: De-Randomized Smoothing on Malware Classifier Providing Certified
Robustness [58.23214712926585]
我々は,マルウェア検出領域の非ランダム化スムース化技術を再設計し,DRSM(De-Randomized Smoothed MalConv)を開発した。
具体的には,実行可能ファイルの局所構造を最大に保ちながら,逆数バイトの影響を確実に抑制するウィンドウアブレーション方式を提案する。
私たちは、マルウェア実行ファイルの静的検出という領域で、認証された堅牢性を提供する最初の人です。
論文 参考訳(メタデータ) (2023-03-20T17:25:22Z) - Mate! Are You Really Aware? An Explainability-Guided Testing Framework
for Robustness of Malware Detectors [49.34155921877441]
マルウェア検出装置のロバスト性を示すための説明可能性誘導型およびモデルに依存しないテストフレームワークを提案する。
次に、このフレームワークを使用して、操作されたマルウェアを検出する最先端のマルウェア検知器の能力をテストする。
我々の発見は、現在のマルウェア検知器の限界と、その改善方法に光を当てた。
論文 参考訳(メタデータ) (2021-11-19T08:02:38Z) - Task-Aware Meta Learning-based Siamese Neural Network for Classifying
Obfuscated Malware [5.293553970082943]
既存のマルウェア検出方法は、トレーニングデータセットに難読化されたマルウェアサンプルが存在する場合、異なるマルウェアファミリーを正しく分類できない。
そこで我々は,このような制御フロー難読化技術に対して耐性を持つ,タスク対応の複数ショット学習型サイメスニューラルネットワークを提案する。
提案手法は,同一のマルウェアファミリーに属するマルウェアサンプルを正しく分類し,ユニークなマルウェアシグネチャの認識に極めて有効である。
論文 参考訳(メタデータ) (2021-10-26T04:44:13Z) - Being Single Has Benefits. Instance Poisoning to Deceive Malware
Classifiers [47.828297621738265]
攻撃者は、マルウェア分類器を訓練するために使用されるデータセットをターゲットとした、高度で効率的な中毒攻撃を、どのように起動できるかを示す。
マルウェア検出領域における他の中毒攻撃とは対照的に、我々の攻撃はマルウェアファミリーではなく、移植されたトリガーを含む特定のマルウェアインスタンスに焦点を当てている。
我々は、この新たに発見された深刻な脅威に対する将来の高度な防御に役立つ包括的検出手法を提案する。
論文 参考訳(メタデータ) (2020-10-30T15:27:44Z) - Open Set Recognition with Conditional Probabilistic Generative Models [51.40872765917125]
オープンセット認識のための条件付き確率生成モデル(CPGM)を提案する。
CPGMは未知のサンプルを検出できるが、異なる潜在特徴を条件付きガウス分布に近似させることで、既知のクラスを分類できる。
複数のベンチマークデータセットの実験結果から,提案手法がベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2020-08-12T06:23:49Z) - DAEMON: Dataset-Agnostic Explainable Malware Classification Using
Multi-Stage Feature Mining [3.04585143845864]
マルウェア分類は、新しい悪意のある亜種が属する家族を決定するタスクである。
DAEMONは,データセットに依存しない新しいマルウェア分類ツールである。
論文 参考訳(メタデータ) (2020-08-04T21:57:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。