論文の概要: Classification and Online Clustering of Zero-Day Malware
- arxiv url: http://arxiv.org/abs/2305.00605v2
- Date: Thu, 3 Aug 2023 12:04:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-04 19:36:23.889726
- Title: Classification and Online Clustering of Zero-Day Malware
- Title(参考訳): ゼロデイマルウェアの分類とオンラインクラスタリング
- Authors: Olha Jure\v{c}kov\'a, Martin Jure\v{c}ek, Mark Stamp, Fabio Di Troia,
R\'obert L\'orencz
- Abstract要約: 本稿では,既存の家族に割り当てるために,あるいは新たな家族のサンプルをクラスタリングするために,入ってくる悪意のあるサンプルをオンラインに処理することに焦点を当てる。
マルチ層パーセプトロンの分類スコアに基づいて,どのサンプルを分類し,どのサンプルを新しいマルウェア群に分類するかを決定した。
- 参考スコア(独自算出の注目度): 4.409836695738518
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A large amount of new malware is constantly being generated, which must not
only be distinguished from benign samples, but also classified into malware
families. For this purpose, investigating how existing malware families are
developed and examining emerging families need to be explored. This paper
focuses on the online processing of incoming malicious samples to assign them
to existing families or, in the case of samples from new families, to cluster
them. We experimented with seven prevalent malware families from the EMBER
dataset, four in the training set and three additional new families in the test
set. Based on the classification score of the multilayer perceptron, we
determined which samples would be classified and which would be clustered into
new malware families. We classified 97.21% of streaming data with a balanced
accuracy of 95.33%. Then, we clustered the remaining data using a
self-organizing map, achieving a purity from 47.61% for four clusters to 77.68%
for ten clusters. These results indicate that our approach has the potential to
be applied to the classification and clustering of zero-day malware into
malware families.
- Abstract(参考訳): 大量の新しいマルウェアが常に生成され、良質なサンプルと区別されるだけでなく、マルウェアファミリーにも分類されなければならない。
この目的のために、既存のマルウェアファミリーがどのように発展し、新興家族を調べる必要がある。
本稿では,悪意のあるサンプルのオンライン処理を,既存の家族に割り当てたり,新たな家族からサンプルを収集してクラスタ化する。
EMBERデータセットから有望な7つのマルウェアファミリー,トレーニングセットの4つ,テストセットの3つの新たなファミリーを実験した。
マルチ層パーセプトロンの分類スコアに基づいて,どのサンプルを分類し,どのサンプルを新しいマルウェア群に分類するかを決定した。
ストリーミングデータの97.21%を95.33%の精度で分類した。
そして、残りのデータを自己組織化マップを用いてクラスタ化し、4つのクラスタで47.61%から10個のクラスタで77.68%まで純度を得た。
これらの結果から,本手法はゼロデイマルウェアの分類とクラスタリングに応用できる可能性が示唆された。
関連論文リスト
- Online Clustering of Known and Emerging Malware Families [1.2289361708127875]
マルウェアのサンプルを悪質な特徴に応じて分類することが不可欠である。
オンラインクラスタリングアルゴリズムは、マルウェアの振る舞いを理解し、新たな脅威に対する迅速な応答を生み出すのに役立ちます。
本稿では,悪意のあるサンプルをオンラインクラスタリングしてマルウェア群に分類する,新しい機械学習モデルを提案する。
論文 参考訳(メタデータ) (2024-05-06T09:20:17Z) - Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.668411293817464]
業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。
学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。
利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文 参考訳(メタデータ) (2023-12-25T21:25:55Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Semi-supervised Classification of Malware Families Under Extreme Class Imbalance via Hierarchical Non-Negative Matrix Factorization with Automatic Model Selection [34.7994627734601]
マルウェアファミリーラベリングプロセスの初期段階で使用できる新しい階層型半教師付きアルゴリズムを提案する。
HNMFkでは、マルウェアデータの階層構造と半教師付き設定を併用し、極度のクラス不均衡の条件下でマルウェアファミリーを分類することができる。
我々のソリューションは、新しいマルウェアファミリーの同定において有望な結果をもたらす、断固とした予測または拒絶オプションを実行することができる。
論文 参考訳(メタデータ) (2023-09-12T23:45:59Z) - CNS-Net: Conservative Novelty Synthesizing Network for Malware
Recognition in an Open-set Scenario [14.059646012441313]
マルウェアオープンセット認識(MOSR)という,既知の未知の未知のマルウェア群と未知の未知のマルウェア群の両方に対するマルウェア認識の課題について検討する。
本稿では,未知のマルウェア群を模倣するマルウェアインスタンスを保存的に合成する新しいモデルを提案する。
我々はまた、大規模なオープンセットマルウェアベンチマークデータセットの欠如を埋めるために、MAL-100という新しい大規模マルウェアデータセットを構築した。
論文 参考訳(メタデータ) (2023-05-02T07:31:42Z) - Clustering based opcode graph generation for malware variant detection [1.179179628317559]
マルウェア検出と家族帰属を行う手法を提案する。
提案手法はまず,各家庭のマルウェアからオプコードを取り出し,それぞれのオプコードグラフを構築する。
我々は,Opcodeグラフ上のクラスタリングアルゴリズムを用いて,同一のマルウェアファミリー内のマルウェアのクラスタを検出する。
論文 参考訳(メタデータ) (2022-11-18T06:12:33Z) - Cluster Analysis of Malware Family Relationships [4.111899441919165]
1家族当たり1000サンプルで20のマルウェアファミリーからなるデータセットを検討します。
我々は,家族のペアに基づいてクラスタリングを行い,その結果を用いて家族間の関係を判定する。
以上の結果から,K$-meansクラスタリングは,マルウェアの家族関係を探索するための強力なツールとなる可能性が示唆された。
論文 参考訳(メタデータ) (2021-03-07T14:51:01Z) - Deep Semi-Supervised Embedded Clustering (DSEC) for Stratification of
Heart Failure Patients [50.48904066814385]
本研究では、深層半教師付き組込みクラスタリングを用いて、心不全のデータ駆動型患者サブグループを決定する。
ヘテロジニアスデータから得られた組込み空間から臨床関連クラスタを見出した。
提案アルゴリズムは、異なる結果を持つ患者の新たな未診断サブグループを見つけることができる。
論文 参考訳(メタデータ) (2020-12-24T12:56:46Z) - Automatic sleep stage classification with deep residual networks in a
mixed-cohort setting [63.52264764099532]
我々は,大規模コホートの一般化性を評価するために,新しいディープニューラルネットワークモデルを開発した。
総合的な分類精度はトレーニングデータの分数を増やして向上した。
論文 参考訳(メタデータ) (2020-08-21T10:48:35Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。