論文の概要: An Ensemble of Pre-trained Transformer Models For Imbalanced Multiclass
Malware Classification
- arxiv url: http://arxiv.org/abs/2112.13236v1
- Date: Sat, 25 Dec 2021 13:40:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-29 08:12:14.511378
- Title: An Ensemble of Pre-trained Transformer Models For Imbalanced Multiclass
Malware Classification
- Title(参考訳): 不均衡マルチクラスマルウェア分類のための事前学習トランスフォーマーモデルのアンサンブル
- Authors: Ferhat Demirk{\i}ran, Aykut \c{C}ay{\i}r, U\u{g}ur \"Unal, Hasan
Da\u{g}
- Abstract要約: マルウェアによって生成されるAPI呼び出しシーケンスは、マルウェア分類のための機械学習モデルやディープラーニングモデルによって広く利用されている。
従来の機械学習モデルとディープラーニングモデルは、API呼び出し間のシーケンス関係をキャプチャできないままです。
実験により, 1つのトランスブロック層を有するトランスモデルが, 広く使用されているベースアーキテクチャ, LSTMを超越したことを示す。
BERTまたはCANINE(事前訓練されたトランスフォーマーモデル)は、評価指標、F1スコア、AUCスコアに基づいて、高度に不均衡なマルウェアファミリーを分類する上で優れていた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classification of malware families is crucial for a comprehensive
understanding of how they can infect devices, computers, or systems. Thus,
malware identification enables security researchers and incident responders to
take precautions against malware and accelerate mitigation. API call sequences
made by malware are widely utilized features by machine and deep learning
models for malware classification as these sequences represent the behavior of
malware. However, traditional machine and deep learning models remain incapable
of capturing sequence relationships between API calls. On the other hand, the
transformer-based models process sequences as a whole and learn relationships
between API calls due to multi-head attention mechanisms and positional
embeddings. Our experiments demonstrate that the transformer model with one
transformer block layer surpassed the widely used base architecture, LSTM.
Moreover, BERT or CANINE, pre-trained transformer models, outperformed in
classifying highly imbalanced malware families according to evaluation metrics,
F1-score, and AUC score. Furthermore, the proposed bagging-based random
transformer forest (RTF), an ensemble of BERT or CANINE, has reached the
state-of-the-art evaluation scores on three out of four datasets, particularly
state-of-the-art F1-score of 0.6149 on one of the commonly used benchmark
dataset.
- Abstract(参考訳): マルウェアファミリーの分類は、デバイス、コンピュータ、システムにどのように感染するかを包括的に理解するために重要である。
これにより、セキュリティ研究者やインシデント対応者がマルウェアを予防し、緩和を加速することができる。
マルウェアによるAPI呼び出しシーケンスは、マルウェアの振る舞いを表すため、マルウェア分類のための機械学習モデルやディープラーニングモデルによって広く利用されている。
しかし、従来の機械学習とディープラーニングモデルは、api呼び出し間のシーケンス関係をキャプチャできないままである。
一方,変換器をベースとしたモデルではシーケンス全体を処理し,マルチヘッドアテンション機構と位置埋め込みによるAPI呼び出し間の関係を学習する。
実験により, 1つのトランスブロック層を有するトランスモデルが, 広く使用されているベースアーキテクチャLSTMを超越したことを示す。
さらに、評価指標、f1-score、aucスコアによって高度に不均衡なマルウェアファミリーの分類において、bertまたはcanineが事前学習したトランスフォーマーモデルよりも優れている。
さらに, bert または canine のアンサンブルであるbagging-based random transformer forest (rtf) は, 4つのデータセットのうち3つ, 特に, ベンチマークデータセットの1つで 0.6149 の最先端評価点に達した。
関連論文リスト
- Toward Multi-class Anomaly Detection: Exploring Class-aware Unified Model against Inter-class Interference [67.36605226797887]
統一型異常検出(MINT-AD)のためのマルチクラスインプリシトニューラル表現変換器を提案する。
マルチクラス分布を学習することにより、モデルが変換器デコーダのクラス対応クエリ埋め込みを生成する。
MINT-ADは、カテゴリと位置情報を特徴埋め込み空間に投影することができ、さらに分類と事前確率損失関数によって監督される。
論文 参考訳(メタデータ) (2024-03-21T08:08:31Z) - Semi-supervised Classification of Malware Families Under Extreme Class Imbalance via Hierarchical Non-Negative Matrix Factorization with Automatic Model Selection [34.7994627734601]
マルウェアファミリーラベリングプロセスの初期段階で使用できる新しい階層型半教師付きアルゴリズムを提案する。
HNMFkでは、マルウェアデータの階層構造と半教師付き設定を併用し、極度のクラス不均衡の条件下でマルウェアファミリーを分類することができる。
我々のソリューションは、新しいマルウェアファミリーの同定において有望な結果をもたらす、断固とした予測または拒絶オプションを実行することができる。
論文 参考訳(メタデータ) (2023-09-12T23:45:59Z) - STMT: A Spatial-Temporal Mesh Transformer for MoCap-Based Action Recognition [50.064502884594376]
本研究では、モーションキャプチャー(MoCap)シーケンスを用いた人間の行動認識の問題点について検討する。
メッシュシーケンスを直接モデル化する新しい時空間メッシュ変換器(STMT)を提案する。
提案手法は,スケルトンベースモデルやポイントクラウドベースモデルと比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-03-31T16:19:27Z) - Reliable Malware Analysis and Detection using Topology Data Analysis [12.031113181911627]
マルウェアはますます複雑になり、さまざまなインフラストラクチャや個人用デバイスをターゲットにしたネットワークに広まっている。
マルウェアを防御するために、最近の研究はシグネチャと機械学習に基づく異なるテクニックを提案している。
論文 参考訳(メタデータ) (2022-11-03T00:46:52Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - Self-Supervised Vision Transformers for Malware Detection [0.0]
本稿では、視覚変換器(ViT)アーキテクチャに基づくマルウェア検出のための自己超越型ディープラーニングモデルであるSHERLOCKを提案する。
提案手法は, マクロF1スコアが.497, 491で, マルチクラスマルウェア分類における最先端技術よりも優れている。
論文 参考訳(メタデータ) (2022-08-15T07:49:58Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Fast & Furious: Modelling Malware Detection as Evolving Data Streams [6.6892028759947175]
マルウェアはコンピュータシステムにとって大きな脅威であり、サイバーセキュリティに多くの課題を課している。
本研究では,2つのAndroidデータセットに対するマルウェア分類器に対する概念ドリフトの影響を評価する。
論文 参考訳(メタデータ) (2022-05-24T18:43:40Z) - TraSeTR: Track-to-Segment Transformer with Contrastive Query for
Instance-level Instrument Segmentation in Robotic Surgery [60.439434751619736]
そこで我々は,TraSeTRを提案する。TraSeTR,TraSeTR,Trace-to-Segment Transformerは,手術器具のセグメンテーションを支援する。
TraSeTRは、機器の種類、位置、アイデンティティとインスタンスレベルの予測を共同で理由付けている。
提案手法の有効性を,3つの公開データセットに対して,最先端の計器型セグメンテーション結果を用いて実証した。
論文 参考訳(メタデータ) (2022-02-17T05:52:18Z) - MalBERT: Using Transformers for Cybersecurity and Malicious Software
Detection [0.0]
注意に基づくディープラーニング技術のカテゴリであるtransformersは、最近、さまざまなタスクを解決する素晴らしい結果を示している。
本研究では,android アプリケーションのソースコードの静的解析を行う bert (bi representations from transformers) に基づくモデルを提案する。
得られた結果は、悪意のあるソフトウェア検出のためのTransformerベースのモデルによって得られた高い性能を示す。
論文 参考訳(メタデータ) (2021-03-05T17:09:46Z) - Transfer Learning without Knowing: Reprogramming Black-box Machine
Learning Models with Scarce Data and Limited Resources [78.72922528736011]
そこで我々は,ブラックボックス・アタベラル・リプログラミング (BAR) という新しい手法を提案する。
ゼロオーダー最適化とマルチラベルマッピング技術を用いて、BARは入力出力応答のみに基づいてブラックボックスMLモデルをプログラムする。
BARは最先端の手法より優れ、バニラ対逆プログラミング法に匹敵する性能を得る。
論文 参考訳(メタデータ) (2020-07-17T01:52:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。