論文の概要: MADAR: Efficient Continual Learning for Malware Analysis with Diversity-Aware Replay
- arxiv url: http://arxiv.org/abs/2502.05760v1
- Date: Sun, 09 Feb 2025 03:37:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:28:52.619932
- Title: MADAR: Efficient Continual Learning for Malware Analysis with Diversity-Aware Replay
- Title(参考訳): MADAR:ダイバーシティ・アウェア・リプレイによるマルウェア解析のための効果的な継続的学習
- Authors: Mohammad Saidur Rahman, Scott Coull, Qi Yu, Matthew Wright,
- Abstract要約: 継続的な学習は、収集されたすべてのデータを定期的に再トレーニングするストレージと計算コストを削減する可能性を秘めている。
我々は,マルウェアデータ配信のユニークな特性と課題を考慮に入れたCLフレームワークであるMADARを提案する。
- 参考スコア(独自算出の注目度): 21.54671696689243
- License:
- Abstract: Millions of new pieces of malicious software (i.e., malware) are introduced each year. This poses significant challenges for antivirus vendors, who use machine learning to detect and analyze malware, and must keep up with changes in the distribution while retaining knowledge of older variants. Continual learning (CL) holds the potential to address this challenge by reducing the storage and computational costs of regularly retraining over all the collected data. Prior work, however, shows that CL techniques, which are designed primarily for computer vision tasks, fare poorly when applied to malware classification. To address these issues, we begin with an exploratory analysis of a typical malware dataset, which reveals that malware families are diverse and difficult to characterize, requiring a wide variety of samples to learn a robust representation. Based on these findings, we propose $\underline{M}$alware $\underline{A}$nalysis with $\underline{D}$iversity-$\underline{A}$ware $\underline{R}$eplay (MADAR), a CL framework that accounts for the unique properties and challenges of the malware data distribution. Through extensive evaluation on large-scale Windows and Android malware datasets, we show that MADAR significantly outperforms prior work. This highlights the importance of understanding domain characteristics when designing CL techniques and demonstrates a path forward for the malware classification domain.
- Abstract(参考訳): 毎年何百万もの悪意あるソフトウェア(すなわちマルウェア)が導入されている。
これは、機械学習を使用してマルウェアを検出し分析するアンチウイルスベンダーにとって重大な課題であり、古い変種に関する知識を維持しながら、分布の変化に追随しなければならない。
連続学習(CL)は、収集されたすべてのデータを定期的に再トレーニングするストレージと計算コストを削減し、この問題に対処する可能性を秘めている。
しかし、以前の研究は、主にコンピュータビジョンタスク用に設計されたCL技術がマルウェア分類に適用された場合、不十分であることを示している。
これらの問題に対処するために、我々は典型的なマルウェアデータセットの探索分析から始め、マルウェアファミリーが多様で特徴付けが難しいことを明らかにする。
これらの結果に基づき、マルウェアデータ分散のユニークな性質と課題を考慮に入れたCLフレームワークである$\underline{M}$alware $\underline{A}$nalysis with $\underline{D}$iversity-$\underline{A}$ware $\underline{R}$eplay (MADAR)を提案する。
大規模な Windows および Android のマルウェアデータセットに対する広範な評価を通じて,MADAR が先行作業より大幅に優れていたことを示す。
これはCLテクニックの設計におけるドメイン特性の理解の重要性を強調し、マルウェア分類領域への道筋を示すものである。
関連論文リスト
- MASKDROID: Robust Android Malware Detection with Masked Graph Representations [56.09270390096083]
マルウェアを識別する強力な識別能力を持つ強力な検出器MASKDROIDを提案する。
我々は、グラフニューラルネットワークベースのフレームワークにマスキング機構を導入し、MASKDROIDに入力グラフ全体の復元を強制する。
この戦略により、モデルは悪意のあるセマンティクスを理解し、より安定した表現を学習し、敵攻撃に対する堅牢性を高めることができる。
論文 参考訳(メタデータ) (2024-09-29T07:22:47Z) - A Survey of Malware Detection Using Deep Learning [6.349503549199403]
本稿では,ディープラーニング(DL)を用いたWindows,iOS,Android,Linuxにおけるマルウェア検出の進歩について検討する。
本稿では,DL分類器を用いたマルウェア検出の問題点と課題について論じる。
各種データセットに対する8つの一般的なDLアプローチについて検討する。
論文 参考訳(メタデータ) (2024-07-27T02:49:55Z) - Ransomware Detection Using Federated Learning with Imbalanced Datasets [0.0]
本稿では,データセットの不均衡を軽減するために,重み付きクロスエントロピー損失関数を提案する。
次に、最新の Windows ベースのランサムウェアファミリを用いた静的解析のケースについて、詳細な性能評価研究を行う。
論文 参考訳(メタデータ) (2023-11-13T21:21:39Z) - MalDICT: Benchmark Datasets on Malware Behaviors, Platforms, Exploitation, and Packers [44.700094741798445]
マルウェア分類に関する既存の研究は、悪意のあるファイルと良性のあるファイルの区別と、家族によるマルウェアの分類という2つのタスクにのみ焦点をあてている。
我々は、マルウェアが提示する行動の分類、マルウェアが実行しているプラットフォーム、マルウェアが悪用する脆弱性、マルウェアが詰め込まれているパッカーの4つのタスクを特定した。
ClarAVyを使ってタグ付けされ、合計で550万近い悪意のあるファイルで構成されています。
論文 参考訳(メタデータ) (2023-10-18T04:36:26Z) - EMBERSim: A Large-Scale Databank for Boosting Similarity Search in
Malware Analysis [48.5877840394508]
近年,定量化によるマルウェア検出から機械学習への移行が進んでいる。
本稿では、EMBERから始まるバイナリファイルの類似性研究の領域における欠陥に対処することを提案する。
我々は、EMBERに類似情報とマルウェアのクラスタグを付与し、類似性空間のさらなる研究を可能にする。
論文 参考訳(メタデータ) (2023-10-03T06:58:45Z) - DRSM: De-Randomized Smoothing on Malware Classifier Providing Certified
Robustness [58.23214712926585]
我々は,マルウェア検出領域の非ランダム化スムース化技術を再設計し,DRSM(De-Randomized Smoothed MalConv)を開発した。
具体的には,実行可能ファイルの局所構造を最大に保ちながら,逆数バイトの影響を確実に抑制するウィンドウアブレーション方式を提案する。
私たちは、マルウェア実行ファイルの静的検出という領域で、認証された堅牢性を提供する最初の人です。
論文 参考訳(メタデータ) (2023-03-20T17:25:22Z) - On the Limitations of Continual Learning for Malware Classification [18.567946765007658]
一般的なインクリメンタル学習シナリオをカバーする3つのマルウェアタスクに適用した11個のCL手法について検討した。
本研究では,バイナリマルウェア分類(Domain-IL)とマルチクラスマルウェアファミリー分類(Task-ILとClass-IL)の両方におけるCL手法の性能を評価する。
論文 参考訳(メタデータ) (2022-08-13T04:23:19Z) - Fast & Furious: Modelling Malware Detection as Evolving Data Streams [6.6892028759947175]
マルウェアはコンピュータシステムにとって大きな脅威であり、サイバーセキュリティに多くの課題を課している。
本研究では,2つのAndroidデータセットに対するマルウェア分類器に対する概念ドリフトの影響を評価する。
論文 参考訳(メタデータ) (2022-05-24T18:43:40Z) - Using Static and Dynamic Malware features to perform Malware Ascription [0.0]
我々は、悪意のある実行可能ファイルの静的および動的機能を用いて、その家族に基づいてマルウェアを分類する。
Cuckoo Sandboxと機械学習を活用して、この研究を前進させます。
論文 参考訳(メタデータ) (2021-12-05T18:01:09Z) - Being Single Has Benefits. Instance Poisoning to Deceive Malware
Classifiers [47.828297621738265]
攻撃者は、マルウェア分類器を訓練するために使用されるデータセットをターゲットとした、高度で効率的な中毒攻撃を、どのように起動できるかを示す。
マルウェア検出領域における他の中毒攻撃とは対照的に、我々の攻撃はマルウェアファミリーではなく、移植されたトリガーを含む特定のマルウェアインスタンスに焦点を当てている。
我々は、この新たに発見された深刻な脅威に対する将来の高度な防御に役立つ包括的検出手法を提案する。
論文 参考訳(メタデータ) (2020-10-30T15:27:44Z) - Adversarial EXEmples: A Survey and Experimental Evaluation of Practical
Attacks on Machine Learning for Windows Malware Detection [67.53296659361598]
EXEmplesは、比較的少ない入力バイトを摂動することで、機械学習に基づく検出をバイパスすることができる。
我々は、機械学習モデルに対する過去の攻撃を包含し、一般化するだけでなく、3つの新たな攻撃を含む統一フレームワークを開発する。
これらの攻撃はFull DOS、Extended、Shiftと呼ばれ、DOSヘッダをそれぞれ操作し、拡張し、第1セクションの内容を変更することで、敵のペイロードを注入する。
論文 参考訳(メタデータ) (2020-08-17T07:16:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。