論文の概要: Revisiting Concept Drift in Windows Malware Detection: Adaptation to Real Drifted Malware with Minimal Samples
- arxiv url: http://arxiv.org/abs/2407.13918v2
- Date: Thu, 19 Dec 2024 20:05:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-23 19:50:36.847758
- Title: Revisiting Concept Drift in Windows Malware Detection: Adaptation to Real Drifted Malware with Minimal Samples
- Title(参考訳): Windows マルウェア検出におけるコンセプトドリフトの再検討:最小サンプルを用いたリアルドリフトマルウェアへの適応
- Authors: Adrian Shuai Li, Arun Iyengar, Ashish Kundu, Elisa Bertino,
- Abstract要約: 本研究では,ドリフトマルウェアの検出と分類を行う新しい手法を提案する。
グラフニューラルネットワークと対向ドメイン適応を利用して、マルウェア制御フローグラフのドリフト不変性を学習する。
当社のアプローチは,公開ベンチマークや,セキュリティ企業によって毎日報告されている実世界のマルウェアデータベース上でのドリフトマルウェアの検出を大幅に改善する。
- 参考スコア(独自算出の注目度): 10.352741619176383
- License:
- Abstract: In applying deep learning for malware classification, it is crucial to account for the prevalence of malware evolution, which can cause trained classifiers to fail on drifted malware. Existing solutions to address concept drift use active learning. They select new samples for analysts to label and then retrain the classifier with the new labels. Our key finding is that the current retraining techniques do not achieve optimal results. These techniques overlook that updating the model with scarce drifted samples requires learning features that remain consistent across pre-drift and post-drift data. The model should thus be able to disregard specific features that, while beneficial for the classification of pre-drift data, are absent in post-drift data, thereby preventing prediction degradation. In this paper, we propose a new technique for detecting and classifying drifted malware that learns drift-invariant features in malware control flow graphs by leveraging graph neural networks with adversarial domain adaptation. We compare it with existing model retraining methods in active learning-based malware detection systems and other domain adaptation techniques from the vision domain. Our approach significantly improves drifted malware detection on publicly available benchmarks and real-world malware databases reported daily by security companies in 2024. We also tested our approach in predicting multiple malware families drifted over time. A thorough evaluation shows that our approach outperforms the state-of-the-art approaches.
- Abstract(参考訳): マルウェア分類にディープラーニングを適用する際には、学習した分類器がドリフトしたマルウェアで失敗する可能性があるマルウェア進化の頻度を考慮することが重要である。
コンセプトドリフトに対処する既存のソリューションは、アクティブラーニングを使用する。
彼らは、アナリストがラベルを付けるための新しいサンプルを選択し、新しいラベルで分類器を再訓練する。
我々の重要な発見は、現在のリトレーニング技術が最適な結果を得ることができないことである。
これらのテクニックは、サンプルが不足しているモデル更新には、ドリフト前データと後ドリフト後データの間で一貫性のある学習機能が必要であることを見落としている。
したがって、モデルは、プレドリフトデータの分類に有用であるが、後ドリフトデータには欠落している特定の特徴を無視でき、予測劣化を防止できる。
本稿では,マルウェア制御フローグラフにおけるドリフト不変な特徴を学習するドリフトマルウェアの検出と分類のための新しい手法を提案する。
本研究では,能動的学習に基づくマルウェア検出システムにおける既存のモデル再学習手法と視覚領域からの他の領域適応手法との比較を行った。
当社のアプローチは,2024年にセキュリティ企業によって毎日報告された,公開ベンチマークや実世界のマルウェアデータベース上でのドリフトマルウェアの検出を大幅に改善する。
私たちはまた、時間とともに複数のマルウェアファミリーが漂流したことを予測するために、我々のアプローチをテストしました。
徹底的な評価は、我々のアプローチが最先端のアプローチより優れていることを示している。
関連論文リスト
- DREAM: Combating Concept Drift with Explanatory Detection and Adaptation in Malware Classification [15.912839650827589]
マルウェアの急速な進化、特に新しい家系では、分類精度をほぼランダムなレベルに低下させる可能性がある。
これまでの研究は主に漂流サンプルの検出に重点を置いており、専門家主導の分析とモデル再訓練のためのラベル付けに頼っていた。
DREAMは、既存のドリフト検出器の能力を超えるように設計された新しいシステムである。
論文 参考訳(メタデータ) (2024-05-07T07:55:45Z) - MORPH: Towards Automated Concept Drift Adaptation for Malware Detection [0.7499722271664147]
コンセプトドリフトはマルウェア検出にとって重要な課題である。
自己学習は、コンセプトドリフトを緩和するための有望なアプローチとして現れています。
擬似ラベルに基づく効果的なドリフト適応法であるMORPHを提案する。
論文 参考訳(メタデータ) (2024-01-23T14:25:43Z) - XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8257151788923]
低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。
XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。
6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文 参考訳(メタデータ) (2023-10-09T08:07:04Z) - Optimized Deep Learning Models for Malware Detection under Concept Drift [0.0]
ドリフトに対するベースラインニューラルネットワークを改善するためのモデルに依存しないプロトコルを提案する。
本稿では,最新の検証セットによる特徴量削減とトレーニングの重要性を示し,Drift-Resilient Binary Cross-Entropyという損失関数を提案する。
改良されたモデルは有望な結果を示し、ベースラインモデルよりも15.2%多いマルウェアを検出する。
論文 参考訳(メタデータ) (2023-08-21T16:13:23Z) - An Unbiased Transformer Source Code Learning with Semantic Vulnerability
Graph [3.3598755777055374]
現在の脆弱性スクリーニング技術は、新しい脆弱性を特定したり、開発者がコード脆弱性と分類を提供するのに効果がない。
これらの問題に対処するために,変換器 "RoBERTa" とグラフ畳み込みニューラルネットワーク (GCN) を組み合わせたマルチタスク・アンバイアス脆弱性分類器を提案する。
本稿では、逐次フロー、制御フロー、データフローからエッジを統合することで生成されたソースコードからのセマンティック脆弱性グラフ(SVG)表現と、Poacher Flow(PF)と呼ばれる新しいフローを利用したトレーニングプロセスを提案する。
論文 参考訳(メタデータ) (2023-04-17T20:54:14Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - Efficient and Robust Classification for Sparse Attacks [34.48667992227529]
我々は、画像認識、自然言語処理、マルウェア検出の領域において効果的な攻撃として示されてきた$ell$-normで束縛された摂動を考える。
我々は,「トランケーション」と「アドリアル・トレーニング」を組み合わせた新しい防衛手法を提案する。
得られた洞察に触発され、これらのコンポーネントをニューラルネットワーク分類器に拡張する。
論文 参考訳(メタデータ) (2022-01-23T21:18:17Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Advanced Dropout: A Model-free Methodology for Bayesian Dropout
Optimization [62.8384110757689]
ディープニューラルネットワーク(DNN)の現実的応用において、ユビキタスなオーバーフィッティングが存在する
先進的なドロップアウト手法は、パラメトリック先行でモデルフリーで容易に実装された分布を適用し、ドロップアウト率を適応的に調整する。
7つのコンピュータビジョンデータセットにおける9つのドロップアウト手法に対する高度なドロップアウトの有効性を評価する。
論文 参考訳(メタデータ) (2020-10-11T13:19:58Z) - Transfer Learning without Knowing: Reprogramming Black-box Machine
Learning Models with Scarce Data and Limited Resources [78.72922528736011]
そこで我々は,ブラックボックス・アタベラル・リプログラミング (BAR) という新しい手法を提案する。
ゼロオーダー最適化とマルチラベルマッピング技術を用いて、BARは入力出力応答のみに基づいてブラックボックスMLモデルをプログラムする。
BARは最先端の手法より優れ、バニラ対逆プログラミング法に匹敵する性能を得る。
論文 参考訳(メタデータ) (2020-07-17T01:52:34Z) - Rectified Meta-Learning from Noisy Labels for Robust Image-based Plant
Disease Diagnosis [64.82680813427054]
植物病は食料安全保障と作物生産に対する主要な脅威の1つである。
1つの一般的なアプローチは、葉画像分類タスクとしてこの問題を変換し、強力な畳み込みニューラルネットワーク(CNN)によって対処できる。
本稿では,正規化メタ学習モジュールを共通CNNパラダイムに組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T09:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。