論文の概要: Empirical Evaluation of Concept Drift in ML-Based Android Malware Detection
- arxiv url: http://arxiv.org/abs/2507.22772v1
- Date: Wed, 30 Jul 2025 15:35:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-31 16:14:18.290237
- Title: Empirical Evaluation of Concept Drift in ML-Based Android Malware Detection
- Title(参考訳): MLベースのAndroidマルウェア検出における概念ドリフトの実証評価
- Authors: Ahmed Sabbah, Radi Jarrar, Samer Zein, David Mohaisen,
- Abstract要約: 本研究は,Androidマルウェア検出におけるコンセプトドリフトの影響について検討する。
ドリフトに影響を与える要因には、特徴型、データ環境、検出方法などがある。
アルゴリズムの種類と概念のドリフトの間に強い相関は見つからなかった。
- 参考スコア(独自算出の注目度): 10.268191178804168
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Despite outstanding results, machine learning-based Android malware detection models struggle with concept drift, where rapidly evolving malware characteristics degrade model effectiveness. This study examines the impact of concept drift on Android malware detection, evaluating two datasets and nine machine learning and deep learning algorithms, as well as Large Language Models (LLMs). Various feature types--static, dynamic, hybrid, semantic, and image-based--were considered. The results showed that concept drift is widespread and significantly affects model performance. Factors influencing the drift include feature types, data environments, and detection methods. Balancing algorithms helped with class imbalance but did not fully address concept drift, which primarily stems from the dynamic nature of the malware landscape. No strong link was found between the type of algorithm used and concept drift, the impact was relatively minor compared to other variables since hyperparameters were not fine-tuned, and the default algorithm configurations were used. While LLMs using few-shot learning demonstrated promising detection performance, they did not fully mitigate concept drift, highlighting the need for further investigation.
- Abstract(参考訳): 優れた結果にもかかわらず、機械学習ベースのAndroidマルウェア検出モデルはコンセプトドリフトに苦慮し、急速に進化するマルウェアの特徴はモデルの有効性を低下させる。
本研究では2つのデータセットと9つの機械学習およびディープラーニングアルゴリズム、およびLarge Language Models (LLM) に対するコンセプトドリフトの影響について検討した。
静的、動的、ハイブリッド、セマンティック、イメージベースなど、さまざまな機能タイプが検討されている。
その結果,コンセプトドリフトは広く,モデル性能に大きく影響していることがわかった。
ドリフトに影響を与える要因には、特徴タイプ、データ環境、検出方法などがある。
バランスの取れたアルゴリズムは、クラス不均衡に役立ったが、主にマルウェアのランドスケープの動的な性質に由来する概念の漂流に完全に対処しなかった。
アルゴリズムの種類と概念のドリフトの間には強い相関関係は見られず、ハイパーパラメータが微調整されていないため、影響は他の変数に比べて比較的小さなものであり、デフォルトのアルゴリズム構成が使用された。
数発の学習を用いたLLMは検出性能が期待できることを示したが、コンセプトドリフトを完全に緩和することはできず、さらなる調査の必要性を強調した。
関連論文リスト
- ADAPT: A Pseudo-labeling Approach to Combat Concept Drift in Malware Detection [0.8192907805418583]
データ分散の変更に機械学習モデルを適用するには、頻繁な更新が必要である。
我々は、コンセプトドリフトに対処するための新しい擬似ラベル付き半教師付きアルゴリズムであるtexttADAPTを紹介する。
論文 参考訳(メタデータ) (2025-07-11T13:47:07Z) - Cluster Analysis and Concept Drift Detection in Malware [1.3812010983144798]
概念ドリフト(concept drift)とは、機械学習モデルの精度に影響を与えるデータの特性の漸進的または突然の変化を指す。
マルウェア領域におけるコンセプトドリフトを検出するためのクラスタリングに基づく手法を提案し,解析する。
論文 参考訳(メタデータ) (2025-02-19T22:42:30Z) - Revisiting Concept Drift in Windows Malware Detection: Adaptation to Real Drifted Malware with Minimal Samples [10.352741619176383]
本研究では,ドリフトマルウェアの検出と分類を行う新しい手法を提案する。
グラフニューラルネットワークと対向ドメイン適応を利用して、マルウェア制御フローグラフのドリフト不変性を学習する。
当社のアプローチは,公開ベンチマークや,セキュリティ企業によって毎日報告されている実世界のマルウェアデータベース上でのドリフトマルウェアの検出を大幅に改善する。
論文 参考訳(メタデータ) (2024-07-18T22:06:20Z) - MORPH: Towards Automated Concept Drift Adaptation for Malware Detection [0.7499722271664147]
コンセプトドリフトはマルウェア検出にとって重要な課題である。
自己学習は、コンセプトドリフトを緩和するための有望なアプローチとして現れています。
擬似ラベルに基づく効果的なドリフト適応法であるMORPHを提案する。
論文 参考訳(メタデータ) (2024-01-23T14:25:43Z) - Uncovering the Hidden Cost of Model Compression [43.62624133952414]
視覚プロンプティングは、コンピュータビジョンにおける伝達学習の重要な方法として登場した。
モデル圧縮は視覚的プロンプトベース転送の性能に有害である。
しかし、量子化によってモデルが圧縮されるとき、キャリブレーションに対する負の効果は存在しない。
論文 参考訳(メタデータ) (2023-08-29T01:47:49Z) - Incremental Online Learning Algorithms Comparison for Gesture and Visual
Smart Sensors [68.8204255655161]
本稿では,加速度センサデータに基づくジェスチャー認識と画像分類の2つの実例として,最先端の4つのアルゴリズムを比較した。
以上の結果から,これらのシステムの信頼性と小型メモリMCUへのデプロイの可能性が確認された。
論文 参考訳(メタデータ) (2022-09-01T17:05:20Z) - A Robust Backpropagation-Free Framework for Images [47.97322346441165]
画像データに対するエラーカーネル駆動型アクティベーションアライメントアルゴリズムを提案する。
EKDAAは、ローカルに派生したエラー送信カーネルとエラーマップを導入することで達成される。
結果は、識別不能なアクティベーション機能を利用するEKDAAトレーニングCNNに対して提示される。
論文 参考訳(メタデータ) (2022-06-03T21:14:10Z) - Neurosymbolic hybrid approach to driver collision warning [64.02492460600905]
自律運転システムには2つの主要なアルゴリズムアプローチがある。
ディープラーニングだけでは、多くの分野で最先端の結果が得られています。
しかし、ディープラーニングモデルが機能しない場合、デバッグが非常に難しい場合もあります。
論文 参考訳(メタデータ) (2022-03-28T20:29:50Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Automatic Learning to Detect Concept Drift [40.69280758487987]
誤り率の変化パターンを追跡し,コンセプトドリフトの分類を学習する新しいフレームワークであるMeta-ADDを提案する。
具体的には、トレーニングフェーズにおいて、様々なコンセプトドリフトの誤差率に基づいてメタ特徴を抽出し、その後、原型ニューラルネットワークを介してメタ検出装置を開発する。
検出フェーズでは、学習したメタ検出器が微調整され、ストリームベースのアクティブラーニングを介して対応するデータストリームに適応する。
論文 参考訳(メタデータ) (2021-05-04T11:10:39Z) - Influence Functions in Deep Learning Are Fragile [52.31375893260445]
影響関数は、テスト時間予測におけるサンプルの効果を近似する。
影響評価は浅いネットワークでは かなり正確です
ヘッセン正則化は、高品質な影響推定を得るために重要である。
論文 参考訳(メタデータ) (2020-06-25T18:25:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。