論文の概要: Benchmarking Android Malware Detection: Rethinking the Role of Traditional and Deep Learning Models
- arxiv url: http://arxiv.org/abs/2502.15041v1
- Date: Thu, 20 Feb 2025 20:56:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-24 16:09:07.535349
- Title: Benchmarking Android Malware Detection: Rethinking the Role of Traditional and Deep Learning Models
- Title(参考訳): Androidのマルウェア検出のベンチマーク - 従来の学習モデルとディープラーニングモデルの役割を再考する
- Authors: Guojun Liu, Doina Caragea, Xinming Ou, Sankardas Roy,
- Abstract要約: Androidのマルウェア検出は、従来の機械学習(ML)とディープラーニング(DL)の両方のアプローチを用いて、広範囲に研究されている。
多くの最先端検出モデルは優れた性能を主張するが、限られた比較に頼っていることが多い。
これにより、DLベースのアプローチのパフォーマンスの堅牢性と、よりシンプルで効率的なMLモデルの潜在的監視に関する懸念が高まる。
- 参考スコア(独自算出の注目度): 6.9053043489744015
- License:
- Abstract: Android malware detection has been extensively studied using both traditional machine learning (ML) and deep learning (DL) approaches. While many state-of-the-art detection models, particularly those based on DL, claim superior performance, they often rely on limited comparisons, lacking comprehensive benchmarking against traditional ML models across diverse datasets. This raises concerns about the robustness of DL-based approaches' performance and the potential oversight of simpler, more efficient ML models. In this paper, we conduct a systematic evaluation of Android malware detection models across four datasets: three recently published, publicly available datasets and a large-scale dataset we systematically collected. We implement a range of traditional ML models, including Random Forests (RF) and CatBoost, alongside advanced DL models such as Capsule Graph Neural Networks (CapsGNN), BERT-based models, and ExcelFormer based models. Our results reveal that while advanced DL models can achieve strong performance, they are often compared against an insufficient number of traditional ML baselines. In many cases, simpler and more computationally efficient ML models achieve comparable or even superior performance. These findings highlight the need for rigorous benchmarking in Android malware detection research. We encourage future studies to conduct more comprehensive benchmarking comparisons between traditional and advanced models to ensure a more accurate assessment of detection capabilities. To facilitate further research, we provide access to our dataset, including app IDs, hash values, and labels.
- Abstract(参考訳): Androidのマルウェア検出は、従来の機械学習(ML)とディープラーニング(DL)の両方のアプローチを用いて、広範囲に研究されている。
多くの最先端検出モデル、特にDLベースのモデルでは、優れたパフォーマンスを主張する一方で、さまざまなデータセットにわたる従来のMLモデルに対する包括的なベンチマークが欠如しているため、限られた比較に頼っていることが多い。
これにより、DLベースのアプローチのパフォーマンスの堅牢性と、よりシンプルで効率的なMLモデルの潜在的監視に対する懸念が高まる。
本稿では,最近公開された3つの公開データセットと,体系的に収集した大規模データセットを用いて,Androidのマルウェア検出モデルを体系的に評価する。
我々は、Capsule Graph Neural Networks(CapsGNN)やBERTベースのモデル、ExcelFormerベースのモデルといった先進的なDLモデルとともに、ランダムフォレスト(RF)やCatBoostなど、さまざまな伝統的なMLモデルを実装しています。
以上の結果から,高度なDLモデルでは高い性能が得られるが,従来のMLベースラインの不足に対して比較されることが多かった。
多くの場合、よりシンプルで計算効率のよいMLモデルは、同等またはそれ以上の性能を達成する。
これらの結果は,Androidマルウェア検出研究における厳格なベンチマークの必要性を浮き彫りにしている。
我々は、検知能力をより正確に評価するために、従来のモデルと先進モデルのより包括的なベンチマーク比較を行うよう将来の研究を奨励する。
さらなる調査を容易にするため、アプリID、ハッシュ値、ラベルを含むデータセットへのアクセスを提供しています。
関連論文リスト
- Unleashing Mask: Explore the Intrinsic Out-of-Distribution Detection
Capability [70.72426887518517]
Out-of-Distribution(OOD)検出は、機械学習モデルを現実世界のアプリケーションにデプロイする際に、セキュアAIの必須の側面である。
本稿では,IDデータを用いた学習モデルのOOD識別能力を復元する新しい手法であるUnleashing Maskを提案する。
本手法では, マスクを用いて記憶した非定型サンプルを抽出し, モデルを微調整するか, 導入したマスクでプルーする。
論文 参考訳(メタデータ) (2023-06-06T14:23:34Z) - Investigating Feature and Model Importance in Android Malware Detection: An Implemented Survey and Experimental Comparison of ML-Based Methods [2.9248916859490173]
静的解析だけで抽出した特徴を用いて高い検出精度が得られることを示す。
ランダムフォレストは一般的に最も効果的なモデルであり、より複雑なディープラーニングアプローチよりも優れている。
論文 参考訳(メタデータ) (2023-01-30T10:48:10Z) - Incremental Online Learning Algorithms Comparison for Gesture and Visual
Smart Sensors [68.8204255655161]
本稿では,加速度センサデータに基づくジェスチャー認識と画像分類の2つの実例として,最先端の4つのアルゴリズムを比較した。
以上の結果から,これらのシステムの信頼性と小型メモリMCUへのデプロイの可能性が確認された。
論文 参考訳(メタデータ) (2022-09-01T17:05:20Z) - When a RF Beats a CNN and GRU, Together -- A Comparison of Deep Learning
and Classical Machine Learning Approaches for Encrypted Malware Traffic
Classification [4.495583520377878]
悪意のあるトラフィック分類の場合、最先端のDLベースのソリューションは、古典的なMLベースのソリューションよりも必ずしも優れているとは限らないことを示す。
マルウェア検出、マルウェア家族分類、ゼロデイ攻撃の検出、反復的に増加するデータセットの分類など、さまざまなタスクに2つのよく知られたデータセットを使用することで、この発見を実証する。
論文 参考訳(メタデータ) (2022-06-16T08:59:53Z) - Can Deep Learning be Applied to Model-Based Multi-Object Tracking? [25.464269324261636]
マルチオブジェクトトラッキング(MOT)は、ノイズ測定を用いて未知の、時間変化のあるオブジェクトの状態をトラッキングする問題である。
ディープラーニング(DL)は、トラッキングパフォーマンスを改善するために、MOTでますます使われている。
本稿では,TransformerベースのDLトラッカーを提案し,その性能をモデルベースで評価する。
論文 参考訳(メタデータ) (2022-02-16T07:43:08Z) - Deep Learning Models for Knowledge Tracing: Review and Empirical
Evaluation [2.423547527175807]
我々は,オープンで広く利用されているデータセットを用いた深層学習知識追跡(DLKT)モデルをレビューし,評価する。
評価されたDLKTモデルは、以前報告した結果の再現性と評価のために再実装されている。
論文 参考訳(メタデータ) (2021-12-30T14:19:27Z) - Complementary Ensemble Learning [1.90365714903665]
我々は最先端のディープラーニングモデルの性能向上手法を考案した。
具体的には、最先端モデルの不確実性を補完できる補助モデルを訓練する。
論文 参考訳(メタデータ) (2021-11-09T03:23:05Z) - Sparse MoEs meet Efficient Ensembles [49.313497379189315]
このようなモデルの2つの一般的なクラス、すなわちニューラルネットワークのアンサンブルと専門家のスパースミックス(スパースMoE)の相互作用について研究する。
Efficient Ensemble of Experts (E$3$)は、両モデルのクラスを最大限に活用するスケーラブルでシンプルなMoEのアンサンブルであり、深いアンサンブルよりも最大45%少ないFLOPを使用する。
論文 参考訳(メタデータ) (2021-10-07T11:58:35Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Transfer Learning without Knowing: Reprogramming Black-box Machine
Learning Models with Scarce Data and Limited Resources [78.72922528736011]
そこで我々は,ブラックボックス・アタベラル・リプログラミング (BAR) という新しい手法を提案する。
ゼロオーダー最適化とマルチラベルマッピング技術を用いて、BARは入力出力応答のみに基づいてブラックボックスMLモデルをプログラムする。
BARは最先端の手法より優れ、バニラ対逆プログラミング法に匹敵する性能を得る。
論文 参考訳(メタデータ) (2020-07-17T01:52:34Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。