論文の概要: Towards a Fair Comparison and Realistic Design and Evaluation Framework
of Android Malware Detectors
- arxiv url: http://arxiv.org/abs/2205.12569v1
- Date: Wed, 25 May 2022 08:28:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-27 06:46:56.810913
- Title: Towards a Fair Comparison and Realistic Design and Evaluation Framework
of Android Malware Detectors
- Title(参考訳): Androidマルウェア検出器の公正比較と現実設計と評価フレームワーク
- Authors: Borja Molina-Coronado and Usue Mori and Alexander Mendiburu and Jose
Miguel-Alonso
- Abstract要約: 一般的な評価フレームワークを用いて,Androidのマルウェア検出に関する10の研究成果を分析した。
データセットの作成やデザイナの設計に考慮しない場合、トレーニングされたMLモデルに大きく影響する5つの要因を特定します。
その結果,MLに基づく検出器は楽観的に評価され,良好な結果が得られた。
- 参考スコア(独自算出の注目度): 63.75363908696257
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As in other cybersecurity areas, machine learning (ML) techniques have
emerged as a promising solution to detect Android malware. In this sense, many
proposals employing a variety of algorithms and feature sets have been
presented to date, often reporting impresive detection performances. However,
the lack of reproducibility and the absence of a standard evaluation framework
make these proposals difficult to compare. In this paper, we perform an
analysis of 10 influential research works on Android malware detection using a
common evaluation framework. We have identified five factors that, if not taken
into account when creating datasets and designing detectors, significantly
affect the trained ML models and their performances. In particular, we analyze
the effect of (1) the presence of duplicated samples, (2) label
(goodware/greyware/malware) attribution, (3) class imbalance, (4) the presence
of apps that use evasion techniques and, (5) the evolution of apps. Based on
this extensive experimentation, we conclude that the studied ML-based detectors
have been evaluated optimistically, which justifies the good published results.
Our findings also highlight that it is imperative to generate realistic
datasets, taking into account the factors mentioned above, to enable the design
and evaluation of better solutions for Android malware detection.
- Abstract(参考訳): 他のサイバーセキュリティ分野と同様に、機械学習(ML)技術がAndroidマルウェアを検出するための有望なソリューションとして登場した。
この意味では、様々なアルゴリズムと特徴セットを用いた多くの提案が提案され、しばしば不適切な検出性能を報告している。
しかし、再現性の欠如と標準評価フレームワークの欠如により、これらの提案を比較するのは困難である。
本稿では,androidマルウェア検出に関する10の研究成果について,共通評価フレームワークを用いて分析を行う。
データセットの作成やデザイナの設計では考慮されないが、トレーニングされたMLモデルとそのパフォーマンスに大きく影響する5つの要因を特定した。
特に,(1)重複したサンプルの存在,(2)ラベル(グッドウェア/グレーウェア/マルウェア)の帰属,(3)クラス不均衡,(4)回避技術を用いたアプリの存在,(5)アプリの進化が与える影響を分析した。
この広範な実験に基づいて、研究されたMLベースの検出器は楽観的に評価され、良好な結果が得られた。
また,上記の要因を考慮して,androidマルウェア検出のためのより良いソリューションの設計と評価を可能にするためには,現実的なデータセットを生成することが不可欠であることを強調する。
関連論文リスト
- Comprehensive evaluation of Mal-API-2019 dataset by machine learning in
malware detection [0.5874782446136914]
本研究では,機械学習技術を用いたマルウェア検出の徹底的な検討を行う。
その目的は、脅威をより効果的に識別し緩和することで、サイバーセキュリティの能力を向上させることである。
論文 参考訳(メタデータ) (2024-03-04T17:22:43Z) - Unraveling the Key of Machine Learning Solutions for Android Malware
Detection [33.63795751798441]
本稿では,機械学習によるAndroidマルウェア検出に関する包括的調査を行う。
まず、文献を調査し、Androidの機能エンジニアリングとMLモデリングパイプラインに基づいた分類にコントリビューションを分類する。
そして、MLベースのAndroidマルウェア検出のための汎用フレームワークを設計し、異なる研究コミュニティから12の代表的なアプローチを再実装し、有効性、堅牢性、効率性の3つの主要な側面から評価する。
論文 参考訳(メタデータ) (2024-02-05T12:31:19Z) - Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.668411293817464]
業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。
学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。
利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文 参考訳(メタデータ) (2023-12-25T21:25:55Z) - Android Malware Detection with Unbiased Confidence Guarantees [1.6432632226868131]
本稿では,マルウェア検出毎に確実な信頼性を保証する機械学習動的解析手法を提案する。
提案手法は、Conformal Predictionと呼ばれる新しい機械学習フレームワークと、ランダムな森林分類器を組み合わせたものである。
実際のアンドロイドデバイスに1866の悪意のある4816の良質なアプリケーションをインストールすることで,大規模なデータセット上での性能を検証した。
論文 参考訳(メタデータ) (2023-12-17T11:07:31Z) - MGTBench: Benchmarking Machine-Generated Text Detection [54.81446366272403]
本稿では,強力な大規模言語モデル(LLM)に対するMGT検出のための最初のベンチマークフレームワークを提案する。
一般に単語が多ければ多いほど性能が向上し,ほとんどの検出手法はトレーニングサンプルをはるかに少なくして同様の性能が得られることを示す。
本研究は, テキスト属性タスクにおいて, モデルに基づく検出手法が依然として有効であることを示す。
論文 参考訳(メタデータ) (2023-03-26T21:12:36Z) - DRSM: De-Randomized Smoothing on Malware Classifier Providing Certified
Robustness [58.23214712926585]
我々は,マルウェア検出領域の非ランダム化スムース化技術を再設計し,DRSM(De-Randomized Smoothed MalConv)を開発した。
具体的には,実行可能ファイルの局所構造を最大に保ちながら,逆数バイトの影響を確実に抑制するウィンドウアブレーション方式を提案する。
私たちは、マルウェア実行ファイルの静的検出という領域で、認証された堅牢性を提供する最初の人です。
論文 参考訳(メタデータ) (2023-03-20T17:25:22Z) - A Review on the effectiveness of Dimensional Reduction with
Computational Forensics: An Application on Malware Analysis [0.0]
本研究は,Android ベースのマルウェアを検知する計算Forensics タスクにおける Principle Component Analysis の適用性を評価する。
その結果,次元的に低減されたデータセットは精度の劣化の指標となることがわかった。
論文 参考訳(メタデータ) (2023-01-15T07:34:31Z) - ML-based IoT Malware Detection Under Adversarial Settings: A Systematic
Evaluation [9.143713488498513]
本研究は,様々な表現と学習技術を利用した最先端のマルウェア検出手法を体系的に検討する。
本研究では, 剥ぎ取りやパディングなどの機能保存操作によるソフトウェア変異が, 検出精度を著しく低下させることを示した。
論文 参考訳(メタデータ) (2021-08-30T16:54:07Z) - Towards Unbiased Visual Emotion Recognition via Causal Intervention [63.74095927462]
本稿では,データセットバイアスによる負の効果を軽減するために,新しい感情認識ネットワーク(IERN)を提案する。
IERNの有効性を検証する一連の設計されたテストと、3つの感情ベンチマークの実験は、IERNが他の最先端のアプローチよりも優れていることを示した。
論文 参考訳(メタデータ) (2021-07-26T10:40:59Z) - ML-Doctor: Holistic Risk Assessment of Inference Attacks Against Machine
Learning Models [64.03398193325572]
機械学習(ML)モデルに対する推論攻撃により、敵はトレーニングデータやモデルパラメータなどを学ぶことができる。
私たちは、メンバシップ推論、モデル反転、属性推論、モデル盗難の4つの攻撃に集中しています。
私たちの分析では、MLモデルオーナがモデルをデプロイするリスクを評価することができる、モジュール化された再使用可能なソフトウェアであるML-Doctorに依存しています。
論文 参考訳(メタデータ) (2021-02-04T11:35:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。