論文の概要: A Comprehensive Investigation of Feature and Model Importance in Android
Malware Detection
- arxiv url: http://arxiv.org/abs/2301.12778v1
- Date: Mon, 30 Jan 2023 10:48:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 15:07:38.283868
- Title: A Comprehensive Investigation of Feature and Model Importance in Android
Malware Detection
- Title(参考訳): Android マルウェア検出における特徴とモデルの重要性に関する総合的研究
- Authors: Ali Muzaffar, Hani Ragab Hassen, Hind Zantout, Michael A Lones
- Abstract要約: 我々は16の代表的な過去の作品を再実装し、124,000のAndroidアプリケーションからなるバランスのとれた、関連性の高い最新のデータセットでそれらを評価した。
以上の結果から,静的特徴だけで96.8%の精度を達成できることが示唆された。
APIコールの利用とTCPネットワークのトラフィック機能から構築された、ランダムなフォレストとして最高のモデルを見つけました。
- 参考スコア(独自算出の注目度): 0.17205106391379021
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The popularity and relative openness of Android means it is a popular target
for malware. Over the years, various studies have found that machine learning
models can effectively discriminate malware from benign applications. However,
as the operating system evolves, so does malware, bringing into question the
findings of these previous studies, many of which used small, outdated, and
often imbalanced datasets. In this paper, we reimplement 16 representative past
works and evaluate them on a balanced, relevant and up-to-date dataset
comprising 124,000 Android applications. We also carry out new experiments
designed to fill holes in existing knowledge, and use our findings to identify
the most effective features and models to use for Android malware detection
within a contemporary environment. Our results suggest that accuracies of up to
96.8% can be achieved using static features alone, with a further 1% achievable
using more expensive dynamic analysis approaches. We find the best models to be
random forests built from API call usage and TCP network traffic features.
- Abstract(参考訳): androidの人気と比較的オープン性は、マルウェアのターゲットとして人気が高いことを意味する。
長年にわたり、機械学習モデルがマルウェアと良性アプリケーションを効果的に区別できることが、さまざまな研究で示されている。
しかし、オペレーティングシステムが進化するにつれて、マルウェアも同様になり、これらの研究の結果に疑問が持たれ、その多くは小さく、時代遅れで、しばしば不均衡なデータセットを使用していた。
本稿では,16の代表的な過去の作業を再実装し,124,000のandroidアプリケーションからなる,バランスの取れた,関連性の高い,最新のデータセット上で評価する。
また,既存の知識の穴を埋めるための新たな実験を行い,現在の環境におけるandroidマルウェア検出に最も有効な機能やモデルを特定する。
その結果、静的機能だけで最大96.8%の精度を達成することができ、さらに1%はより高価な動的解析手法で達成できることが示唆された。
apiコールとtcpネットワークトラフィック機能から構築した、ランダムフォレストとして最高のモデルを見出す。
関連論文リスト
- ActDroid: An active learning framework for Android malware detection [3.195234044113248]
12秒ごとに新しいマルウェアがオンラインに現れる。
オンライン学習は、アプリケーションラベリングの問題を軽減するために使用できる。
私たちのフレームワークは最大96%の精度を実現しています。
論文 参考訳(メタデータ) (2024-01-30T13:10:33Z) - Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.668411293817464]
業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。
学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。
利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文 参考訳(メタデータ) (2023-12-25T21:25:55Z) - Android Malware Detection with Unbiased Confidence Guarantees [1.6432632226868131]
本稿では,マルウェア検出毎に確実な信頼性を保証する機械学習動的解析手法を提案する。
提案手法は、Conformal Predictionと呼ばれる新しい機械学習フレームワークと、ランダムな森林分類器を組み合わせたものである。
実際のアンドロイドデバイスに1866の悪意のある4816の良質なアプリケーションをインストールすることで,大規模なデータセット上での性能を検証した。
論文 参考訳(メタデータ) (2023-12-17T11:07:31Z) - Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - On building machine learning pipelines for Android malware detection: a
procedural survey of practices, challenges and opportunities [4.8460847676785175]
スマートフォン市場のリーダーとして、Androidはマルウェア攻撃の目玉ターゲットとなっている。
特に市場保有者や研究者にとって、多数のサンプルが手動によるマルウェア検出を不可能にしている。
提案されたアプローチのいくつかは高いパフォーマンスを達成するが、急速に進化するAndroidマルウェアは、時間とともにその正確性を維持することができない。
論文 参考訳(メタデータ) (2023-06-12T13:52:28Z) - Unleashing Mask: Explore the Intrinsic Out-of-Distribution Detection
Capability [70.72426887518517]
Out-of-Distribution(OOD)検出は、機械学習モデルを現実世界のアプリケーションにデプロイする際に、セキュアAIの必須の側面である。
本稿では,IDデータを用いた学習モデルのOOD識別能力を復元する新しい手法であるUnleashing Maskを提案する。
本手法では, マスクを用いて記憶した非定型サンプルを抽出し, モデルを微調整するか, 導入したマスクでプルーする。
論文 参考訳(メタデータ) (2023-06-06T14:23:34Z) - Towards a Fair Comparison and Realistic Design and Evaluation Framework
of Android Malware Detectors [63.75363908696257]
一般的な評価フレームワークを用いて,Androidのマルウェア検出に関する10の研究成果を分析した。
データセットの作成やデザイナの設計に考慮しない場合、トレーニングされたMLモデルに大きく影響する5つの要因を特定します。
その結果,MLに基づく検出器は楽観的に評価され,良好な結果が得られた。
論文 参考訳(メタデータ) (2022-05-25T08:28:08Z) - Fast & Furious: Modelling Malware Detection as Evolving Data Streams [6.6892028759947175]
マルウェアはコンピュータシステムにとって大きな脅威であり、サイバーセキュリティに多くの課題を課している。
本研究では,2つのAndroidデータセットに対するマルウェア分類器に対する概念ドリフトの影響を評価する。
論文 参考訳(メタデータ) (2022-05-24T18:43:40Z) - Hidden Biases in Unreliable News Detection Datasets [60.71991809782698]
データ収集中の選択バイアスがデータセットの望ましくないアーティファクトにつながることを示す。
クリーンスプリットでテストされたすべてのモデルに対して,列車/テストソースの重なりが無く,精度が大幅に低下した(>10%)。
将来的なデータセット生成には、困難/バイアスプローブとしての単純なモデルと、クリーンな非重複サイトと日付分割を使用する将来のモデル開発が含まれることを提案する。
論文 参考訳(メタデータ) (2021-04-20T17:16:41Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Identification of Significant Permissions for Efficient Android Malware
Detection [2.179313476241343]
5つのビジネス/産業モバイルアプリケーションの1つが機密個人データを漏洩します。
従来のシグネチャ/ヒューリスティックベースのマルウェア検出システムは、現在のマルウェア問題に対処できない。
機械学習とディープニューラルネットワークを用いた効率的なAndroidマルウェア検出システムを提案する。
論文 参考訳(メタデータ) (2021-02-28T22:07:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。