論文の概要: Maat: Automatically Analyzing VirusTotal for Accurate Labeling and
Effective Malware Detection
- arxiv url: http://arxiv.org/abs/2007.00510v1
- Date: Wed, 1 Jul 2020 14:15:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 23:46:13.478353
- Title: Maat: Automatically Analyzing VirusTotal for Accurate Labeling and
Effective Malware Detection
- Title(参考訳): maat: 正確なラベリングと効果的なマルウェア検出のためのウイルストタルの自動分析
- Authors: Aleieldin Salem, Sebastian Banescu, Alexander Pretschner
- Abstract要約: マルウェア分析と検出の研究コミュニティは、約60台のスキャナーのスキャン結果に基づいてAndroidアプリをラベル付けするために、オンラインプラットフォームVirusTotalに依存している。
VirusTotalから取得したスキャン結果を最もよく解釈する方法の基準はありません。
機械学習(ML)ベースのラベリングスキームを自動生成することで,標準化と持続可能性というこれらの問題に対処する手法であるMaatを実装した。
- 参考スコア(独自算出の注目度): 71.84087757644708
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The malware analysis and detection research community relies on the online
platform VirusTotal to label Android apps based on the scan results of around
60 antiviral scanners. Unfortunately, there are no standards on how to best
interpret the scan results acquired from VirusTotal, which leads to the
utilization of different threshold-based labeling strategies (e.g., if ten or
more scanners deem an app malicious, it is considered malicious). While some of
the utilized thresholds may be able to accurately approximate the ground truths
of apps, the fact that VirusTotal changes the set and versions of the scanners
it uses makes such thresholds unsustainable over time. We implemented a method,
Maat, that tackles these issues of standardization and sustainability by
automatically generating a Machine Learning (ML)-based labeling scheme, which
outperforms threshold-based labeling strategies. Using the VirusTotal scan
reports of 53K Android apps that span one year, we evaluated the applicability
of Maat's ML-based labeling strategies by comparing their performance against
threshold-based strategies. We found that such ML-based strategies (a) can
accurately and consistently label apps based on their VirusTotal scan reports,
and (b) contribute to training ML-based detection methods that are more
effective at classifying out-of-sample apps than their threshold-based
counterparts.
- Abstract(参考訳): マルウェア分析と検出の研究コミュニティは、約60のアンチウイルススキャナーのスキャン結果に基づいて、Androidアプリをラベル付けするオンラインプラットフォームVirusTotalに依存している。
残念ながら、virustotalから取得したスキャン結果を最善に解釈する方法の基準はなく、異なるしきい値ベースのラベリング戦略(例えば、10以上のスキャナがアプリを悪質と判断した場合、悪意があると見なされる)を利用することになる。
利用されたしきい値のいくつかは、アプリの基本的な真実を正確に近似することができるが、ウイルスが使用するスキャナーのセットとバージョンを変更するという事実は、時間とともにそのようなしきい値が持続不可能になる。
我々は機械学習(ML)ベースのラベリングスキームを自動生成することで、標準化と持続可能性というこれらの課題に対処する手法Maatを実装した。
VirusTotalのレポートでは、1年間にわたる53万のAndroidアプリをスキャンし、しきい値ベースの戦略と比較することで、MaatのMLベースのラベリング戦略の適用性を評価した。
このようなMLベースの戦略は
(a) VirusTotalのスキャンレポートに基づいてアプリを正確かつ一貫してラベル付けし、
b) 閾値ベースのアプリよりも,サンプル外アプリの分類に有効なMLベースの検出方法のトレーニングに寄与する。
関連論文リスト
- Zero-Shot Detection of Machine-Generated Codes [83.0342513054389]
本研究は,LLMの生成したコードを検出するためのトレーニング不要な手法を提案する。
既存のトレーニングベースまたはゼロショットテキスト検出装置は、コード検出に効果がないことがわかった。
本手法は,リビジョン攻撃に対する堅牢性を示し,Javaコードによく適応する。
論文 参考訳(メタデータ) (2023-10-08T10:08:21Z) - Towards a Fair Comparison and Realistic Design and Evaluation Framework
of Android Malware Detectors [63.75363908696257]
一般的な評価フレームワークを用いて,Androidのマルウェア検出に関する10の研究成果を分析した。
データセットの作成やデザイナの設計に考慮しない場合、トレーニングされたMLモデルに大きく影響する5つの要因を特定します。
その結果,MLに基づく検出器は楽観的に評価され,良好な結果が得られた。
論文 参考訳(メタデータ) (2022-05-25T08:28:08Z) - A two-steps approach to improve the performance of Android malware
detectors [4.440024971751226]
マルウェア検知器の性能を高めるための教師付き表現学習法であるGUIDED ReTRAINingを提案する。
265k以上のマルウェアと良性アプリを用いて,最先端の4つのAndroidマルウェア検出手法を検証した。
本手法は汎用的であり,二項分類タスクにおける分類性能を向上させるように設計されている。
論文 参考訳(メタデータ) (2022-05-17T12:04:17Z) - MERLIN -- Malware Evasion with Reinforcement LearnINg [26.500149465292246]
本稿では,DQNアルゴリズムとREINFORCEアルゴリズムを用いた強化学習を用いて,最先端の2つのマルウェア検出エンジンに挑戦する手法を提案する。
本手法では,Windows のポータブルな実行ファイルを機能的に損なうことなく変更する動作を複数組み合わせる。
限られた情報しか持たない商用AVでも,REINFORCEは高い回避率を達成できることを実証する。
論文 参考訳(メタデータ) (2022-03-24T10:58:47Z) - New Datasets for Dynamic Malware Classification [0.0]
悪意のあるソフトウェアであるVrusSamplesとVrusShareの2つの新しい、更新されたデータセットを紹介します。
本稿では、これらの2つのデータセットのバランスとバランスの取れていないバージョンにおけるマルチクラスのマルウェア分類性能について分析する。
その結果,不均衡なVirusSampleデータセットでは,Support Vector Machineが94%のスコアを達成していることがわかった。
最も一般的な勾配向上ベースのモデルのひとつであるXGBoostは、VirusShareデータセットの両バージョンにおいて、90%と80%のスコアを達成している。
論文 参考訳(メタデータ) (2021-11-30T08:31:16Z) - Mate! Are You Really Aware? An Explainability-Guided Testing Framework
for Robustness of Malware Detectors [49.34155921877441]
マルウェア検出装置のロバスト性を示すための説明可能性誘導型およびモデルに依存しないテストフレームワークを提案する。
次に、このフレームワークを使用して、操作されたマルウェアを検出する最先端のマルウェア検知器の能力をテストする。
我々の発見は、現在のマルウェア検知器の限界と、その改善方法に光を当てた。
論文 参考訳(メタデータ) (2021-11-19T08:02:38Z) - EvadeDroid: A Practical Evasion Attack on Machine Learning for Black-box
Android Malware Detection [2.2811510666857546]
EvadeDroidは、現実のシナリオでブラックボックスのAndroidマルウェア検出を効果的に回避するために設計された、問題空間の敵攻撃である。
EvadeDroidは, DREBIN, Sec-SVM, ADE-MA, MaMaDroid, Opcode-SVMに対して, 1-9クエリで80%-95%の回避率を達成した。
論文 参考訳(メタデータ) (2021-10-07T09:39:40Z) - Being Single Has Benefits. Instance Poisoning to Deceive Malware
Classifiers [47.828297621738265]
攻撃者は、マルウェア分類器を訓練するために使用されるデータセットをターゲットとした、高度で効率的な中毒攻撃を、どのように起動できるかを示す。
マルウェア検出領域における他の中毒攻撃とは対照的に、我々の攻撃はマルウェアファミリーではなく、移植されたトリガーを含む特定のマルウェアインスタンスに焦点を当てている。
我々は、この新たに発見された深刻な脅威に対する将来の高度な防御に役立つ包括的検出手法を提案する。
論文 参考訳(メタデータ) (2020-10-30T15:27:44Z) - Towards Accurate Labeling of Android Apps for Reliable Malware Detection [0.0]
研究者たちは、VirusTotalのようなオンラインプラットフォームが提供するスキャンレポートを解釈するしきい値ベースのラベリング戦略に依存している。
このプラットフォームのダイナミック性は、これらのラベリング戦略を長期にわたって持続不可能にし、不正確なラベリングにつながる。
手動で正確なラベルを生成することの不可能さと、信頼できる代替手段の欠如により、研究者はアプリにVrusTotalを使わざるを得なくなった。
論文 参考訳(メタデータ) (2020-07-01T13:02:19Z) - Robust Spammer Detection by Nash Reinforcement Learning [64.80986064630025]
我々は,スパマーとスパム検知器が互いに現実的な目標を競うミニマックスゲームを開発する。
提案アルゴリズムは,スパマーが混在するスパマーが実用目標を達成するのを確実に防止できる平衡検出器を確実に見つけることができることを示す。
論文 参考訳(メタデータ) (2020-06-10T21:18:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。