論文の概要: Continuous Learning for Android Malware Detection
- arxiv url: http://arxiv.org/abs/2302.04332v2
- Date: Wed, 14 Jun 2023 17:23:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-17 02:15:34.672514
- Title: Continuous Learning for Android Malware Detection
- Title(参考訳): Androidマルウェア検出のための継続的学習
- Authors: Yizheng Chen, Zhoujie Ding, David Wagner
- Abstract要約: そこで本研究では,Androidマルウェア分類器を継続的に学習するための新しい階層型コントラスト学習手法と,新しいサンプル選択手法を提案する。
提案手法では, 偽陰性率は14%から9%に減少し, 偽陰性率は0.86%から0.48%に低下する。
- 参考スコア(独自算出の注目度): 15.818435778629635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning methods can detect Android malware with very high accuracy.
However, these classifiers have an Achilles heel, concept drift: they rapidly
become out of date and ineffective, due to the evolution of malware apps and
benign apps. Our research finds that, after training an Android malware
classifier on one year's worth of data, the F1 score quickly dropped from 0.99
to 0.76 after 6 months of deployment on new test samples.
In this paper, we propose new methods to combat the concept drift problem of
Android malware classifiers. Since machine learning technique needs to be
continuously deployed, we use active learning: we select new samples for
analysts to label, and then add the labeled samples to the training set to
retrain the classifier. Our key idea is, similarity-based uncertainty is more
robust against concept drift. Therefore, we combine contrastive learning with
active learning. We propose a new hierarchical contrastive learning scheme, and
a new sample selection technique to continuously train the Android malware
classifier. Our evaluation shows that this leads to significant improvements,
compared to previously published methods for active learning. Our approach
reduces the false negative rate from 14% (for the best baseline) to 9%, while
also reducing the false positive rate (from 0.86% to 0.48%). Also, our approach
maintains more consistent performance across a seven-year time period than past
methods.
- Abstract(参考訳): 機械学習は、androidのマルウェアを非常に高い精度で検出できる。
しかし、これらの分類器にはAchilles Heelとコンセプトドリフトがあり、マルウェアアプリや良質なアプリの進化によって、それらは急速に時代遅れになり、非効率になる。
我々の研究によると、Androidのマルウェア分類器を1年分のデータでトレーニングした後、新しいテストサンプルに6ヶ月デプロイした後、F1スコアはすぐに0.99から0.76に低下した。
本稿では,androidマルウェア分類器の概念ドリフト問題に対処する新しい手法を提案する。
マシンラーニングのテクニックを継続的にデプロイする必要があるため、私たちはアクティブラーニングを使用します。アナリストがラベル付けする新しいサンプルを選択し、ラベル付きサンプルをトレーニングセットに追加して、分類器を再トレーニングします。
私たちの重要なアイデアは、類似性に基づく不確実性が、コンセプトドリフトに対してより堅牢であることです。
そこで我々は,コントラスト学習とアクティブラーニングを組み合わせる。
本稿では,新しい階層的コントラスト学習スキームと,androidマルウェア分類器を継続的に学習するための新しいサンプル選択手法を提案する。
評価の結果,前回公表したアクティブラーニング手法と比較して,大幅な改善がみられた。
我々のアプローチは、偽陰性率を14%(最良のベースライン)から9%に削減するとともに、偽陽性率(0.86%から0.48%)を低下させる。
また,従来の手法よりも7年間にわたって一貫した性能を維持する。
関連論文リスト
- Improving Malware Detection with Adversarial Domain Adaptation and Control Flow Graphs [10.352741619176383]
戦闘コンセプトの既存のソリューションは、アクティブラーニングを使用する。
グラフニューラルネットワークを利用してマルウェア制御後のフローグラフの保持情報を学習する手法を提案する。
提案手法は,バイナリ分類タスクにおける未知のマルウェアファミリーの予測と,マルチクラス環境でのドリフトされたマルウェアファミリーの予測において,大幅な向上を示すものである。
論文 参考訳(メタデータ) (2024-07-18T22:06:20Z) - ActDroid: An active learning framework for Android malware detection [3.195234044113248]
12秒ごとに新しいマルウェアがオンラインに現れる。
オンライン学習は、アプリケーションラベリングの問題を軽減するために使用できる。
私たちのフレームワークは最大96%の精度を実現しています。
論文 参考訳(メタデータ) (2024-01-30T13:10:33Z) - Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.668411293817464]
業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。
学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。
利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文 参考訳(メタデータ) (2023-12-25T21:25:55Z) - Efficient Concept Drift Handling for Batch Android Malware Detection
Models [0.0]
我々は、リトレーニング技術が検知能力を時間とともに維持できることを示す。
実験により, ドリフト検出とサンプル選択機構は, 極めて効率的な再学習戦略をもたらすことが示された。
論文 参考訳(メタデータ) (2023-09-18T14:28:18Z) - Seamless Iterative Semi-Supervised Correction of Imperfect Labels in
Microscopy Images [57.42492501915773]
生体内試験は、医療機器の毒性に対する動物実験の代替手段である。
人間の疲労は、深層学習を魅力的なものにするために、エラー作成に重要な役割を果たします。
我々は、不完全ラベルのシームレス反復半監督補正(SISSI)を提案する。
本手法は,物体検出に適応的な早期学習補正技術を提供する。
論文 参考訳(メタデータ) (2022-08-05T18:52:20Z) - A two-steps approach to improve the performance of Android malware
detectors [4.440024971751226]
マルウェア検知器の性能を高めるための教師付き表現学習法であるGUIDED ReTRAINingを提案する。
265k以上のマルウェアと良性アプリを用いて,最先端の4つのAndroidマルウェア検出手法を検証した。
本手法は汎用的であり,二項分類タスクにおける分類性能を向上させるように設計されている。
論文 参考訳(メタデータ) (2022-05-17T12:04:17Z) - Adversarial Self-Supervised Contrastive Learning [62.17538130778111]
既存の対数学習アプローチは、主にクラスラベルを使用して、誤った予測につながる対数サンプルを生成する。
本稿では,未ラベルデータに対する新たな逆攻撃を提案する。これにより,モデルが摂動データサンプルのインスタンスレベルのアイデンティティを混乱させる。
ラベル付きデータなしで頑健なニューラルネットワークを逆さまにトレーニングするための,自己教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-13T08:24:33Z) - Detection of Novel Social Bots by Ensembles of Specialized Classifiers [60.63582690037839]
悪意ある俳優は、社会ボットとして知られるアルゴリズムによって部分的に制御される不正なソーシャルメディアアカウントを作成し、誤情報を広め、オンラインでの議論を扇動する。
異なるタイプのボットが、異なる行動特徴によって特徴づけられることを示す。
本稿では,ボットのクラスごとに専門的な分類器を訓練し,それらの決定を最大ルールで組み合わせる,教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-11T22:59:59Z) - Scalable Backdoor Detection in Neural Networks [61.39635364047679]
ディープラーニングモデルは、トロイの木馬攻撃に対して脆弱で、攻撃者はトレーニング中にバックドアをインストールして、結果のモデルが小さなトリガーパッチで汚染されたサンプルを誤識別させる。
本稿では,ラベル数と計算複雑性が一致しない新たなトリガリバースエンジニアリング手法を提案する。
実験では,提案手法が純モデルからトロイの木馬モデルを分離する際の完全なスコアを達成できることが観察された。
論文 参考訳(メタデータ) (2020-06-10T04:12:53Z) - A Framework for Behavioral Biometric Authentication using Deep Metric
Learning on Mobile Devices [17.905483523678964]
バッテリー駆動のモバイルデバイス上でのトレーニングを取り入れた新しいフレームワークを提案する。これにより、プライベートデータはデバイスを離れることなく、実行時の動作パターンに柔軟に適応するようにトレーニングをスケジュールすることができる。
実験では、3つの公開データセットで95%以上の認証精度が示され、データが少ないマルチクラスの分類では15%の精度が向上し、それぞれ99%と90%が成功したブルートフォース攻撃とサイドチャネル攻撃に対する堅牢性が向上した。
その結果,トレーニングはビデオ視聴よりも低エネルギーを消費し,ゲームよりも若干高いエネルギーを消費していることがわかった。
論文 参考訳(メタデータ) (2020-05-26T17:56:20Z) - Rethinking Few-Shot Image Classification: a Good Embedding Is All You
Need? [72.00712736992618]
メタトレーニングセット上で教師付きあるいは自己教師型表現を学習する単純なベースラインが、最先端の数ショット学習方法より優れていることを示す。
追加の増量は自己蒸留によって達成できる。
我々は,この発見が,画像分類ベンチマークとメタ学習アルゴリズムの役割を再考する動機となっていると考えている。
論文 参考訳(メタデータ) (2020-03-25T17:58:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。