論文の概要: Comparison of Multiple Classifiers for Android Malware Detection with Emphasis on Feature Insights Using CICMalDroid 2020 Dataset
- arxiv url: http://arxiv.org/abs/2602.00058v1
- Date: Tue, 20 Jan 2026 04:50:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 02:03:42.288335
- Title: Comparison of Multiple Classifiers for Android Malware Detection with Emphasis on Feature Insights Using CICMalDroid 2020 Dataset
- Title(参考訳): CICMalDroid 2020データセットを用いたAndroidマルウェア検出のための複数分類器の比較と特徴点強調
- Authors: Md Min-Ha-Zul Abedin, Tazqia Mehrub,
- Abstract要約: 署名スキャナーは、パブリックアプリストアでリリースサイクルの速さに遅れを取っている。
私たちはCICMalDroid PCA2020を使用しました。
オリジナル機能のグラデーション向上が 最善を尽くした
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate Android malware detection was critical for protecting users at scale. Signature scanners lagged behind fast release cycles on public app stores. We aimed to build a trustworthy detector by pairing a comprehensive dataset with a rigorous, transparent evaluation, and to identify interpretable drivers of decisions. We used CICMalDroid2020, which contained 17,341 apps across Benign, Adware, Banking, SMS malware, and Riskware. We extracted 301 static and 263 dynamic features into a 564 dimensional hybrid vector, then evaluated seven classifiers under three schemes, original features, principal component analysis, PCA, and linear discriminant analysis, LDA, with a 70 percent training and 30 percent test split. Results showed that gradient boosting on the original features performed best. XGBoost achieved 0.9747 accuracy, 0.9703 precision, 0.9731 recall, and 0.9716 F1, and the confusion matrix indicated rare benign labels for malicious apps. HistGradientBoosting reached 0.9741 accuracy and 0.9708 F1, while CatBoost and Random Forest were slightly lower at 0.9678 and 0.9687 accuracy with 0.9636 and 0.9637 F1. KNN and SVM lagged. PCA reduced performance for all models, with XGBoost dropping to 0.9164 accuracy and 0.8988 F1. LDA maintained mid 90s accuracy and clarified separable clusters in projections. A depth two surrogate tree highlighted package name, main activity, and target SDK as key drivers. These findings established high fidelity supervised baselines for Android malware detection and indicated that rich hybrid features with gradient boosting offered a practical and interpretable foundation for deployment.
- Abstract(参考訳): 正確なAndroidマルウェア検出は、ユーザを大規模に保護するために重要だった。
署名スキャナーは、パブリックアプリストアでリリースサイクルの速さに遅れを取っている。
我々は、厳密で透明な評価と包括的データセットを組み合わせることで信頼性の高い検出器を構築し、決定の解釈可能なドライバを特定することを目的としていた。
私たちはCICMalDroid2020を使い、Benign、Adware、Banking、SMSマルウェア、そしてリスクウェアを含む17,341のアプリをテストしました。
301個の静的および263個の動的特徴を564次元ハイブリッドベクトルに抽出し,元の特徴,主成分分析,PCA,線形判別分析,LDAの3つのスキームに基づいて7つの分類器の評価を行った。
その結果,元の特徴の勾配向上が最善であった。
XGBoostは0.9747の精度、0.9703の精度、0.9731のリコール、0.9716のF1を達成した。
HistGradientBoosting は 0.9741 の精度で 0.9708 F1 に達し、CatBoost と Random Forest は 0.9678 と 0.9687 の精度で 0.9636 と 0.9637 F1 の精度でわずかに低下した。
KNNとSVMのラギング。
PCAは全てのモデルの性能を低下させ、XGBoostは0.9164、F1.8988に低下した。
LDAは90代半ばの精度を維持し、投射において分離可能なクラスターを明確にした。
ディープ2サロゲートツリーはパッケージ名、メインアクティビティ、ターゲットSDKをキードライバとして強調した。
これらの結果から,Androidマルウェア検出のための高忠実度教師付きベースラインが確立され,グラデーションを増強したリッチハイブリッド機能によって,デプロイの実用的で解釈可能な基盤が提供された。
関連論文リスト
- Behavioral Analytics for Continuous Insider Threat Detection in Zero-Trust Architectures [0.0]
このフレームワークでは、CERT Insider Threatデータセットをデータクリーニング、正規化、クラスバランスに使用しています。
また、次元減少のために主成分分析(PCA)も採用している。
SVM(90.1%)、ANN(94.7%)、ベイズネット(94.9)と比較して、AdaBoostは98.0%のACC、98.3%のPre、98.0%のREC、F1スコア(F1)で高いパフォーマンスを達成した。
論文 参考訳(メタデータ) (2026-01-10T22:30:19Z) - DeepTrust: Multi-Step Classification through Dissimilar Adversarial Representations for Robust Android Malware Detection [3.523860679419481]
この研究は、柔軟な分類器を順序づけられたシーケンスに配置する新しいメタヒューリスティックであるDeepTrustを提示する。
2025年のIEEE Conference SaTMLのRobust Android Malware Detectionコンペティションでは、DeepTrustが第一位を獲得し、最先端の結果を得た。
これは、非敵マルウェアの最も高い検出率と1%以下の偽陽性率を維持しながら達成される。
論文 参考訳(メタデータ) (2025-10-14T09:10:23Z) - Lightweight MobileNetV1+GRU for ECG Biometric Authentication: Federated and Adversarial Evaluation [0.0]
本稿では,ECGに基づく認証のための軽量ディープラーニングモデル(MobileNetV1+GRU)を提案する。
我々は、ECGID、MIT-BIH、CYBHi、TBデータセットを用いて、ウェアラブル条件とエッジデプロイメントをシミュレートする。
論文 参考訳(メタデータ) (2025-09-21T06:46:31Z) - Impact of Labeling Inaccuracy and Image Noise on Tooth Segmentation in Panoramic Radiographs using Federated, Centralized and Local Learning [46.232038247686745]
フェデレートラーニング(FL)は、歯科診断AIにおけるプライバシー制約、不均一なデータ品質、一貫性のないラベル付けを緩和する。
複数のデータ破損シナリオを対象としたパノラマX線撮影において,FLと集中学習(CL)と局所学習(LL)を比較した。
論文 参考訳(メタデータ) (2025-09-08T11:07:47Z) - Rethinking Verification for LLM Code Generation: From Generation to Testing [44.46778801679273]
大規模言語モデル(LLM)は最近、HumanEvalやLiveCodeBenchといったコード生成ベンチマークで顕著な成功を収めた。
本稿では,テストスーツの厳密な定量化を目的とした新しい多次元メトリクスを提案する。
実験の結果、SAGAは90.62%、検証器の精度はTCGBenchで32.58%に達することがわかった。
論文 参考訳(メタデータ) (2025-07-09T14:58:47Z) - DroidTTP: Mapping Android Applications with TTP for Cyber Threat Intelligence [13.958337678497163]
DroidTTPは、Androidのマルウェアの振る舞いを戦術、テクニック、手順(TTP)にマッピングするフレームワークである。
私たちのデータセットは、MITRE TTPをAndroidアプリケーションに明示的に関連付けています。
問題変換アプローチ(PTA)と大規模言語モデル(LLM)を利用した自動解法を開発した。
論文 参考訳(メタデータ) (2025-03-20T05:38:24Z) - Bridging the Gap Between End-to-End and Two-Step Text Spotting [88.14552991115207]
ブリッジングテキストスポッティングは、2段階のメソッドでエラーの蓄積と最適化性能の問題を解決する新しいアプローチである。
提案手法の有効性を広範囲な実験により実証する。
論文 参考訳(メタデータ) (2024-04-06T13:14:04Z) - Fast-DetectGPT: Efficient Zero-Shot Detection of Machine-Generated Text via Conditional Probability Curvature [33.84718903572477]
大規模言語モデル(LLM)は、流動的でコジェントなコンテンツを生成する能力を示している。
信頼できるAIシステムを構築するためには、マシン生成コンテンツと人間によるコンテンツとを区別することが不可欠である。
Fast-DetectGPTは、ディテクターGPTの摂動ステップを、より効率的なサンプリングステップで置き換える最適化されたゼロショット検出器である。
論文 参考訳(メタデータ) (2023-10-08T11:41:28Z) - Android Malware Detection using Feature Ranking of Permissions [0.0]
当社はAndroidのパーミッションを車として使用し、良性アプリとマルウェアアプリを迅速かつ効果的に区別できるようにしています。
解析の結果,本手法は,他の手法よりも精度が高く,Fスコア値も高いことがわかった。
論文 参考訳(メタデータ) (2022-01-20T22:08:20Z) - Maat: Automatically Analyzing VirusTotal for Accurate Labeling and
Effective Malware Detection [71.84087757644708]
マルウェア分析と検出の研究コミュニティは、約60台のスキャナーのスキャン結果に基づいてAndroidアプリをラベル付けするために、オンラインプラットフォームVirusTotalに依存している。
VirusTotalから取得したスキャン結果を最もよく解釈する方法の基準はありません。
機械学習(ML)ベースのラベリングスキームを自動生成することで,標準化と持続可能性というこれらの問題に対処する手法であるMaatを実装した。
論文 参考訳(メタデータ) (2020-07-01T14:15:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。