論文の概要: Diagnosing and Mitigating Domain Shift in Permission-Based Android Malware Detection
- arxiv url: http://arxiv.org/abs/2605.09028v2
- Date: Thu, 14 May 2026 05:08:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 15:19:49.862933
- Title: Diagnosing and Mitigating Domain Shift in Permission-Based Android Malware Detection
- Title(参考訳): パーミッションベースAndroidマルウェア検出におけるドメインシフトの診断と緩和
- Authors: Md Rafid Islam,
- Abstract要約: マシンラーニングベースのAndroidマルウェア検出は、ドメインシフトによって現実のデプロイメントで失敗することが多い。
本稿では、クロスドメイン条件下でのパーミッションベース検出器の一般化可能性と解釈性について包括的に研究する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning-based Android malware detectors often fail in real-world deployment due to domain shift, where models trained on one data source perform poorly on applications from another. This paper presents a comprehensive study on the generalizability and interpretability of permission-based detectors under cross-domain conditions. Using two complementary datasets (PerMalDroid and NATICUSdroid) and five ensemble classifiers, we first establish an intra-domain baseline, where models achieve over 92% accuracy, and then quantify a severe asymmetric performance drop. While models trained on PerMalDroid generalize well to NATICUSdroid (86% accuracy), the reverse direction sees a drastic drop to 73% accuracy. Explainable AI analysis reveals bimodal feature distributions and shows that feature importance is highly unstable, with key permissions losing or gaining influence across domains. The predictive feature sets for different domains are fundamentally mismatched, as models rely on different, dataset-specific permissions. Most importantly, an ablation study demonstrates that for most models, training on a noisy feature set leads to poor generalization, confirming that domain-specific artifacts are a greater obstacle than missing features. To mitigate this, we validate a hybrid training strategy based on the intersection of common features and successfully recover cross-domain performance, achieving 88% accuracy on PerMalDroid and maintaining 97% on NATICUSdroid. These findings highlight the importance of explainable, cross-domain-robust malware detection systems and provide a practical pathway toward improving real-world deployment of permission-based Android malware detectors.
- Abstract(参考訳): マシンラーニングベースのAndroidマルウェア検出は、ドメインシフトによって現実のデプロイメントで失敗することが多い。
本稿では、クロスドメイン条件下でのパーミッションベース検出器の一般化可能性と解釈性について包括的に研究する。
2つの補完的データセット(PerMalDroid と NATICUSdroid)と5つのアンサンブル分類器を用いて、まずドメイン内ベースラインを構築し、モデルが92%以上の精度を達成し、それから厳密な非対称な性能低下を定量化する。
PerMalDroidでトレーニングされたモデルはNATICUSdroid(精度86%)とよく似ていますが、逆方向の精度は73%まで劇的に低下しています。
説明可能なAI分析では、バイモーダルな特徴分布が明らかになり、重要なパーミッションがドメイン全体で失われるか、あるいは影響力を持つようになることで、機能の重要性が極めて不安定であることを示す。
モデルが異なるデータセット固有のパーミッションに依存しているため、異なるドメインの予測機能セットは根本的にミスマッチしている。
最も重要なのは,ほとんどのモデルにおいて,ノイズの多い機能セットのトレーニングが一般化を損なうことを示し,ドメイン固有のアーティファクトが欠落する機能よりも大きな障害であることを確認することだ。
これを軽減するために,共通特徴の交叉に基づくハイブリッドトレーニング戦略を検証するとともに,クロスドメイン性能の回復に成功し,PerMalDroidでは88%の精度でNATICUSdroidでは97%の精度を維持した。
これらの知見は、説明可能なクロスドメインロバストマルウェア検出システムの重要性を強調し、パーミッションベースのAndroidマルウェア検出装置の現実的な展開を改善するための実践的な経路を提供する。
関連論文リスト
- Mitigating Distribution Shift in Graph-Based Android Malware Classification via Function Metadata and LLM Embeddings [13.484494807251197]
グラフベースのマルウェア分類器は、標準のAndroidデータセットで94%以上の精度を達成できる。
しかし、これまで見つからなかった同じ家系のマルウェアについて評価すると、正確さは最大45%低下する。
本稿では,コンテキスト特徴を持つ関数呼出グラフを強化する,ロバストなセマンティックエンリッチメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-08T22:16:57Z) - AndroIDS : Android-based Intrusion Detection System using Federated Learning [0.0]
本稿では,AndroIDSという,統合学習に基づく侵入検知フレームワークを提案する。
システムコールトレースをパーソナライズされたプライバシ保護データソースとして使用する。
精度は96.46 %、92.87 %、F1 スコアは89 %、86 %である。
論文 参考訳(メタデータ) (2025-06-19T17:42:02Z) - Robust Distribution Alignment for Industrial Anomaly Detection under Distribution Shift [51.24522135151649]
異常検出は産業アプリケーションの品質管理において重要な役割を担っている。
既存の方法は、一般化可能なモデルをトレーニングすることで、ドメインシフトに対処しようとする。
提案手法は,最先端の異常検出法や領域適応法と比較して,優れた結果を示す。
論文 参考訳(メタデータ) (2025-03-19T05:25:52Z) - DRIVE: Dual-Robustness via Information Variability and Entropic Consistency in Source-Free Unsupervised Domain Adaptation [10.127634263641877]
ラベル付きデータなしで機械学習モデルを新しいドメインに適応させることは、医療画像、自律運転、リモートセンシングといったアプリケーションにおいて重要な課題である。
Source-Free Unsupervised Domain Adaptation (SFUDA)と呼ばれるこのタスクでは、未ラベルのターゲットデータのみを使用して、トレーニング済みのモデルをターゲットドメインに適応させる。
既存のSFUDAメソッドは、しばしば単一モデルアーキテクチャに依存し、ターゲットドメインにおける不確実性と可変性に悩まされる。
本稿では、2重モデルアーキテクチャを利用した新しいSFUDAフレームワークDRIVEを提案する。
論文 参考訳(メタデータ) (2024-11-24T20:35:04Z) - Two-Stage Adaptive Network for Semi-Supervised Cross-Domain Crater Detection under Varying Scenario Distributions [17.28368878719324]
クロスクレーター検出のための2段階適応ネットワーク(TAN)を提案する。
我々のネットワークはYOLOv5検出器上に構築されており、そこではクロスドメインの一般化能力を高めるために一連の戦略が採用されている。
ベンチマークデータセットによる実験結果から,提案するネットワークは,様々なシナリオ分布下でのクレーター検出の領域適応性を向上できることが示された。
論文 参考訳(メタデータ) (2023-12-11T07:16:49Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - Generalizability of Adversarial Robustness Under Distribution Shifts [57.767152566761304]
本研究は, 実証的, 証明された敵対的堅牢性間の相互作用と, ドメインの一般化を両立させるための第一歩を踏み出した。
複数のドメインでロバストモデルをトレーニングし、その正確性とロバスト性を評価する。
本研究は, 現実の医療応用をカバーするために拡張され, 敵の増大は, クリーンデータ精度に最小限の影響を伴って, 強靭性の一般化を著しく促進する。
論文 参考訳(メタデータ) (2022-09-29T18:25:48Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Are Pretrained Transformers Robust in Intent Classification? A Missing
Ingredient in Evaluation of Out-of-Scope Intent Detection [93.40525251094071]
まず、少数ショットの意図認識タスクにおいて、ドメイン内スコープ外検出の重要性を指摘する。
次に、ドメイン内だがスコープ外(ID-OOS)であるサンプルに対して、事前訓練したTransformerベースのモデルの脆弱性を説明する。
論文 参考訳(メタデータ) (2021-06-08T17:51:12Z) - Out-of-Distribution Generalization Analysis via Influence Function [25.80365416547478]
トレーニングとターゲットデータのミスマッチは、機械学習システムにとって大きな課題のひとつだ。
我々は,OOD一般化問題に,ロバスト統計学の古典的ツールであるインフルエンス関数を導入する。
実験領域と提案指標の精度は,OODアルゴリズムが必要かどうか,モデルが優れたOOD一般化を実現するかどうかを判別する上で有効であることを示す。
論文 参考訳(メタデータ) (2021-01-21T09:59:55Z) - Revisiting Mahalanobis Distance for Transformer-Based Out-of-Domain
Detection [60.88952532574564]
本稿では,ドメイン外インテント検出手法を徹底的に比較する。
意図分類のための3つの標準データセット上で,複数のコンテキストエンコーダとメソッドを効率良く評価する。
本研究の主目的は,超微調整トランスフォーマーを用いたドメイン内データエンコーダが優れた結果をもたらすことである。
論文 参考訳(メタデータ) (2021-01-11T09:10:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。