論文の概要: DMLDroid: Deep Multimodal Fusion Framework for Android Malware Detection with Resilience to Code Obfuscation and Adversarial Perturbations
- arxiv url: http://arxiv.org/abs/2509.11187v1
- Date: Sun, 14 Sep 2025 09:32:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:22.966278
- Title: DMLDroid: Deep Multimodal Fusion Framework for Android Malware Detection with Resilience to Code Obfuscation and Adversarial Perturbations
- Title(参考訳): DMLDroid:コードの難読化と対向的摂動に抵抗のあるAndroidマルウェア検出のためのディープマルチモーダルフュージョンフレームワーク
- Authors: Doan Minh Trung, Tien Duc Anh Hao, Luong Hoang Minh, Nghi Hoang Khoa, Nguyen Tan Cam, Van-Hau Pham, Phan The Duy,
- Abstract要約: マルチモーダル融合に基づくAndroidマルウェア検出システムDMLDroidを提案する。
我々は,異なる融合戦略を用いて,各特徴と組み合わせて,個別に徹底的な実験を行う。
この発見は,Androidのマルウェアの脅威に対する検出精度と堅牢性の両方を改善する上で,マルチモーダル融合の利点を強調した。
- 参考スコア(独自算出の注目度): 1.3792857294744785
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, learning-based Android malware detection has seen significant advancements, with detectors generally falling into three categories: string-based, image-based, and graph-based approaches. While these methods have shown strong detection performance, they often struggle to sustain robustness in real-world settings, particularly when facing code obfuscation and adversarial examples (AEs). Deep multimodal learning has emerged as a promising solution, leveraging the strengths of multiple feature types to enhance robustness and generalization. However, a systematic investigation of multimodal fusion for both accuracy and resilience remains underexplored. In this study, we propose DMLDroid, an Android malware detection based on multimodal fusion that leverages three different representations of malware features, including permissions & intents (tabular-based), DEX file representations (image-based), and API calls (graph-derived sequence-based). We conduct exhaustive experiments independently on each feature, as well as in combination, using different fusion strategies. Experimental results on the CICMalDroid 2020 dataset demonstrate that our multimodal approach with the dynamic weighted fusion mechanism achieves high performance, reaching 97.98% accuracy and 98.67% F1-score on original malware detection. Notably, the proposed method maintains strong robustness, sustaining over 98% accuracy and 98% F1-score under both obfuscation and adversarial attack scenarios. Our findings highlight the benefits of multimodal fusion in improving both detection accuracy and robustness against evolving Android malware threats.
- Abstract(参考訳): 近年、学習ベースのAndroidマルウェア検出が大幅に進歩し、検出器は一般的に文字列ベース、画像ベース、グラフベースの3つのカテゴリに分類されている。
これらの手法は強い検出性能を示しているが、特にコード難読化や逆例(AE)に直面している場合、実世界の環境において堅牢性を維持するのに苦労することが多い。
深いマルチモーダル学習が有望なソリューションとして登場し、複数の特徴型の強みを活用して堅牢性と一般化を高めている。
しかし、精度とレジリエンスの両面でのマルチモーダル核融合の系統的な研究はいまだに未定である。
本研究では,マルチモーダル融合に基づくAndroidマルウェア検出であるDMLDroidを提案する。これは,パーミッションとインテント(タブラリベース),DEXファイル表現(画像ベース),API呼び出し(グラフベース)の3つの異なる表現を利用する。
我々は,異なる融合戦略を用いて,各特徴と組み合わせて,個別に徹底的な実験を行う。
CICMalDroid 2020データセットの実験結果は、動的重み付け融合機構による我々のマルチモーダルアプローチがハイパフォーマンスを実現し、97.98%の精度と98.67%のF1スコアに達したことを示している。
提案手法は強靭性を維持し,98%以上の精度と98%のF1スコアを維持した。
この発見は,Androidのマルウェアの脅威に対する検出精度と堅牢性の両方を改善する上で,マルチモーダル融合の利点を強調した。
関連論文リスト
- BIDO: A Unified Approach to Address Obfuscation and Concept Drift Challenges in Image-based Malware Detection [15.388728305777908]
BIDOは、難読化とコンセプトドリフトの両方に対する堅牢性を高めるために設計されたハイブリッドイメージベースのマルウェア検出器である。
具体的には,画像特徴の識別能力を向上させるために,局所的特徴選択モジュールを導入する。
第3に,特徴のコンパクト性を確保するために,同一のラベルを持つサンプルを近い位置から抽出する学習可能なメトリクスを設計する。
論文 参考訳(メタデータ) (2025-09-04T01:48:03Z) - AgentDroid: A Multi-Agent Framework for Detecting Fraudulent Android Applications [8.108572518706566]
AgentDroidは、マルチモーダル分析とマルチエージェントシステムに基づく、Androidの不正なアプリケーション検出のための新しいフレームワークである。
Androidアプリケーションを処理し、分析のために一連のマルチモーダルデータを抽出する。
本フレームワークは91.7%,F1スコア91.68%の精度を実現し,ベースライン法よりも検出精度が向上した。
論文 参考訳(メタデータ) (2025-03-15T15:07:43Z) - CorrNetDroid: Android Malware Detector leveraging a Correlation-based Feature Selection for Network Traffic features [2.9069289358935073]
本研究では,ネットワークトラフィックフローで動作する動的解析ベースのAndroidマルウェア検出システムであるCorrNetDroidを提案する。
多くのトラフィック機能は、通常のデータセットとマルウェアのデータセットに重複する範囲を示す。
本モデルでは,2つのネットワークトラフィック機能のみを考慮すると,Androidのマルウェアを99.50%の精度で検出しながら,機能セットを効果的に削減する。
論文 参考訳(メタデータ) (2025-03-03T10:52:34Z) - RADAR: Robust Two-stage Modality-incomplete Industrial Anomaly Detection [61.71770293720491]
本稿では,2段階のロバスト・モードアリティ不完全融合とFlaAmewoRkの検出について提案する。
我々のブートストラッピング哲学は、MIIADの2段階を強化し、マルチモーダルトランスの堅牢性を向上させることである。
実験の結果,提案手法は従来のMIAD法よりも有効性とロバスト性に優れていた。
論文 参考訳(メタデータ) (2024-10-02T16:47:55Z) - MASKDROID: Robust Android Malware Detection with Masked Graph Representations [56.09270390096083]
マルウェアを識別する強力な識別能力を持つ強力な検出器MASKDROIDを提案する。
我々は、グラフニューラルネットワークベースのフレームワークにマスキング機構を導入し、MASKDROIDに入力グラフ全体の復元を強制する。
この戦略により、モデルは悪意のあるセマンティクスを理解し、より安定した表現を学習し、敵攻撃に対する堅牢性を高めることができる。
論文 参考訳(メタデータ) (2024-09-29T07:22:47Z) - Confidence-aware multi-modality learning for eye disease screening [58.861421804458395]
眼疾患スクリーニングのための新しい多モード顕在核融合パイプラインを提案する。
モダリティごとに信頼度を測り、マルチモダリティ情報をエレガントに統合する。
パブリックデータセットと内部データセットの両方の実験結果は、我々のモデルが堅牢性に優れていることを示している。
論文 参考訳(メタデータ) (2024-05-28T13:27:30Z) - Deep Learning Fusion For Effective Malware Detection: Leveraging Visual Features [12.431734971186673]
本研究では,マルウェアの実行可能量の異なるモードで学習した畳み込みニューラルネットワークモデルを融合する能力について検討する。
我々は3種類の視覚的マルウェアを利用した新しいマルチモーダル融合アルゴリズムを提案している。
提案した戦略は、与えられたデータセット内のマルウェアを識別する際の検出レート1.00(0-1)である。
論文 参考訳(メタデータ) (2024-05-23T08:32:40Z) - Multimodal Industrial Anomaly Detection via Hybrid Fusion [59.16333340582885]
ハイブリッド核融合方式を用いた新しいマルチモーダル異常検出法を提案する。
本モデルでは,MVTecD-3 ADデータセットにおける検出精度とセグメンテーション精度の両面で,最先端(SOTA)手法より優れている。
論文 参考訳(メタデータ) (2023-03-01T15:48:27Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z) - M2Net: Multi-modal Multi-channel Network for Overall Survival Time
Prediction of Brain Tumor Patients [151.4352001822956]
生存時間(OS)の早期かつ正確な予測は、脳腫瘍患者に対するより良い治療計画を得るのに役立つ。
既存の予測手法は、磁気共鳴(MR)ボリュームの局所的な病変領域における放射能特性に依存している。
我々は,マルチモーダルマルチチャネルネットワーク(M2Net)のエンドツーエンドOS時間予測モデルを提案する。
論文 参考訳(メタデータ) (2020-06-01T05:21:37Z) - Investigating Vulnerability to Adversarial Examples on Multimodal Data
Fusion in Deep Learning [32.125310341415755]
本研究では,現在のマルチモーダル核融合モデルが相補的インテリジェンスを利用して敵攻撃を防いでいるかを検討した。
予測精度の向上のために最適化されたマルチモーダル融合モデルは, たとえ1つのセンサのみを攻撃しても, 敵攻撃に対して脆弱であることを確認した。
論文 参考訳(メタデータ) (2020-05-22T03:45:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。