論文の概要: Malware families discovery via Open-Set Recognition on Android manifest permissions
- arxiv url: http://arxiv.org/abs/2505.12750v1
- Date: Mon, 19 May 2025 06:19:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.437101
- Title: Malware families discovery via Open-Set Recognition on Android manifest permissions
- Title(参考訳): Androidのオープンセット認識によるマルウェアの家族発見
- Authors: Filippo Leveni, Matteo Mistura, Francesco Iubatti, Carmine Giangregorio, Nicolò Pastore, Cesare Alippi, Giacomo Boracchi,
- Abstract要約: マルウェアプログラムをそれぞれの家族に分類することは、サイバー脅威に対する効果的な防御を構築するために不可欠である。
本稿では,既知のマルウェアを分類する上で,新たなマルウェアを検出するマルウェア分類システムを提案する。
私たちのソリューションは、標準的な分類ワークフローでシームレスに使用できるので、非常に実用的であることが分かりました。
- 参考スコア(独自算出の注目度): 15.838751258859004
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Malware are malicious programs that are grouped into families based on their penetration technique, source code, and other characteristics. Classifying malware programs into their respective families is essential for building effective defenses against cyber threats. Machine learning models have a huge potential in malware detection on mobile devices, as malware families can be recognized by classifying permission data extracted from Android manifest files. Still, the malware classification task is challenging due to the high-dimensional nature of permission data and the limited availability of training samples. In particular, the steady emergence of new malware families makes it impossible to acquire a comprehensive training set covering all the malware classes. In this work, we present a malware classification system that, on top of classifying known malware, detects new ones. In particular, we combine an open-set recognition technique developed within the computer vision community, namely MaxLogit, with a tree-based Gradient Boosting classifier, which is particularly effective in classifying high-dimensional data. Our solution turns out to be very practical, as it can be seamlessly employed in a standard classification workflow, and efficient, as it adds minimal computational overhead. Experiments on public and proprietary datasets demonstrate the potential of our solution, which has been deployed in a business environment.
- Abstract(参考訳): マルウェアは、侵入テクニックやソースコード、その他の特徴に基づいて、家族にグループ化される悪意のあるプログラムである。
マルウェアプログラムをそれぞれの家族に分類することは、サイバー脅威に対する効果的な防御を構築するために不可欠である。
マシンラーニングモデルは、Androidマニフェストファイルから抽出された許可データを分類することで、マルウェアファミリーを認識することができるため、モバイルデバイス上でのマルウェア検出において大きな可能性を秘めている。
それでも、高次元的な許可データの性質とトレーニングサンプルの限定的利用のため、マルウェア分類作業は困難である。
特に、新しいマルウェアファミリーの着実に出現すると、すべてのマルウェアクラスをカバーする包括的なトレーニングセットを取得することは不可能になる。
本研究では,既知のマルウェアを分類した上で,新たなマルウェアを検出するマルウェア分類システムを提案する。
特に,コンピュータビジョンコミュニティ内で開発されたオープンセット認識技術であるMaxLogitと,高次元データの分類に特に有効である木ベースのGradient Boosting分類器を組み合わせる。
私たちのソリューションは、標準的な分類ワークフローでシームレスに利用でき、計算オーバーヘッドが最小限に抑えられるため、非常に実用的であることがわかりました。
パブリックおよびプロプライエタリなデータセットの実験は、ビジネス環境にデプロイされたソリューションの可能性を示しています。
関連論文リスト
- MASKDROID: Robust Android Malware Detection with Masked Graph Representations [56.09270390096083]
マルウェアを識別する強力な識別能力を持つ強力な検出器MASKDROIDを提案する。
我々は、グラフニューラルネットワークベースのフレームワークにマスキング機構を導入し、MASKDROIDに入力グラフ全体の復元を強制する。
この戦略により、モデルは悪意のあるセマンティクスを理解し、より安定した表現を学習し、敵攻撃に対する堅牢性を高めることができる。
論文 参考訳(メタデータ) (2024-09-29T07:22:47Z) - MalMixer: Few-Shot Malware Classification with Retrieval-Augmented Semi-Supervised Learning [8.724680868086626]
MalMixerは、スパーストレーニングデータを用いて精度の高い半教師付きマルウェアファミリー分類器である。
本稿では,マルウェアの特徴表現のためのドメイン認識型データ拡張手法を提案し,半教師付きマルウェアファミリー分類の性能を向上する。
論文 参考訳(メタデータ) (2024-09-20T04:50:49Z) - Catch'em all: Classification of Rare, Prominent, and Novel Malware Families [3.147175286021779]
マルウェアは依然として最も危険でコストのかかるサイバー脅威の1つだ。
昨年、13億の既知のマルウェアの標本が報告された。
これらの課題には、新しいマルウェアの検出と、クラス不均衡に直面してマルウェア分類を実行する能力が含まれる。
論文 参考訳(メタデータ) (2024-03-04T23:46:19Z) - EMBERSim: A Large-Scale Databank for Boosting Similarity Search in
Malware Analysis [48.5877840394508]
近年,定量化によるマルウェア検出から機械学習への移行が進んでいる。
本稿では、EMBERから始まるバイナリファイルの類似性研究の領域における欠陥に対処することを提案する。
我々は、EMBERに類似情報とマルウェアのクラスタグを付与し、類似性空間のさらなる研究を可能にする。
論文 参考訳(メタデータ) (2023-10-03T06:58:45Z) - CNS-Net: Conservative Novelty Synthesizing Network for Malware
Recognition in an Open-set Scenario [14.059646012441313]
マルウェアオープンセット認識(MOSR)という,既知の未知の未知のマルウェア群と未知の未知のマルウェア群の両方に対するマルウェア認識の課題について検討する。
本稿では,未知のマルウェア群を模倣するマルウェアインスタンスを保存的に合成する新しいモデルを提案する。
我々はまた、大規模なオープンセットマルウェアベンチマークデータセットの欠如を埋めるために、MAL-100という新しい大規模マルウェアデータセットを構築した。
論文 参考訳(メタデータ) (2023-05-02T07:31:42Z) - DRSM: De-Randomized Smoothing on Malware Classifier Providing Certified
Robustness [58.23214712926585]
我々は,マルウェア検出領域の非ランダム化スムース化技術を再設計し,DRSM(De-Randomized Smoothed MalConv)を開発した。
具体的には,実行可能ファイルの局所構造を最大に保ちながら,逆数バイトの影響を確実に抑制するウィンドウアブレーション方式を提案する。
私たちは、マルウェア実行ファイルの静的検出という領域で、認証された堅牢性を提供する最初の人です。
論文 参考訳(メタデータ) (2023-03-20T17:25:22Z) - Evading Malware Classifiers via Monte Carlo Mutant Feature Discovery [23.294653273180472]
悪意のあるアクターが代理モデルを訓練して、インスタンスが誤分類される原因となるバイナリ変異を発見する方法を示す。
そして、変異したマルウェアが、抗ウイルスAPIの代わりとなる被害者モデルに送られ、検出を回避できるかどうかをテストする。
論文 参考訳(メタデータ) (2021-06-15T03:31:02Z) - Being Single Has Benefits. Instance Poisoning to Deceive Malware
Classifiers [47.828297621738265]
攻撃者は、マルウェア分類器を訓練するために使用されるデータセットをターゲットとした、高度で効率的な中毒攻撃を、どのように起動できるかを示す。
マルウェア検出領域における他の中毒攻撃とは対照的に、我々の攻撃はマルウェアファミリーではなく、移植されたトリガーを含む特定のマルウェアインスタンスに焦点を当てている。
我々は、この新たに発見された深刻な脅威に対する将来の高度な防御に役立つ包括的検出手法を提案する。
論文 参考訳(メタデータ) (2020-10-30T15:27:44Z) - Adversarial EXEmples: A Survey and Experimental Evaluation of Practical
Attacks on Machine Learning for Windows Malware Detection [67.53296659361598]
EXEmplesは、比較的少ない入力バイトを摂動することで、機械学習に基づく検出をバイパスすることができる。
我々は、機械学習モデルに対する過去の攻撃を包含し、一般化するだけでなく、3つの新たな攻撃を含む統一フレームワークを開発する。
これらの攻撃はFull DOS、Extended、Shiftと呼ばれ、DOSヘッダをそれぞれ操作し、拡張し、第1セクションの内容を変更することで、敵のペイロードを注入する。
論文 参考訳(メタデータ) (2020-08-17T07:16:57Z) - Deep Learning and Open Set Malware Classification: A Survey [0.0]
最近の機械学習の研究は、機械学習におけるオープンセット認識(OSR)問題に光を当てている。
OSRシステムは、既知のクラスを正しく分類するだけでなく、未知のクラスを認識すべきである。
本調査では,さまざまなディープラーニング技術の概要,OSRとグラフ表現ソリューションの議論,マルウェア分類システムの導入について概説する。
論文 参考訳(メタデータ) (2020-04-08T21:36:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。