論文の概要: The Role of Domain-Specific Features in Malware Detection: A macOS Case Study
- arxiv url: http://arxiv.org/abs/2606.03218v1
- Date: Tue, 02 Jun 2026 06:25:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.80588
- Title: The Role of Domain-Specific Features in Malware Detection: A macOS Case Study
- Title(参考訳): マルウェア検出におけるドメイン特化機能の役割:macOSケーススタディ
- Authors: Biagio Montaruli, Andrea Oliveri, Savino Dambra, Davide Balzarotti,
- Abstract要約: 我々は、機械学習マルウェア検出装置をトレーニングするために、組み込み証明書、権利、永続化技術、および主要なシステムAPIなどの新しいドメイン固有の機能を使用します。
11,413個の良性および29,716個の悪意のある実行可能ファイルからなる41,129個のサンプルからなる新しいデータセットを総合的に評価した。
我々の検出器は非常に高い検出率 (99.50%) を維持し、 (ii) は最先端を50%向上させ、 (iii) ドメイン固有の特徴は新規なマルウェアサンプルの一般化に不可欠である。
- 参考スコア(独自算出の注目度): 10.874513963665548
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the growing popularity of macOS among end users and enterprise systems, malware research has primarily focused on Windows and Android operating systems, leaving the problem of macOS malware detection relatively unexplored. Indeed, the specificity of the operating system and the unique characteristics of the Mach-O file format can play a fundamental role in the classification of unknown samples, drastically increasing the detection rate. In this work, for the first time in the literature, we employ new domain-specific features, i.e., static features specific to macOS binaries, such as embedded certificates, entitlements, persistence techniques and key system APIs, to train a machine learning malware detector. We perform a comprehensive experimental evaluation on a novel dataset of 41,129 samples, comprising 11,413 benign and 29,716 malicious executables, and demonstrate that our solution achieves state-of-the-art detection performance (98.50%), outperforming all existing approaches, with an average improvement of 16% in terms of detection rate. We also provide an in-depth analysis of the importance of the individual features, showing that our detector effectively leverages the new domain-specific features. Then, in order to evaluate the generalization capabilities of our detector over time, we perform a real-world evaluation on a new dataset of 9,000 fresh macOS executables. The results show that (i) our detector maintains a very high detection rate (99.50%), (ii) outperforms the state-of-the-art by 50%, and (iii) the domain-specific features are crucial for generalizing to novel malware samples, as their removal leads to a 15.92% drop in detection performance. Finally, we also release our dataset to the research community.
- Abstract(参考訳): エンドユーザーやエンタープライズシステムの間でmacOSの人気が高まっているにもかかわらず、マルウェアの研究は主にWindowsとAndroidのオペレーティングシステムに焦点を当てており、macOSのマルウェア検出の問題は比較的未解決のままである。
実際、オペレーティングシステムの特異性とMach-Oファイル形式の特徴は、未知のサンプルの分類において基本的な役割を担い、検出率を大幅に向上させる。
この研究では、文献の中で初めて、組み込み証明書、権利付与、永続化技術、キーシステムAPIなど、macOSバイナリに特有の静的機能という、新しいドメイン固有の機能を使用して、機械学習マルウェア検出のトレーニングを行います。
11,413個の良性および29,716個の悪意のある実行可能ファイルからなる41,129個のサンプルからなる新しいデータセットの総合的な実験評価を行い、本ソリューションが最先端検出性能(98.50%)を達成することを実証した。
また、個々の特徴の重要性を詳細に分析し、新しいドメイン固有の特徴を効果的に活用していることを示す。
そして,検出器の時間的一般化能力を評価するために,9000個の新しいmacOS実行環境のデータセットを実環境で評価する。
その結果は
(i)検出器は非常に高い検出率(99.50%)を維持している。
(二)最先端を50%上回り、
三 ドメイン固有の特徴は、検出性能の15.92%の低下につながるため、新しいマルウェアサンプルへの一般化に不可欠である。
最後に、私たちのデータセットを研究コミュニティにリリースします。
関連論文リスト
- On the Generalizability of Machine Learning-based Ransomware Detection in Block Storage [0.0]
ランサムウェアの活動を特定するためのIO操作を効率的に抽出・解析できるカーネルベースのフレームワークを提案する。
本手法では,MLモデルに最適化された計算軽量な特徴群を用いて,悪質な活動から悪質な活動を正確に識別する。
経験的検証により,決定木に基づくモデルが極めて有効であることが判明した。
論文 参考訳(メタデータ) (2024-12-30T17:02:37Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [89.92916473403108]
本稿では,新しい手法のモジュラーフレームワークであるADerの総合的な視覚異常検出ベンチマークを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - ML-Based Behavioral Malware Detection Is Far From a Solved Problem [24.699642272580764]
マルウェア検出は、セキュリティにおける機械学習(ML)のユビキタスな応用である。
デプロイメントでは、エンドポイントホストのマルウェア検出は、サンドボックスからではなく、エンドポイントホストから取得したトレースに依存する必要があることが多い。
実世界のエンドポイントにおけるMLベースのマルウェア検知器の性能を初めて測定する。
論文 参考訳(メタデータ) (2024-05-09T22:04:55Z) - Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.668411293817464]
業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。
学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。
利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文 参考訳(メタデータ) (2023-12-25T21:25:55Z) - Discovering Malicious Signatures in Software from Structural
Interactions [7.06449725392051]
本稿では,ディープラーニング,数学的手法,ネットワーク科学を活用する新しいマルウェア検出手法を提案する。
提案手法は静的および動的解析に焦点をあて,LLVM(Lower-Level Virtual Machine)を用いて複雑なネットワーク内のアプリケーションをプロファイリングする。
弊社のアプローチは、マルウェアの検出を大幅に改善し、より正確で効率的なソリューションを提供する。
論文 参考訳(メタデータ) (2023-12-19T23:42:20Z) - Investigating Feature and Model Importance in Android Malware Detection: An Implemented Survey and Experimental Comparison of ML-Based Methods [2.9248916859490173]
静的解析だけで抽出した特徴を用いて高い検出精度が得られることを示す。
ランダムフォレストは一般的に最も効果的なモデルであり、より複雑なディープラーニングアプローチよりも優れている。
論文 参考訳(メタデータ) (2023-01-30T10:48:10Z) - Towards a Fair Comparison and Realistic Design and Evaluation Framework
of Android Malware Detectors [63.75363908696257]
一般的な評価フレームワークを用いて,Androidのマルウェア検出に関する10の研究成果を分析した。
データセットの作成やデザイナの設計に考慮しない場合、トレーニングされたMLモデルに大きく影響する5つの要因を特定します。
その結果,MLに基づく検出器は楽観的に評価され,良好な結果が得られた。
論文 参考訳(メタデータ) (2022-05-25T08:28:08Z) - Beyond the Hype: A Real-World Evaluation of the Impact and Cost of
Machine Learning-Based Malware Detection [5.876081415416375]
市販のマルウェア検知器の科学的検査が不足している。
市場をリードする4つのマルウェア検出ツールの科学的評価を行う。
以上の結果から,4つのツールがほぼ完璧な精度で再現できることが示唆された。
論文 参考訳(メタデータ) (2020-12-16T19:10:00Z) - No Need to Know Physics: Resilience of Process-based Model-free Anomaly
Detection for Industrial Control Systems [95.54151664013011]
本稿では,システムの物理的特性に反する逆スプーフ信号を生成するための新しい枠組みを提案する。
トップセキュリティカンファレンスで公表された4つの異常検知器を分析した。
論文 参考訳(メタデータ) (2020-12-07T11:02:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。