論文の概要: A Feature Set of Small Size for the PDF Malware Detection
- arxiv url: http://arxiv.org/abs/2308.04704v2
- Date: Thu, 10 Aug 2023 03:08:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-11 15:09:52.718138
- Title: A Feature Set of Small Size for the PDF Malware Detection
- Title(参考訳): PDFマルウェア検出のための小サイズの特徴セット
- Authors: Ran Liu and Charles Nicholas
- Abstract要約: PDFファイルのドメイン知識をあまり必要としない小さな機能セットを提案する。
ランダムフォレストモデルを用いた場合の最適精度は99.75%である。
その質素なサイズにもかかわらず、我々は、はるかに大きな機能セットを使用する最先端技術に匹敵する結果を得る。
- 参考スコア(独自算出の注目度): 8.282177703075451
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning (ML)-based malware detection systems are becoming
increasingly important as malware threats increase and get more sophisticated.
PDF files are often used as vectors for phishing attacks because they are
widely regarded as trustworthy data resources, and are accessible across
different platforms. Therefore, researchers have developed many different PDF
malware detection methods. Performance in detecting PDF malware is greatly
influenced by feature selection. In this research, we propose a small features
set that don't require too much domain knowledge of the PDF file. We evaluate
proposed features with six different machine learning models. We report the
best accuracy of 99.75% when using Random Forest model. Our proposed feature
set, which consists of just 12 features, is one of the most conciseness in the
field of PDF malware detection. Despite its modest size, we obtain comparable
results to state-of-the-art that employ a much larger set of features.
- Abstract(参考訳): 機械学習(ml)ベースのマルウェア検出システムは、マルウェアの脅威が増え、より洗練されていくにつれて、ますます重要になっている。
pdfファイルはしばしばフィッシング攻撃のベクターとして使われ、信頼性の高いデータリソースと見なされ、異なるプラットフォームでアクセス可能である。
そのため、研究者は様々なPDFマルウェア検出方法を開発した。
PDFマルウェアの検出性能は特徴選択の影響が大きい。
本研究ではPDFファイルのドメイン知識をあまり必要としない小さな機能セットを提案する。
提案する特徴を6種類の機械学習モデルを用いて評価する。
ランダムフォレストモデルを用いた場合の最適精度は99.75%である。
提案する機能セットは,わずか12の機能で構成され,pdfマルウェア検出の分野で最も簡潔な1つである。
ささやかなサイズにもかかわらず、私たちはより大きな機能セットを使用する最先端の技術に匹敵する結果を得ています。
関連論文リスト
- PDF-WuKong: A Large Multimodal Model for Efficient Long PDF Reading with End-to-End Sparse Sampling [63.93112754821312]
文書理解は、大量のテキストや視覚情報を処理し、理解する上で難しい課題である。
大規模言語モデル(LLM)の最近の進歩は、このタスクの性能を大幅に改善した。
長いPDF文書に対する多モーダル質問回答(QA)を強化するために設計された多モーダル大言語モデル(MLLM)であるPDF-WuKongを紹介する。
論文 参考訳(メタデータ) (2024-10-08T12:17:42Z) - Detecting new obfuscated malware variants: A lightweight and interpretable machine learning approach [0.0]
本稿では,高度に正確で軽量で解釈可能な,難読化マルウェアを検出する機械学習システムを提案する。
本システムでは,1つのマルウェアサブタイプ,すなわちSpywareファミリーのTransponderでのみ訓練されているにもかかわらず,15種類のマルウェアサブタイプを検出することができる。
トランスポンダー中心のモデルは99.8%を超え、平均処理速度はファイルあたり5.7マイクロ秒であった。
論文 参考訳(メタデータ) (2024-07-07T12:41:40Z) - Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.668411293817464]
業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。
学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。
利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文 参考訳(メタデータ) (2023-12-25T21:25:55Z) - DRSM: De-Randomized Smoothing on Malware Classifier Providing Certified
Robustness [58.23214712926585]
我々は,マルウェア検出領域の非ランダム化スムース化技術を再設計し,DRSM(De-Randomized Smoothed MalConv)を開発した。
具体的には,実行可能ファイルの局所構造を最大に保ちながら,逆数バイトの影響を確実に抑制するウィンドウアブレーション方式を提案する。
私たちは、マルウェア実行ファイルの静的検出という領域で、認証された堅牢性を提供する最初の人です。
論文 参考訳(メタデータ) (2023-03-20T17:25:22Z) - Investigating Feature and Model Importance in Android Malware Detection: An Implemented Survey and Experimental Comparison of ML-Based Methods [2.9248916859490173]
静的解析だけで抽出した特徴を用いて高い検出精度が得られることを示す。
ランダムフォレストは一般的に最も効果的なモデルであり、より複雑なディープラーニングアプローチよりも優れている。
論文 参考訳(メタデータ) (2023-01-30T10:48:10Z) - Towards a Fair Comparison and Realistic Design and Evaluation Framework
of Android Malware Detectors [63.75363908696257]
一般的な評価フレームワークを用いて,Androidのマルウェア検出に関する10の研究成果を分析した。
データセットの作成やデザイナの設計に考慮しない場合、トレーニングされたMLモデルに大きく影響する5つの要因を特定します。
その結果,MLに基づく検出器は楽観的に評価され,良好な結果が得られた。
論文 参考訳(メタデータ) (2022-05-25T08:28:08Z) - Mate! Are You Really Aware? An Explainability-Guided Testing Framework
for Robustness of Malware Detectors [49.34155921877441]
マルウェア検出装置のロバスト性を示すための説明可能性誘導型およびモデルに依存しないテストフレームワークを提案する。
次に、このフレームワークを使用して、操作されたマルウェアを検出する最先端のマルウェア検知器の能力をテストする。
我々の発見は、現在のマルウェア検知器の限界と、その改善方法に光を当てた。
論文 参考訳(メタデータ) (2021-11-19T08:02:38Z) - HAPSSA: Holistic Approach to PDF Malware Detection Using Signal and
Statistical Analysis [16.224649756613655]
悪意あるPDF文書は、様々なセキュリティ組織に深刻な脅威をもたらす。
最先端のアプローチでは、機械学習(ML)を使用してPDFマルウェアを特徴付ける機能を学ぶ。
本稿では,PDF マルウェア検出のための簡易かつ効果的な総合的なアプローチを導出する。
論文 参考訳(メタデータ) (2021-11-08T18:32:47Z) - PDF-Malware: An Overview on Threats, Detection and Evasion Attacks [0.966840768820136]
PDFが広く使われるようになったことで、良心的ユーザーの間では、本質的な安全性の虚偽の印象が生まれている。
本稿では,PDFマルウェア検出問題の概要について述べる。
論文 参考訳(メタデータ) (2021-07-27T15:15:20Z) - Detecting malicious PDF using CNN [46.86114958340962]
悪意のあるPDFファイルは、コンピュータセキュリティに対する最大の脅威の1つだ。
本稿では,ファイルのバイトレベルにおける畳み込みニューラルネットワーク(CNN)のアンサンブルを用いた新しいアルゴリズムを提案する。
オンラインでダウンロード可能な90000ファイルのデータセットを用いて,本手法はPDFマルウェアの高検出率(94%)を維持していることを示す。
論文 参考訳(メタデータ) (2020-07-24T18:27:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。