論文の概要: Exploring Optimal Deep Learning Models for Image-based Malware Variant
Classification
- arxiv url: http://arxiv.org/abs/2004.05258v2
- Date: Sun, 23 Oct 2022 16:08:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 21:29:32.964151
- Title: Exploring Optimal Deep Learning Models for Image-based Malware Variant
Classification
- Title(参考訳): 画像に基づくマルウェア分類のための最適深層学習モデルの検討
- Authors: Rikima Mitsuhashi and Takahiro Shinagawa
- Abstract要約: 本研究では,深層学習モデルの違いがマルウェアの分類精度に与える影響について検討した。
その結果,最新のディープラーニングモデルの1つを比較的低い転送度で微調整することで,最も高い分類精度が得られることがわかった。
- 参考スコア(独自算出の注目度): 3.8073142980733
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Analyzing a huge amount of malware is a major burden for security analysts.
Since emerging malware is often a variant of existing malware, automatically
classifying malware into known families greatly reduces a part of their burden.
Image-based malware classification with deep learning is an attractive approach
for its simplicity, versatility, and affinity with the latest technologies.
However, the impact of differences in deep learning models and the degree of
transfer learning on the classification accuracy of malware variants has not
been fully studied. In this paper, we conducted an exhaustive survey of deep
learning models using 24 ImageNet pre-trained models and five fine-tuning
parameters, totaling 120 combinations, on two platforms. As a result, we found
that the highest classification accuracy was obtained by fine-tuning one of the
latest deep learning models with a relatively low degree of transfer learning,
and we achieved the highest classification accuracy ever in cross-validation on
the Malimg and Drebin datasets. We also confirmed that this trend holds true
for the recent malware variants using the VirusTotal 2020 Windows and Android
datasets. The experimental results suggest that it is effective to periodically
explore optimal deep learning models with the latest models and malware
datasets by gradually reducing the degree of transfer learning from half.
- Abstract(参考訳): 大量のマルウェアを分析することは、セキュリティアナリストにとって大きな負担だ。
出現するマルウェアは、しばしば既存のマルウェアの変種であるため、マルウェアを既知の家族に自動的に分類することは、その負担の一部を劇的に減らす。
ディープラーニングを用いた画像ベースのマルウェア分類は、そのシンプルさ、汎用性、最新の技術との親和性に対する魅力的なアプローチである。
しかし, 深層学習モデルの違いとトランスファー学習の程度がマルウェアの分類精度に与える影響については, 十分に検討されていない。
本稿では,2つのプラットフォーム上で,24のImageNet事前学習モデルと5つの微調整パラメータを用いたディープラーニングモデルの総合的な調査を行った。
その結果、最新のディープラーニングモデルの1つを比較的低い転送学習で微調整することで、最も高い分類精度が得られ、malimgとdrebinデータセットのクロスバリデーションにおいて、これまでで最高の分類精度が得られた。
この傾向は、VirusTotal 2020 WindowsとAndroidのデータセットを使った最近のマルウェアの変種にも当てはまります。
実験結果から,移動学習の程度を半分に減らし,最新のモデルとマルウェアデータセットを用いて最適なディープラーニングモデルを定期的に探索することが有効であることが示唆された。
関連論文リスト
- PromptSAM+: Malware Detection based on Prompt Segment Anything Model [8.00932560688061]
本稿では,大規模な視覚ネットワークセグメンテーションモデルに基づいて,視覚マルウェアの汎用化分類フレームワークであるPromptSAM+を提案する。
実験の結果,「PromptSAM+」はマルウェアの検出・分類において有効かつ効果的であり,偽陽性・偽陰性で高い精度と低率を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-08-04T15:42:34Z) - Detecting new obfuscated malware variants: A lightweight and interpretable machine learning approach [0.0]
本稿では,高度に正確で軽量で解釈可能な,難読化マルウェアを検出する機械学習システムを提案する。
本システムでは,1つのマルウェアサブタイプ,すなわちSpywareファミリーのTransponderでのみ訓練されているにもかかわらず,15種類のマルウェアサブタイプを検出することができる。
トランスポンダー中心のモデルは99.8%を超え、平均処理速度はファイルあたり5.7マイクロ秒であった。
論文 参考訳(メタデータ) (2024-07-07T12:41:40Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.668411293817464]
業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。
学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。
利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文 参考訳(メタデータ) (2023-12-25T21:25:55Z) - New Approach to Malware Detection Using Optimized Convolutional Neural
Network [0.0]
本稿では,マルウェアを高精度で高精度かつ効率的に検出する,新しい畳み込み型ディープラーニングニューラルネットワークを提案する。
ベースラインモデルは当初98%の精度を達成していたが、CNNモデルの深度を高めた後、99.183まで精度が向上した。
このCNNモデルの有効性をさらに高めるため、改良されたモデルを用いて、データセット内の新しいマルウェアサンプルの予測を行う。
論文 参考訳(メタデータ) (2023-01-26T15:06:47Z) - Continual Learning with Bayesian Model based on a Fixed Pre-trained
Feature Extractor [55.9023096444383]
現在のディープラーニングモデルは、新しいクラスを学ぶ際に古い知識を破滅的に忘れることによって特徴づけられる。
人間の脳における新しい知識の学習プロセスに着想を得て,連続学習のためのベイズ生成モデルを提案する。
論文 参考訳(メタデータ) (2022-04-28T08:41:51Z) - LifeLonger: A Benchmark for Continual Disease Classification [59.13735398630546]
MedMNISTコレクションの連続的な疾患分類のためのベンチマークであるLifeLongerを紹介する。
タスクとクラスでの病気の漸進的な学習は、モデルをスクラッチから再トレーニングすることなく、新しいサンプルを分類する問題に対処する。
クロスドメインインクリメンタル学習は、これまで得られた知識を維持しながら、異なる機関から派生したデータセットを扱う問題に対処する。
論文 参考訳(メタデータ) (2022-04-12T12:25:05Z) - Task-Aware Meta Learning-based Siamese Neural Network for Classifying
Obfuscated Malware [5.293553970082943]
既存のマルウェア検出方法は、トレーニングデータセットに難読化されたマルウェアサンプルが存在する場合、異なるマルウェアファミリーを正しく分類できない。
そこで我々は,このような制御フロー難読化技術に対して耐性を持つ,タスク対応の複数ショット学習型サイメスニューラルネットワークを提案する。
提案手法は,同一のマルウェアファミリーに属するマルウェアサンプルを正しく分類し,ユニークなマルウェアシグネチャの認識に極めて有効である。
論文 参考訳(メタデータ) (2021-10-26T04:44:13Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Classifying Malware Images with Convolutional Neural Network Models [2.363388546004777]
本稿では,静的マルウェア分類にいくつかの畳み込みニューラルネットワーク(CNN)モデルを用いる。
インセプションV3モデルは99.24%の精度を達成しており、現在の最先端システムによって達成される98.52%の精度よりも優れている。
論文 参考訳(メタデータ) (2020-10-30T07:39:30Z) - Scalable Backdoor Detection in Neural Networks [61.39635364047679]
ディープラーニングモデルは、トロイの木馬攻撃に対して脆弱で、攻撃者はトレーニング中にバックドアをインストールして、結果のモデルが小さなトリガーパッチで汚染されたサンプルを誤識別させる。
本稿では,ラベル数と計算複雑性が一致しない新たなトリガリバースエンジニアリング手法を提案する。
実験では,提案手法が純モデルからトロイの木馬モデルを分離する際の完全なスコアを達成できることが観察された。
論文 参考訳(メタデータ) (2020-06-10T04:12:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。