論文の概要: BinImg2Vec: Augmenting Malware Binary Image Classification with Data2Vec
- arxiv url: http://arxiv.org/abs/2209.00782v1
- Date: Fri, 2 Sep 2022 01:55:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-05 12:21:40.213234
- Title: BinImg2Vec: Augmenting Malware Binary Image Classification with Data2Vec
- Title(参考訳): BinImg2Vec: Data2Vecによるマルウェアバイナリイメージの分類を強化
- Authors: Joon Sern Lee, Kai Keng Tay, Zong Fu Chua
- Abstract要約: マルウェア・アズ・ア・サービス(Malware-as-a-service)は現在、サイバー犯罪者のブームとなっている。
マルウェア活動の急増に伴い、サイバーディフェンダーは、手元にあるマルウェアのサンプルについてより深く理解することが不可欠である。
本稿では,自己教師付き学習と教師付き学習の両方を取り入れた,マルウェアバイナリイメージ分類器のトレーニングフレームワークであるBinImg2Vecを紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rapid digitalisation spurred by the Covid-19 pandemic has resulted in more
cyber crime. Malware-as-a-service is now a booming business for cyber
criminals. With the surge in malware activities, it is vital for cyber
defenders to understand more about the malware samples they have at hand as
such information can greatly influence their next course of actions during a
breach. Recently, researchers have shown how malware family classification can
be done by first converting malware binaries into grayscale images and then
passing them through neural networks for classification. However, most work
focus on studying the impact of different neural network architectures on
classification performance. In the last year, researchers have shown that
augmenting supervised learning with self-supervised learning can improve
performance. Even more recently, Data2Vec was proposed as a modality agnostic
self-supervised framework to train neural networks. In this paper, we present
BinImg2Vec, a framework of training malware binary image classifiers that
incorporates both self-supervised learning and supervised learning to produce a
model that consistently outperforms one trained only via supervised learning.
We were able to achieve a 4% improvement in classification performance and a
0.5% reduction in performance variance over multiple runs. We also show how our
framework produces embeddings that can be well clustered, facilitating model
explanability.
- Abstract(参考訳): 新型コロナウイルスのパンデミックによって急激なデジタル化が加速し、サイバー犯罪が増えている。
マルウェア・アズ・ア・サービスは現在、サイバー犯罪者のブームとなっている。
マルウェアの活動が急増する中で、サイバーディフェンダーが手元にあるマルウェアのサンプルについてもっと理解することが不可欠である。
最近、研究者はマルウェアの分類が、まずマルウェアのバイナリをグレースケールの画像に変換し、次にそれらをニューラルネットワークに渡して分類する方法を示した。
しかし、ほとんどの作業は、異なるニューラルネットワークアーキテクチャが分類性能に与える影響を研究することに焦点を当てている。
昨年、教師付き学習を自己教師付き学習で強化することで、パフォーマンスが向上することが示された。
さらに最近では、ニューラルネットワークをトレーニングするためのモダリティ非依存な自己教師付きフレームワークとして、data2vecが提案された。
本稿では、自己教師付き学習と教師付き学習の両方を取り入れたマルウェアバイナリイメージ分類器を訓練するフレームワークであるBinImg2Vecについて、教師付き学習によってのみ訓練されたモデルより一貫して優れるモデルを作成する。
分類性能が4%向上し、複数の実行に対するパフォーマンスのばらつきが0.5%低減できた。
また、当社のフレームワークがうまくクラスタ化できる組込みをどのように生成し、モデルの可読性を促進するかを示します。
関連論文リスト
- Class-Incremental Learning: A Survey [84.30083092434938]
CIL(Class-Incremental Learning)は、学習者が新しいクラスの知識を段階的に取り入れることを可能にする。
CILは、前者の特徴を壊滅的に忘れる傾向にあり、その性能は劇的に低下する。
ベンチマーク画像分類タスクにおける17の手法の厳密で統一的な評価を行い、異なるアルゴリズムの特徴を明らかにする。
論文 参考訳(メタデータ) (2023-02-07T17:59:05Z) - Backdoor Attack Detection in Computer Vision by Applying Matrix
Factorization on the Weights of Deep Networks [6.44397009982949]
本稿では,事前訓練したDNNの重みから特徴を抽出するバックドア検出手法を提案する。
他の検出技術と比較して、これはトレーニングデータを必要としないなど、多くのメリットがある。
提案手法は, 競合するアルゴリズムよりも効率性が高く, より正確であり, 深層学習とAIの安全な適用を確実にするのに役立つ。
論文 参考訳(メタデータ) (2022-12-15T20:20:18Z) - Masked Unsupervised Self-training for Zero-shot Image Classification [98.23094305347709]
Masked Unsupervised Self-Training (MUST)は、疑似ラベルと生画像という2つの異なる、補完的な監督源を活用する新しいアプローチである。
MUSTはCLIPを大きなマージンで改善し、教師なしと教師なしの分類のパフォーマンスギャップを狭める。
論文 参考訳(メタデータ) (2022-06-07T02:03:06Z) - Efficient and Robust Classification for Sparse Attacks [34.48667992227529]
我々は、画像認識、自然言語処理、マルウェア検出の領域において効果的な攻撃として示されてきた$ell$-normで束縛された摂動を考える。
我々は,「トランケーション」と「アドリアル・トレーニング」を組み合わせた新しい防衛手法を提案する。
得られた洞察に触発され、これらのコンポーネントをニューラルネットワーク分類器に拡張する。
論文 参考訳(メタデータ) (2022-01-23T21:18:17Z) - Malware Classification Using Deep Boosted Learning [0.6562256987706127]
本研究は,Deep boosted Feature Space-based Malware Classification (DFS-MC) と題する,新たなハイブリッド学習型マルウェア分類フレームワークを提案する。
提案フレームワークでは,最高のカスタマイズCNNアーキテクチャモデルの特徴空間と,分類のためのSVMによる識別を融合することにより,識別能力が向上する。
DFS-MCは98.61%、Fスコアは0.96、精度は0.96、リコールは0.96である。
論文 参考訳(メタデータ) (2021-07-08T17:53:33Z) - Anomaly Detection in Cybersecurity: Unsupervised, Graph-Based and
Supervised Learning Methods in Adversarial Environments [63.942632088208505]
現在の運用環境に固有ののは、敵対的機械学習の実践である。
本研究では,教師なし学習とグラフに基づく異常検出の可能性を検討する。
我々は,教師付きモデルの訓練時に,現実的な対人訓練機構を組み込んで,対人環境における強力な分類性能を実現する。
論文 参考訳(メタデータ) (2021-05-14T10:05:10Z) - BreakingBED -- Breaking Binary and Efficient Deep Neural Networks by
Adversarial Attacks [65.2021953284622]
CNNのホワイトボックス攻撃やブラックボックス攻撃に対する堅牢性について検討する。
結果は、蒸留されたCNN、エージェントベースの最新のprunedモデル、およびバイナライズニューラルネットワークのために示されています。
論文 参考訳(メタデータ) (2021-03-14T20:43:19Z) - Counterfactual Generative Networks [59.080843365828756]
画像生成過程を直接監督せずに訓練する独立した因果機構に分解することを提案する。
適切な誘導バイアスを活用することによって、これらのメカニズムは物体の形状、物体の質感、背景を解き放つ。
その結果, 偽画像は, 元の分類タスクにおける性能の低下を伴い, 分散性が向上することが示された。
論文 参考訳(メタデータ) (2021-01-15T10:23:12Z) - Classifying Malware Images with Convolutional Neural Network Models [2.363388546004777]
本稿では,静的マルウェア分類にいくつかの畳み込みニューラルネットワーク(CNN)モデルを用いる。
インセプションV3モデルは99.24%の精度を達成しており、現在の最先端システムによって達成される98.52%の精度よりも優れている。
論文 参考訳(メタデータ) (2020-10-30T07:39:30Z) - Scalable Backdoor Detection in Neural Networks [61.39635364047679]
ディープラーニングモデルは、トロイの木馬攻撃に対して脆弱で、攻撃者はトレーニング中にバックドアをインストールして、結果のモデルが小さなトリガーパッチで汚染されたサンプルを誤識別させる。
本稿では,ラベル数と計算複雑性が一致しない新たなトリガリバースエンジニアリング手法を提案する。
実験では,提案手法が純モデルからトロイの木馬モデルを分離する際の完全なスコアを達成できることが観察された。
論文 参考訳(メタデータ) (2020-06-10T04:12:53Z) - Exploring Optimal Deep Learning Models for Image-based Malware Variant
Classification [3.8073142980733]
本研究では,深層学習モデルの違いがマルウェアの分類精度に与える影響について検討した。
その結果,最新のディープラーニングモデルの1つを比較的低い転送度で微調整することで,最も高い分類精度が得られることがわかった。
論文 参考訳(メタデータ) (2020-04-10T23:45:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。