論文の概要: Comparative Analysis of Imbalanced Malware Byteplot Image Classification
using Transfer Learning
- arxiv url: http://arxiv.org/abs/2310.02742v1
- Date: Wed, 4 Oct 2023 11:33:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 15:30:05.792949
- Title: Comparative Analysis of Imbalanced Malware Byteplot Image Classification
using Transfer Learning
- Title(参考訳): トランスファーラーニングを用いた不均衡マルウェアバイトプロット画像分類の比較解析
- Authors: Jayasudha M, Ayesha Shaik, Gaurav Pendharkar, Soham Kumar, Muhesh
Kumar B, Sudharshanan Balaji
- Abstract要約: マルウェア検知器はマルウェアの署名を比較することでサイバー攻撃を支援する。
本稿では,6つのクラス分類モデルの性能を比較した。
クラス不均衡が大きくなるほど、収束に必要なエポックの数が少なくなる。
- 参考スコア(独自算出の注目度): 0.873811641236639
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cybersecurity is a major concern due to the increasing reliance on technology
and interconnected systems. Malware detectors help mitigate cyber-attacks by
comparing malware signatures. Machine learning can improve these detectors by
automating feature extraction, identifying patterns, and enhancing dynamic
analysis. In this paper, the performance of six multiclass classification
models is compared on the Malimg dataset, Blended dataset, and Malevis dataset
to gain insights into the effect of class imbalance on model performance and
convergence. It is observed that the more the class imbalance less the number
of epochs required for convergence and a high variance across the performance
of different models. Moreover, it is also observed that for malware detectors
ResNet50, EfficientNetB0, and DenseNet169 can handle imbalanced and balanced
data well. A maximum precision of 97% is obtained for the imbalanced dataset, a
maximum precision of 95% is obtained on the intermediate imbalance dataset, and
a maximum precision of 95% is obtained for the perfectly balanced dataset.
- Abstract(参考訳): サイバーセキュリティは、技術と相互接続システムへの依存が増しているため、大きな懸念事項である。
マルウェア検知器は、マルウェアの署名を比較することでサイバー攻撃を緩和する。
機械学習は、特徴抽出の自動化、パターンの識別、動的解析の強化により、これらの検出器を改善することができる。
本稿では,Malimgデータセット,Blendedデータセット,Malevisデータセットの6つのクラス分類モデルの性能を比較し,モデル性能と収束性に対するクラス不均衡の影響について考察する。
クラス不均衡が大きくなるほど、収束に必要なエポックの数が少なくなり、異なるモデルの性能に高いばらつきが生じることが観察された。
さらに、マルウェア検出用ResNet50、EfficientNetB0、DenseNet169は、不均衡およびバランスの取れたデータをうまく処理できる。
不均衡データセットの最大精度は97%、中間不均衡データセットの最大精度は95%、完全均衡データセットの最大精度は95%である。
関連論文リスト
- Efficient Network Traffic Feature Sets for IoT Intrusion Detection [0.0]
この研究は、複数のIoTネットワークデータセットで、Information Gain、Chi-Squared Test、Recursive Feature Elimination、Mean Absolute Deviation、Dispersion Ratioといった、さまざまな機能選択メソッドの組み合わせによって提供される機能セットを評価します。
より小さな特徴セットがMLモデルの分類性能とトレーニング時間の両方に与える影響を比較し,IoT侵入検出の計算効率を高めることを目的とした。
論文 参考訳(メタデータ) (2024-06-12T09:51:29Z) - PrivFED -- A Framework for Privacy-Preserving Federated Learning in Enhanced Breast Cancer Diagnosis [0.0]
本研究では、ウィスコンシンデータセットに基づいてトレーニングされたフェデレーション学習フレームワークを導入し、データの不足や不均衡といった課題を軽減する。
このモデルの平均精度はエッジデバイスで99.95%、中央サーバで98%である。
論文 参考訳(メタデータ) (2024-05-13T18:01:57Z) - Class Imbalance in Object Detection: An Experimental Diagnosis and Study
of Mitigation Strategies [0.5439020425818999]
本研究は, YOLOv5単段検出器を用いて, 前地上クラス不均衡問題に対処するベンチマークフレームワークを提案する。
我々は,サンプリング,損失重み付け,データ強化という3つの確立した手法を精査した。
比較分析の結果,2段階検出法では有効であるが,YOLOv5の性能向上には有効ではないことが明らかとなった。
論文 参考訳(メタデータ) (2024-03-11T19:06:04Z) - CLIP the Bias: How Useful is Balancing Data in Multimodal Learning? [72.19502317793133]
比較言語画像事前学習(CLIP)におけるバイアス軽減のためのデータバランスの有効性について検討する。
表現バイアスと相関バイアスの両方を低減するために,Multi-Modal Moment Matching (M4) と呼ばれる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-07T14:43:17Z) - Machine learning-based network intrusion detection for big and
imbalanced data using oversampling, stacking feature embedding and feature
extraction [6.374540518226326]
侵入検知システム(IDS)は、悪意あるアクターや活動を検出することによって相互接続ネットワークを保護する上で重要な役割を果たす。
本稿では,データ不均衡にRandom Oversampling (RO) を用いる新しいMLベースのネットワーク侵入検出モデルと,次元削減のためのStacking Feature Embedding (PCA)を提案する。
CIC-IDS 2017データセットを使用すると、DT、RF、ETモデルは99.99%の精度に達し、DTとRFモデルはCIC-IDS 2018データセットで99.94%の精度が得られる。
論文 参考訳(メタデータ) (2024-01-22T05:49:41Z) - Few-shot learning for COVID-19 Chest X-Ray Classification with
Imbalanced Data: An Inter vs. Intra Domain Study [49.5374512525016]
医療画像データセットは、コンピュータ支援診断、治療計画、医学研究に使用される訓練モデルに不可欠である。
データ分散のばらつき、データの不足、ジェネリックイメージから事前トレーニングされたモデルを使用する場合の転送学習の問題などである。
本稿では,データ不足と分散不均衡の影響を軽減するために,一連の手法を統合したシームズニューラルネットワークに基づく手法を提案する。
論文 参考訳(メタデータ) (2024-01-18T16:59:27Z) - Analyzing the Effects of Handling Data Imbalance on Learned Features
from Medical Images by Looking Into the Models [50.537859423741644]
不均衡なデータセットでモデルをトレーニングすることは、学習問題にユニークな課題をもたらす可能性がある。
ニューラルネットワークの内部ユニットを深く調べて、データの不均衡処理が学習した機能にどのように影響するかを観察します。
論文 参考訳(メタデータ) (2022-04-04T09:38:38Z) - Adversarial Self-Supervised Contrastive Learning [62.17538130778111]
既存の対数学習アプローチは、主にクラスラベルを使用して、誤った予測につながる対数サンプルを生成する。
本稿では,未ラベルデータに対する新たな逆攻撃を提案する。これにより,モデルが摂動データサンプルのインスタンスレベルのアイデンティティを混乱させる。
ラベル付きデータなしで頑健なニューラルネットワークを逆さまにトレーニングするための,自己教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-13T08:24:33Z) - Long-Tailed Recognition Using Class-Balanced Experts [128.73438243408393]
本稿では,多様な分類器の強度を組み合わせたクラスバランスの専門家のアンサンブルを提案する。
私たちのクラスバランスの専門家のアンサンブルは、最先端に近い結果に到達し、長い尾の認識のための2つのベンチマークで新たな最先端のアンサンブルを確立します。
論文 参考訳(メタデータ) (2020-04-07T20:57:44Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z) - On the Role of Dataset Quality and Heterogeneity in Model Confidence [27.657631193015252]
安全クリティカルなアプリケーションは、正確で校正された確率を出力する機械学習モデルを必要とする。
未分類のディープネットワークは、過度に信頼された予測をすることが知られている。
本研究では,データセットサイズとラベルノイズがモデルの信頼性に与える影響について検討した。
論文 参考訳(メタデータ) (2020-02-23T05:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。