論文の概要: Enhancing IoT Cyber Attack Detection in the Presence of Highly Imbalanced Data
- arxiv url: http://arxiv.org/abs/2505.10600v1
- Date: Thu, 15 May 2025 14:02:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:13.280095
- Title: Enhancing IoT Cyber Attack Detection in the Presence of Highly Imbalanced Data
- Title(参考訳): 高度不均衡データ存在下でのIoTサイバー攻撃検出の強化
- Authors: Md. Ehsanul Haque, Md. Saymon Hosen Polash, Md Al-Imran Sanjida Simla, Md Alomgir Hossain, Sarwar Jahan,
- Abstract要約: 本研究では、ハイブリッドサンプリング技術を用いて、IoT領域のデータ不均衡検出精度を向上させる。
サイバー攻撃の分類に関して,複数の機械学習モデルの性能を評価する。
全体として、この研究は、ハイブリッドサンプリングの価値と堅牢なモデルと機能選択を組み合わせることで、IoTセキュリティを著しく改善することを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to the rapid growth in the number of Internet of Things (IoT) networks, the cyber risk has increased exponentially, and therefore, we have to develop effective IDS that can work well with highly imbalanced datasets. A high rate of missed threats can be the result, as traditional machine learning models tend to struggle in identifying attacks when normal data volume is much higher than the volume of attacks. For example, the dataset used in this study reveals a strong class imbalance with 94,659 instances of the majority class and only 28 instances of the minority class, making it quite challenging to determine rare attacks accurately. The challenges presented in this research are addressed by hybrid sampling techniques designed to improve data imbalance detection accuracy in IoT domains. After applying these techniques, we evaluate the performance of several machine learning models such as Random Forest, Soft Voting, Support Vector Classifier (SVC), K-Nearest Neighbors (KNN), Multi-Layer Perceptron (MLP), and Logistic Regression with respect to the classification of cyber-attacks. The obtained results indicate that the Random Forest model achieved the best performance with a Kappa score of 0.9903, test accuracy of 0.9961, and AUC of 0.9994. Strong performance is also shown by the Soft Voting model, with an accuracy of 0.9952 and AUC of 0.9997, indicating the benefits of combining model predictions. Overall, this work demonstrates the value of hybrid sampling combined with robust model and feature selection for significantly improving IoT security against cyber-attacks, especially in highly imbalanced data environments.
- Abstract(参考訳): モノのインターネット(IoT)ネットワークの急速な増加に伴い、サイバーリスクは指数関数的に増加しており、高度に不均衡なデータセットとうまく対応可能な効果的なIDSを開発する必要がある。
従来の機械学習モデルは、通常のデータボリュームが攻撃量よりもはるかに高い場合、攻撃を特定するのに苦労する。
例えば、この研究で使用されたデータセットは、多数派の94,659のインスタンスとマイノリティクラスの28のインスタンスと強い不均衡を示しており、稀な攻撃を正確に決定することは極めて困難である。
本研究で提示される課題は,IoT領域のデータ不均衡検出精度を改善するために設計されたハイブリッドサンプリング技術によって解決される。
これらの手法を適用した後、サイバー攻撃の分類に関して、ランダムフォレスト、ソフト投票、サポートベクトル分類器(SVC)、K-Nearest Neighbors(KNN)、Multi-Layer Perceptron(MLP)、ロジスティック回帰などの機械学習モデルの性能を評価する。
その結果,ランダムフォレストモデルは,カッパスコア0.9903,テスト精度0.9961,AUC0.9994で最高の成績を示した。
強い性能はSoft Votingモデルでも示されており、精度は0.9952、AUCは0.9997であり、モデル予測を組み合わせる利点を示している。
全体として、この研究は、ロバストなモデルと機能選択を組み合わせたハイブリッドサンプリングの価値を示し、特に高度に不均衡なデータ環境において、サイバー攻撃に対するIoTセキュリティを大幅に改善する。
関連論文リスト
- Generative Active Adaptation for Drifting and Imbalanced Network Intrusion Detection [15.146203784334086]
モデルロバスト性を高めつつラベル付けの労力を最小限に抑える生成能動適応フレームワークを提案する。
我々は、シミュレーションIDSデータと実世界のISPデータセットの両方でエンドツーエンドのフレームワークを評価した。
本フレームワークは,ラベリングコストを低減しつつ,レア攻撃検出を効果的に向上させ,実世界の侵入検知のためのスケーラブルで適応的なソリューションである。
論文 参考訳(メタデータ) (2025-03-04T21:49:42Z) - Hybrid Deep Convolutional Neural Networks Combined with Autoencoders And Augmented Data To Predict The Look-Up Table 2006 [2.082445711353476]
本研究では、自己エンコーダとデータ拡張技術により強化されたハイブリッドディープ畳み込みニューラルネットワーク(DCNN)モデルの開発について検討する。
オリジナルの入力機能を3つの異なるオートエンコーダ構成で拡張することにより、モデルの予測能力は大幅に改善された。
論文 参考訳(メタデータ) (2024-08-26T20:45:07Z) - PrivFED -- A Framework for Privacy-Preserving Federated Learning in Enhanced Breast Cancer Diagnosis [0.0]
本研究では、ウィスコンシンデータセットに基づいてトレーニングされたフェデレーション学習フレームワークを導入し、データの不足や不均衡といった課題を軽減する。
このモデルの平均精度はエッジデバイスで99.95%、中央サーバで98%である。
論文 参考訳(メタデータ) (2024-05-13T18:01:57Z) - Comparative Analysis of Imbalanced Malware Byteplot Image Classification
using Transfer Learning [0.873811641236639]
マルウェア検知器はマルウェアの署名を比較することでサイバー攻撃を支援する。
本稿では,6つのクラス分類モデルの性能を比較した。
クラス不均衡が大きくなるほど、収束に必要なエポックの数が少なくなる。
論文 参考訳(メタデータ) (2023-10-04T11:33:36Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models [60.48306899271866]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - A Dependable Hybrid Machine Learning Model for Network Intrusion
Detection [1.222622290392729]
本稿では,機械学習とディープラーニングを組み合わせたハイブリッドモデルを提案する。
提案手法は,KDDCUP'99とCIC-MalMem-2022の2つのデータセットでテストした場合,優れた結果が得られる。
論文 参考訳(メタデータ) (2022-12-08T20:19:27Z) - From Environmental Sound Representation to Robustness of 2D CNN Models
Against Adversarial Attacks [82.21746840893658]
本稿では, 各種環境音響表現(スペクトログラム)が, 被害者残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
DWTスペクトログラムでトレーニングしたResNet-18モデルでは高い認識精度が得られたが、このモデルに対する攻撃は敵にとって比較的コストがかかる。
論文 参考訳(メタデータ) (2022-04-14T15:14:08Z) - Adaptive Feature Alignment for Adversarial Training [56.17654691470554]
CNNは通常、敵攻撃に対して脆弱であり、セキュリティに敏感なアプリケーションに脅威をもたらす。
任意の攻撃強度の特徴を生成するための適応的特徴アライメント(AFA)を提案する。
本手法は任意の攻撃強度の特徴を自動的に整列するように訓練されている。
論文 参考訳(メタデータ) (2021-05-31T17:01:05Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - How Robust are Randomized Smoothing based Defenses to Data Poisoning? [66.80663779176979]
我々は、トレーニングデータの品質の重要性を強調する堅牢な機械学習モデルに対して、これまで認識されていなかった脅威を提示します。
本稿では,二段階最適化に基づく新たなデータ中毒攻撃法を提案し,ロバストな分類器のロバスト性を保証する。
我々の攻撃は、被害者が最先端のロバストな訓練方法を用いて、ゼロからモデルを訓練しても効果的である。
論文 参考訳(メタデータ) (2020-12-02T15:30:21Z) - Adversarial Self-Supervised Contrastive Learning [62.17538130778111]
既存の対数学習アプローチは、主にクラスラベルを使用して、誤った予測につながる対数サンプルを生成する。
本稿では,未ラベルデータに対する新たな逆攻撃を提案する。これにより,モデルが摂動データサンプルのインスタンスレベルのアイデンティティを混乱させる。
ラベル付きデータなしで頑健なニューラルネットワークを逆さまにトレーニングするための,自己教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-13T08:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。