論文の概要: Dataset Optimization Strategies for MalwareTraffic Detection
- arxiv url: http://arxiv.org/abs/2009.11347v1
- Date: Wed, 23 Sep 2020 19:27:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 15:34:37.533705
- Title: Dataset Optimization Strategies for MalwareTraffic Detection
- Title(参考訳): マルウェアトラフィック検出のためのデータセット最適化戦略
- Authors: Ivan Letteri, Antonio Di Cecco, Giuseppe Della Penna
- Abstract要約: 本稿では,いくつかの最先端手法を活用・組み合わせた2つの新しいデータセット最適化手法を提案する。
第1のアプローチは、相互情報測度と感度向上に基づく特徴選択手法である。
2つ目は次元還元法に基づくオートエンコーダである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning is rapidly becoming one of the most important technology for
malware traffic detection, since the continuous evolution of malware requires a
constant adaptation and the ability to generalize. However, network traffic
datasets are usually oversized and contain redundant and irrelevant
information, and this may dramatically increase the computational cost and
decrease the accuracy of most classifiers, with the risk to introduce further
noise.
We propose two novel dataset optimization strategies which exploit and
combine several state-of-the-art approaches in order to achieve an effective
optimization of the network traffic datasets used to train malware detectors.
The first approach is a feature selection technique based on mutual information
measures and sensibility enhancement. The second is a dimensional reduction
technique based autoencoders. Both these approaches have been experimentally
applied on the MTA-KDD'19 dataset, and the optimized results evaluated and
compared using a Multi Layer Perceptron as machine learning model for malware
detection.
- Abstract(参考訳): マルウェアの継続的な進化は、一定の適応と一般化能力を必要とするため、機械学習は、マルウェアのトラフィック検出において、急速に最も重要な技術になりつつある。
しかし、ネットワークトラフィックデータセットは通常、過大サイズであり、冗長で無関係な情報を含んでいるため、計算コストが劇的に増加し、多くの分類器の精度が低下し、さらにノイズが発生するリスクがある。
本稿では,マルウェア検知器の訓練に使用されるネットワークトラフィックデータセットの効率的な最適化を実現するために,最先端のアプローチを活用・活用する2つの新しいデータセット最適化手法を提案する。
第1のアプローチは,相互情報計測と感性向上に基づく特徴選択手法である。
2つ目は次元縮小技術に基づくオートエンコーダである。
これらのアプローチはMTA-KDD'19データセットに実験的に適用され、マルウェア検出のための機械学習モデルとしてMulti Layer Perceptronを用いて評価・比較された。
関連論文リスト
- Transfer Learning in $\ell_1$ Regularized Regression: Hyperparameter
Selection Strategy based on Sharp Asymptotic Analysis [4.178980693837599]
転送学習技術は、複数の関連するデータセットからの情報を活用し、ターゲットデータセットに対する予測品質を向上させることを目的としている。
トランス・ラッソ(Trans-Lasso)とプレトレーニング・ラッソ(Pretraining Lasso)である。
レプリカ法を用いて解析することにより,高次元環境下でのアルゴリズムの徹底的,精密な研究を行う。
微調整段階に転送される2種類の情報の1つを無視することは、一般化性能にはほとんど影響しない。
論文 参考訳(メタデータ) (2024-09-26T10:20:59Z) - Towards Novel Malicious Packet Recognition: A Few-Shot Learning Approach [0.0]
Deep Packet Inspection (DPI)は、ネットワークセキュリティを強化する重要な技術として登場した。
本研究では,大規模言語モデル(LLM)と少数ショット学習を活用する新しいアプローチを提案する。
提案手法は,マルウェアの種類によって平均精度86.35%,F1スコア86.40%の有望な結果を示す。
論文 参考訳(メタデータ) (2024-09-17T15:02:32Z) - Systematic review, analysis, and characterisation of malicious industrial network traffic datasets for aiding Machine Learning algorithm performance testing [0.0]
本稿では,公開可能なネットワークトラフィックキャプチャに基づくデータセットを体系的にレビューする。
これには、含まれた攻撃タイプの分類、メタデータのレビュー、統計分析、複雑さ分析が含まれる。
研究者にメタデータを提供し、研究の質問に最適なデータセットを選択するのに使用できる。
論文 参考訳(メタデータ) (2024-05-08T07:48:40Z) - Reliable Feature Selection for Adversarially Robust Cyber-Attack Detection [0.0]
この研究は、複数のメソッドを組み合わせて複数のネットワークデータセットに適用する機能選択とコンセンサスプロセスを示す。
データ多様性が向上し、最高の時間関連機能とより具体的な機能セットを選択し、敵のトレーニングを実行することで、MLモデルはより逆向きに堅牢な一般化を実現することができた。
論文 参考訳(メタデータ) (2024-04-05T16:01:21Z) - Defect Classification in Additive Manufacturing Using CNN-Based Vision
Processing [76.72662577101988]
本稿では、まず、畳み込みニューラルネットワーク(CNN)を用いて、画像データセットの欠陥をAMから第2に正確に分類し、発達した分類モデルにアクティブラーニング技術を適用する。
これにより、トレーニングデータやトレーニングデータの生成に必要なデータのサイズを削減できる、ヒューマン・イン・ザ・ループ機構の構築が可能になる。
論文 参考訳(メタデータ) (2023-07-14T14:36:58Z) - A Robust and Explainable Data-Driven Anomaly Detection Approach For
Power Electronics [56.86150790999639]
本稿では,2つの異常検出・分類手法,すなわち行列プロファイルアルゴリズムと異常変換器を提案する。
行列プロファイルアルゴリズムは、ストリーミング時系列データにおけるリアルタイム異常を検出するための一般化可能なアプローチとして適している。
検知器の感度、リコール、検出精度を調整するために、一連のカスタムフィルタが作成され、追加される。
論文 参考訳(メタデータ) (2022-09-23T06:09:35Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - A comparative study of neural network techniques for automatic software
vulnerability detection [9.443081849443184]
ソフトウェア脆弱性を検出する最も一般的な方法は静的解析である。
一部の研究者は、検出の知性を改善するために自動特徴抽出機能を持つニューラルネットワークの使用を提案している。
2つの典型的なニューラルネットワークの性能をテストするための広範な実験を実施しました。
論文 参考訳(メタデータ) (2021-04-29T01:47:30Z) - Towards Accurate Knowledge Transfer via Target-awareness Representation
Disentanglement [56.40587594647692]
本稿では,TRED(Target-Awareness Representation Disentanglement)の概念を取り入れた新しいトランスファー学習アルゴリズムを提案する。
TREDは、対象のタスクに関する関連する知識を元のソースモデルから切り離し、ターゲットモデルを微調整する際、レギュレータとして使用する。
各種実世界のデータセットを用いた実験により,本手法は標準微調整を平均2%以上安定的に改善することが示された。
論文 参考訳(メタデータ) (2020-10-16T17:45:08Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。