論文の概要: Revisiting Network Traffic Analysis: Compatible network flows for ML models
- arxiv url: http://arxiv.org/abs/2511.08345v1
- Date: Wed, 12 Nov 2025 01:54:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.771451
- Title: Revisiting Network Traffic Analysis: Compatible network flows for ML models
- Title(参考訳): ネットワークトラフィック分析の再検討:MLモデルの互換性のあるネットワークフロー
- Authors: João Vitorino, Daniela Pinto, Eva Maia, Ivone Amorim, Isabel Praça,
- Abstract要約: 本稿では,異なるネットワークトラフィックフローの輸出者によって生成された類似した特徴が,機械学習モデルの一般化と堅牢性に与える影響について検討する。
侵入検知におけるこれらの新しい流れの有用性を評価するため、元のモデルと比較し、複数のモデルを微調整するために使用した。
- 参考スコア(独自算出の注目度): 1.7181078670359513
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To ensure that Machine Learning (ML) models can perform a robust detection and classification of cyberattacks, it is essential to train them with high-quality datasets with relevant features. However, it can be difficult to accurately represent the complex traffic patterns of an attack, especially in Internet-of-Things (IoT) networks. This paper studies the impact that seemingly similar features created by different network traffic flow exporters can have on the generalization and robustness of ML models. In addition to the original CSV files of the Bot-IoT, IoT-23, and CICIoT23 datasets, the raw network packets of their PCAP files were analysed with the HERA tool, generating new labelled flows and extracting consistent features for new CSV versions. To assess the usefulness of these new flows for intrusion detection, they were compared with the original versions and were used to fine-tune multiple models. Overall, the results indicate that directly analysing and preprocessing PCAP files, instead of just using the commonly available CSV files, enables the computation of more relevant features to train bagging and gradient boosting decision tree ensembles. It is important to continue improving feature extraction and feature selection processes to make different datasets more compatible and enable a trustworthy evaluation and comparison of the ML models used in cybersecurity solutions.
- Abstract(参考訳): 機械学習(ML)モデルがサイバー攻撃の堅牢な検出と分類を可能にするためには、関連する機能を備えた高品質なデータセットでそれらをトレーニングすることが不可欠である。
しかし、特にIoT(Internet-of-Things)ネットワークにおいて、攻撃の複雑なトラフィックパターンを正確に表現することは困難である。
本稿では,異なるネットワークトラフィックフロー輸出業者が生み出した類似した特徴が,MLモデルの一般化と堅牢性に与える影響について検討する。
Bot-IoT、IoT-23、CICIoT23データセットのオリジナルのCSVファイルに加えて、PCAPファイルの生のネットワークパケットはHERAツールで分析され、新しいラベル付きフローを生成し、新しいCSVバージョンの一貫性のある機能を抽出した。
侵入検知におけるこれらの新しい流れの有用性を評価するため、元のモデルと比較し、複数のモデルを微調整するために使用した。
その結果,PCAPファイルを直接解析・事前処理することで,一般的なCSVファイルではなく,バッグングのトレーニングや決定木アンサンブルの勾配向上といった,より関連性の高い特徴の計算が可能になることがわかった。
さまざまなデータセットの互換性を高め、サイバーセキュリティソリューションで使用されるMLモデルの信頼性の高い評価と比較を可能にするために、機能抽出と機能選択プロセスの改善を継続することが重要です。
関連論文リスト
- Every Step Counts: Decoding Trajectories as Authorship Fingerprints of dLLMs [63.82840470917859]
本稿では,dLLMの復号化機構をモデル属性の強力なツールとして利用できることを示す。
本稿では、デコードステップ間の構造的関係を捉え、モデル固有の振る舞いをよりよく明らかにする、DDM(Directed Decoding Map)と呼ばれる新しい情報抽出手法を提案する。
論文 参考訳(メタデータ) (2025-10-02T06:25:10Z) - IncepFormerNet: A multi-scale multi-head attention network for SSVEP classification [12.935583315234553]
本研究では,Inception と Transformer アーキテクチャのハイブリッドモデルである IncepFormerNet を提案する。
IncepFormerNetは、異なる大きさの並列畳み込みカーネルを用いて、時系列データから、マルチスケールの時間情報を積極的に抽出する。
SSVEPデータのスペクトル特性に基づいて特徴を抽出するために,フィルタバンク手法を利用する。
論文 参考訳(メタデータ) (2025-02-04T13:04:03Z) - A Novel Approach to Network Traffic Analysis: the HERA tool [0.0]
サイバーセキュリティの脅威は、堅牢なネットワーク侵入検知システムの必要性を浮き彫りにする。
これらのシステムは、パターンを検出し、脅威を予測する機械学習モデルをトレーニングするためのデータセットに大きく依存している。
HERAは、フローファイルとラベル付きまたは未ラベルのデータセットをユーザ定義の機能で生成する、新たなオープンソースツールである。
論文 参考訳(メタデータ) (2025-01-13T16:47:52Z) - Flow Exporter Impact on Intelligent Intrusion Detection Systems [0.0]
高品質なデータセットは、機械学習モデルのトレーニングに不可欠である。
特徴発生の不整合は、脅威検出の精度と信頼性を妨げる。
本稿では,侵入検知のための機械学習モデルの性能と信頼性に及ぼす流量輸出機の影響について検討する。
論文 参考訳(メタデータ) (2024-12-18T16:38:20Z) - Scalable Weibull Graph Attention Autoencoder for Modeling Document Networks [50.42343781348247]
解析条件後部を解析し,推論精度を向上させるグラフポアソン因子分析法(GPFA)を開発した。
また,GPFAを多層構造に拡張したグラフPoisson gamma belief Network (GPGBN) を用いて,階層的な文書関係を複数の意味レベルで捉える。
本モデルでは,高品質な階層型文書表現を抽出し,様々なグラフ解析タスクにおいて有望な性能を実現する。
論文 参考訳(メタデータ) (2024-10-13T02:22:14Z) - Reliable Feature Selection for Adversarially Robust Cyber-Attack Detection [0.0]
この研究は、複数のメソッドを組み合わせて複数のネットワークデータセットに適用する機能選択とコンセンサスプロセスを示す。
データ多様性が向上し、最高の時間関連機能とより具体的な機能セットを選択し、敵のトレーニングを実行することで、MLモデルはより逆向きに堅牢な一般化を実現することができた。
論文 参考訳(メタデータ) (2024-04-05T16:01:21Z) - Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。
具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文 参考訳(メタデータ) (2023-12-03T13:50:24Z) - Machine Learning for QoS Prediction in Vehicular Communication:
Challenges and Solution Approaches [46.52224306624461]
最大スループット予測の強化,例えばストリーミングや高精細マッピングアプリケーションについて検討する。
収集したデータの基盤となる特性をよりよく理解することで、マシンラーニング技術上に信頼性を構築することができるかを強調します。
我々は、説明可能なAIを使用して、機械学習が明示的にプログラムされることなく、無線ネットワークの基本原理を学習できることを示す。
論文 参考訳(メタデータ) (2023-02-23T12:29:20Z) - Batch-Ensemble Stochastic Neural Networks for Out-of-Distribution
Detection [55.028065567756066]
Out-of-Distribution(OOD)検出は、機械学習モデルを現実世界のアプリケーションにデプロイすることの重要性から、マシンラーニングコミュニティから注目を集めている。
本稿では,特徴量の分布をモデル化した不確実な定量化手法を提案する。
バッチアンサンブルニューラルネットワーク(BE-SNN)の構築と機能崩壊問題の克服を目的として,効率的なアンサンブル機構,すなわちバッチアンサンブルを組み込んだ。
We show that BE-SNNs yield superior performance on the Two-Moons dataset, the FashionMNIST vs MNIST dataset, FashionM。
論文 参考訳(メタデータ) (2022-06-26T16:00:22Z) - An Explainable Machine Learning-based Network Intrusion Detection System
for Enabling Generalisability in Securing IoT Networks [0.0]
機械学習(ML)ベースのネットワーク侵入検知システムは、組織のセキュリティ姿勢を高める多くの利点をもたらす。
多くのシステムは研究コミュニティで設計・開発されており、特定のデータセットを用いて評価すると、しばしば完璧な検出率を達成する。
本稿では,異なるネットワーク環境と攻撃タイプに設定した共通機能の汎用性を評価することにより,ギャップを狭める。
論文 参考訳(メタデータ) (2021-04-15T00:44:45Z) - On Robustness and Transferability of Convolutional Neural Networks [147.71743081671508]
現代の深層畳み込みネットワーク(CNN)は、分散シフトの下で一般化しないとしてしばしば批判される。
現代画像分類CNNにおける分布外と転送性能の相互作用を初めて検討した。
トレーニングセットとモデルサイズを増大させることで、分散シフトロバスト性が著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-16T18:39:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。