論文の概要: Evaluating Tabular Representation Learning for Network Intrusion Detection
- arxiv url: http://arxiv.org/abs/2605.02519v1
- Date: Mon, 04 May 2026 12:20:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.277448
- Title: Evaluating Tabular Representation Learning for Network Intrusion Detection
- Title(参考訳): ネットワーク侵入検出のための語彙表現学習の評価
- Authors: Muhammad Usman Butt, Andreas Hotho, Daniel Schlör,
- Abstract要約: 本稿では,ベンチマークNetFlowデータセットを用いた最先端表現学習手法の体系的評価を行う。
教師付き分類では、TabICLはCIDDS上で最高のパフォーマンスを達成し、オートエンコーダは、データセット全体で最高の平均ランクでエンドツーエンドのトランスフォーマーモデルと密接に関連している。
クロスデータセット転送実験では、学習された表現が適切な方法と選択によってネットワーク環境全体にわたって一般化できることが示されている。
- 参考スコア(独自算出の注目度): 5.376368166533571
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classic Network Intrusion Detection Systems (NIDS) often rely on manual feature engineering to extract meaningful patterns from network traffic data. However, this approach requires domain expertise and runs counter to the widely adopted principle of modern machine learning and neural networks: that models themselves should learn meaningful representations directly from data. We investigate whether tabular representation learning techniques can improve intrusion detection performance by automatically learning robust feature representations for NetFlow data. This paper presents a systematic evaluation of state-of-the-art representation learning methods on benchmark NetFlow datasets, comparing against traditional autoencoders and end-to-end transformer baselines. We evaluate learned representations using both supervised classifiers and unsupervised anomaly detectors, with comprehensive hyperparameter exploration for each combination. Our results reveal strong dataset-model dependency, with no single approach consistently dominating across all scenarios. For supervised classification, TabICL achieves the best performance on CIDDS, while autoencoders follow closely and tie with end-to-end transformer models for the best average rank across datasets. Supervised approaches substantially outperform unsupervised anomaly detection methods, where no single combination consistently dominates as optimal choices depend on the dataset. Cross-dataset transfer experiments demonstrate that learned representations can generalize across network environments with appropriate method and classifier selection. However, transfer performance varies substantially depending on the source-target dataset combination, indicating sensitivity to distributional differences between network environments.
- Abstract(参考訳): 古典的ネットワーク侵入検知システム(NIDS)は、しばしばネットワークトラフィックデータから意味のあるパターンを抽出するために手動の特徴工学に依存している。
しかし、このアプローチはドメインの専門知識を必要とし、現代の機械学習とニューラルネットワークの広く採用されている原則に逆らう。
本稿では,NetFlowデータに対するロバストな特徴表現を自動的に学習することにより,表象表現学習技術が侵入検出性能を向上させるか否かを検討する。
本稿では,従来のオートエンコーダやエンドツーエンドのトランスフォーマーベースラインと比較して,ベンチマークNetFlowデータセットを用いた最先端表現学習手法の体系的評価を行う。
教師付き分類器と教師なし異常検出器の両方を用いて学習された表現を評価し,それぞれの組み合わせに対する包括的ハイパーパラメータ探索を行った。
結果から,データセットモデル依存性が強く,すべてのシナリオに一貫したアプローチが存在しないことが明らかとなった。
教師付き分類では、TabICLはCIDDS上で最高のパフォーマンスを達成し、オートエンコーダは、データセット全体で最高の平均ランクでエンドツーエンドのトランスフォーマーモデルと密接に関連している。
監視されたアプローチは教師なしの異常検出方法を大幅に上回り、最適な選択がデータセットに依存するため、単一の組み合わせが一貫して優位に立たない。
クロスデータセット転送実験では、学習された表現が適切な方法と分類器の選択によってネットワーク環境全体にわたって一般化できることが示されている。
しかし、転送性能はソースとターゲットのデータセットの組み合わせによって大きく異なり、ネットワーク環境間の分散的な差異に敏感であることを示す。
関連論文リスト
- Self-Supervised Transformer-based Contrastive Learning for Intrusion Detection Systems [1.1265248232450553]
本稿では,生パケット列上の一般化可能な侵入検出のための自己教師付きコントラスト学習手法を提案する。
本フレームワークは,既存のNetFlow自己管理手法と比較して,優れた性能を示す。
我々のモデルは,ラベル付き限られたデータを用いた教師付き侵入検知のための強力なベースラインを提供する。
論文 参考訳(メタデータ) (2025-05-12T13:42:00Z) - NIDS Neural Networks Using Sliding Time Window Data Processing with Trainable Activations and its Generalization Capability [0.0]
本稿では,ネットワーク侵入検知システム(NIDS)のためのニューラルネットワークについて述べる。
ディープパケットインスペクションに頼らず、ほとんどのNIDSデータセットで見つからず、従来のフローコレクタから簡単に取得できる11の機能しか必要としない。
報告されたトレーニング精度は、提案手法の99%を超え、ニューラルネットワークの入力特性は20に満たない。
論文 参考訳(メタデータ) (2024-10-24T11:36:19Z) - Physics-informed and Unsupervised Riemannian Domain Adaptation for Machine Learning on Heterogeneous EEG Datasets [53.367212596352324]
脳波信号物理を利用した教師なし手法を提案する。
脳波チャンネルをフィールド、ソースフリーなドメイン適応を用いて固定位置にマッピングする。
提案手法は脳-コンピュータインタフェース(BCI)タスクおよび潜在的なバイオマーカー応用におけるロバストな性能を示す。
論文 参考訳(メタデータ) (2024-03-07T16:17:33Z) - Hybridization of Capsule and LSTM Networks for unsupervised anomaly
detection on multivariate data [0.0]
本稿では,Long-Short-Term-Memory(LSTM)とCapsule Networksを1つのネットワークに結合した新しいNNアーキテクチャを提案する。
提案手法は教師なし学習手法を用いて大量のラベル付きトレーニングデータを見つける際の問題を克服する。
論文 参考訳(メタデータ) (2022-02-11T10:33:53Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - Anomaly Detection on Attributed Networks via Contrastive Self-Supervised
Learning [50.24174211654775]
本論文では,アトリビュートネットワーク上の異常検出のためのコントラスト型自己監視学習フレームワークを提案する。
このフレームワークは、新しいタイプのコントラストインスタンスペアをサンプリングすることで、ネットワークデータからのローカル情報を完全に活用します。
高次元特性と局所構造から情報埋め込みを学習するグラフニューラルネットワークに基づくコントラスト学習モデルを提案する。
論文 参考訳(メタデータ) (2021-02-27T03:17:20Z) - Category-Learning with Context-Augmented Autoencoder [63.05016513788047]
実世界のデータの解釈可能な非冗長表現を見つけることは、機械学習の鍵となる問題の一つである。
本稿では,オートエンコーダのトレーニングにデータ拡張を利用する新しい手法を提案する。
このような方法で変分オートエンコーダを訓練し、補助ネットワークによって変換結果を予測できるようにする。
論文 参考訳(メタデータ) (2020-10-10T14:04:44Z) - Federated Self-Supervised Learning of Multi-Sensor Representations for
Embedded Intelligence [8.110949636804772]
スマートフォン、ウェアラブル、IoT(Internet of Things)デバイスは、教師付きモデルを学習するための集中リポジトリに蓄積できない豊富なデータを生成する。
本稿では,ウェーブレット変換に基づくテキストカルグラム・信号対応学習という自己教師付きアプローチを提案し,ラベルなしセンサ入力から有用な表現を学習する。
さまざまなパブリックデータセットのマルチビュー戦略を用いて,学習機能の品質を広範囲に評価し,すべての領域で高いパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-07-25T21:59:17Z) - Self-Challenging Improves Cross-Domain Generalization [81.99554996975372]
畳み込みニューラルネットワーク(CNN)は、ラベルと相関する支配的特徴を活性化することにより、画像分類を行う。
ドメイン外データに対するCNNの一般化を著しく改善する簡単なトレーニングである自己整合表現(RSC)を導入する。
RSCはトレーニングデータ上で活性化される主要な機能に対して反復的に挑戦し、ラベルと相関する残りの機能を有効にするようネットワークに強制する。
論文 参考訳(メタデータ) (2020-07-05T21:42:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。