論文の概要: Feature Extraction for Novelty Detection in Network Traffic
- arxiv url: http://arxiv.org/abs/2006.16993v2
- Date: Thu, 10 Jun 2021 15:58:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 06:23:37.343675
- Title: Feature Extraction for Novelty Detection in Network Traffic
- Title(参考訳): ネットワークトラフィックにおけるノベルティ検出のための特徴抽出
- Authors: Kun Yang, Samory Kpotufe, Nick Feamster
- Abstract要約: データ表現は、機械学習における新規性検出手法の性能において重要な役割を果たす。
我々は、オープンソースのツール、付随するPythonライブラリ、ネットワークトラフィックの新規検出のためのエンドツーエンドパイプラインをリリースします。
- 参考スコア(独自算出の注目度): 18.687465197576415
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data representation plays a critical role in the performance of novelty
detection (or ``anomaly detection'') methods in machine learning. The data
representation of network traffic often determines the effectiveness of these
models as much as the model itself. The wide range of novel events that network
operators need to detect (e.g., attacks, malware, new applications, changes in
traffic demands) introduces the possibility for a broad range of possible
models and data representations. In each scenario, practitioners must spend
significant effort extracting and engineering features that are most predictive
for that situation or application. While anomaly detection is well-studied in
computer networking, much existing work develops specific models that presume a
particular representation -- often IPFIX/NetFlow. Yet, other representations
may result in higher model accuracy, and the rise of programmable networks now
makes it more practical to explore a broader range of representations. To
facilitate such exploration, we develop a systematic framework, open-source
toolkit, and public Python library that makes it both possible and easy to
extract and generate features from network traffic and perform and end-to-end
evaluation of these representations across most prevalent modern novelty
detection models. We first develop and publicly release an open-source tool, an
accompanying Python library (NetML), and end-to-end pipeline for novelty
detection in network traffic. Second, we apply this tool to five different
novelty detection problems in networking, across a range of scenarios from
attack detection to novel device detection. Our findings general insights and
guidelines concerning which features appear to be more appropriate for
particular situations.
- Abstract(参考訳): データ表現は、機械学習におけるノベルティ検出(または'anomaly detection'')法の性能において重要な役割を果たす。
ネットワークトラフィックのデータ表現は、モデル自体と同様に、これらのモデルの有効性を決定することが多い。
ネットワークオペレーターが検出しなければならない様々な新しいイベント(例えば、攻撃、マルウェア、新しいアプリケーション、トラフィック要求の変化)は、幅広いモデルとデータ表現の可能性をもたらす。
それぞれのシナリオにおいて、実践者は、その状況やアプリケーションに対して最も予測的な特徴の抽出とエンジニアリングに多大な労力を費やさなければならない。
異常検出はコンピュータネットワークでよく研究されているが、既存の多くの研究は特定の表現 - しばしばIPFIX/NetFlow - を想定した特定のモデルを開発している。
しかし、他の表現はより高いモデルの精度をもたらす可能性があり、プログラマブルネットワークの台頭により、より広い範囲の表現を探索することがより現実的になった。
このような探索を容易にするため,ネットワークトラフィックから特徴を抽出・生成し,最新の新規性検出モデルにおいて,これらの表現の実行とエンドツーエンド評価を可能にする,体系的なフレームワーク,オープンソースツールキット,パブリックPythonライブラリを開発した。
まず、オープンソースのツール、付随するpythonライブラリ(netml)、ネットワークトラフィックのノベルティ検出のためのエンドツーエンドパイプラインを開発し、公開します。
第2に,ネットワークにおける5つの新たな検出問題に対して,攻撃検出から新たなデバイス検出まで,さまざまなシナリオに適用する。
本研究は,特定の状況においてどの特徴が適切かに関する一般的な知見とガイドラインである。
関連論文リスト
- A Novel Approach to Network Traffic Analysis: the HERA tool [0.0]
サイバーセキュリティの脅威は、堅牢なネットワーク侵入検知システムの必要性を浮き彫りにする。
これらのシステムは、パターンを検出し、脅威を予測する機械学習モデルをトレーニングするためのデータセットに大きく依存している。
HERAは、フローファイルとラベル付きまたは未ラベルのデータセットをユーザ定義の機能で生成する、新たなオープンソースツールである。
論文 参考訳(メタデータ) (2025-01-13T16:47:52Z) - NetFlowGen: Leveraging Generative Pre-training for Network Traffic Dynamics [72.95483148058378]
我々は,NetFlowレコードからのトラフィックデータのみを用いて,トラフィックダイナミクスをキャプチャする汎用機械学習モデルを事前学習することを提案する。
ネットワーク特徴表現の統一,未ラベルの大規模トラフィックデータ量からの学習,DDoS攻撃検出における下流タスクのテストといった課題に対処する。
論文 参考訳(メタデータ) (2024-12-30T00:47:49Z) - Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文 参考訳(メタデータ) (2024-08-23T01:53:36Z) - GM-DF: Generalized Multi-Scenario Deepfake Detection [49.072106087564144]
既存の偽造検出は、通常、単一のドメインでのトレーニングモデルのパラダイムに従う。
本稿では,複数の顔偽造検出データセットを共同で訓練した場合のディープフェイク検出モデルの一般化能力について詳しく検討する。
論文 参考訳(メタデータ) (2024-06-28T17:42:08Z) - Language Models for Novelty Detection in System Call Traces [0.27309692684728604]
本稿では,システムコールのシーケンスの確率分布に依存する新規性検出手法を提案する。
提案手法は手作りを最小限に抑え、多くの新規品においてFスコアとAuROCを95%以上達成する。
ソースコードとトレーニングされたモデルはGitHubで公開されており、データセットはZenodoで公開されている。
論文 参考訳(メタデータ) (2023-09-05T13:11:40Z) - Leveraging a Probabilistic PCA Model to Understand the Multivariate
Statistical Network Monitoring Framework for Network Security Anomaly
Detection [64.1680666036655]
確率的生成モデルの観点からPCAに基づく異常検出手法を再検討する。
2つの異なるデータセットを用いて数学的モデルを評価した。
論文 参考訳(メタデータ) (2023-02-02T13:41:18Z) - A Comprehensive Study of Real-Time Object Detection Networks Across
Multiple Domains: A Survey [9.861721674777877]
ディープニューラルネットワークに基づくオブジェクト検出器は継続的に進化しており、様々な用途で使用されている。
安全クリティカルなアプリケーションは高い精度と信頼性を必要とするが、低遅延タスクにはリソースとエネルギー効率のネットワークが必要である。
既存のネットワークの基準ベンチマークは存在せず、新しいネットワークを設計するための標準評価ガイドラインも存在しない。
論文 参考訳(メタデータ) (2022-08-23T12:01:16Z) - A Lightweight, Efficient and Explainable-by-Design Convolutional Neural
Network for Internet Traffic Classification [9.365794791156972]
本稿では、インターネットトラフィック分類のための新しい軽量・効率的・eXplainable-by-design畳み込みニューラルネットワーク(LEXNet)を提案する。
LEXNetは(軽量で効率の良い目的のために)新しい残留ブロックと(説明可能性のために)プロトタイプ層に依存している。
商用グレードのデータセットに基づいて、LEXNetは最先端のニューラルネットワークと同じ精度を維持することに成功した。
論文 参考訳(メタデータ) (2022-02-11T10:21:34Z) - Explainable Adversarial Attacks in Deep Neural Networks Using Activation
Profiles [69.9674326582747]
本稿では,敵対的事例に基づくニューラルネットワークモデルを検討するためのビジュアルフレームワークを提案する。
これらの要素を観察することで、モデル内の悪用領域を素早く特定できることを示す。
論文 参考訳(メタデータ) (2021-03-18T13:04:21Z) - Anomaly Detection on Attributed Networks via Contrastive Self-Supervised
Learning [50.24174211654775]
本論文では,アトリビュートネットワーク上の異常検出のためのコントラスト型自己監視学習フレームワークを提案する。
このフレームワークは、新しいタイプのコントラストインスタンスペアをサンプリングすることで、ネットワークデータからのローカル情報を完全に活用します。
高次元特性と局所構造から情報埋め込みを学習するグラフニューラルネットワークに基づくコントラスト学習モデルを提案する。
論文 参考訳(メタデータ) (2021-02-27T03:17:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。