論文の概要: Extensible Machine Learning for Encrypted Network Traffic Application
Labeling via Uncertainty Quantification
- arxiv url: http://arxiv.org/abs/2205.05628v1
- Date: Wed, 11 May 2022 16:54:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-12 21:40:01.167432
- Title: Extensible Machine Learning for Encrypted Network Traffic Application
Labeling via Uncertainty Quantification
- Title(参考訳): 不確実性量子化による暗号化ネットワークトラフィックアプリケーションラベリングのための拡張型機械学習
- Authors: Steven Jorgensen, John Holodnak, Jensen Dempsey, Karla de Souza,
Ananditha Raghunath, Vernon Rivet, Noah DeMoes, Andr\'es Alejos, and Allan
Wollaber (MIT Lincoln Laboratory)
- Abstract要約: ラベル付き仮想プライベートネットワーク(VPN)暗号化ネットワークトラフィックを10のアプリケーションで生成し,5つのアプリケーションカテゴリに対応する,新たなパブリックなネットワークトラフィックデータセットを提案する。
また、控えめなデータ要件で迅速にトレーニングし、キャリブレーションされた予測確率と、新しいトラフィックサンプルにフラグをつけるための解釈可能なアウト・オブ・ディストリビューション(OOD)スコアを提供するように設計されたMLフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the increasing prevalence of encrypted network traffic, cyber security
analysts have been turning to machine learning (ML) techniques to elucidate the
traffic on their networks. However, ML models can become stale as known traffic
features can shift between networks and as new traffic emerges that is outside
of the distribution of the training set. In order to reliably adapt in this
dynamic environment, ML models must additionally provide contextualized
uncertainty quantification to their predictions, which has received little
attention in the cyber security domain. Uncertainty quantification is necessary
both to signal when the model is uncertain about which class to choose in its
label assignment and when the traffic is not likely to belong to any
pre-trained classes.
We present a new, public dataset of network traffic that includes labeled,
Virtual Private Network (VPN)-encrypted network traffic generated by 10
applications and corresponding to 5 application categories. We also present an
ML framework that is designed to rapidly train with modest data requirements
and provide both calibrated, predictive probabilities as well as an
interpretable ``out-of-distribution'' (OOD) score to flag novel traffic
samples. We describe how to compute a calibrated OOD score from p-values of the
so-called relative Mahalanobis distance.
We demonstrate that our framework achieves an F1 score of 0.98 on our dataset
and that it can extend to an enterprise network by testing the model: (1) on
data from similar applications, (2) on dissimilar application traffic from an
existing category, and (3) on application traffic from a new category. The
model correctly flags uncertain traffic and, upon retraining, accurately
incorporates the new data. We additionally demonstrate good performance (F1
score of 0.97) when packet sizes are made to be uniform, as occurs for certain
encryption protocols.
- Abstract(参考訳): 暗号化されたネットワークトラフィックの増加に伴い、サイバーセキュリティアナリストは、ネットワーク上のトラフィックを解明するマシンラーニング(ML)技術に目を向けている。
しかし、既知のトラフィック機能がネットワーク間でシフトし、トレーニングセットの配布外にある新しいトラフィックが出現するにつれて、MLモデルは不安定になる可能性がある。
この動的環境に確実に適応するためには、MLモデルは、サイバーセキュリティ領域でほとんど注目を集めていない予測に文脈化された不確実性定量化を提供する必要がある。
不確かさの定量化は、モデルがそのラベルの割り当てでどのクラスを選択するべきかが不確かで、トラフィックが事前訓練されたクラスに属さない場合にも必要である。
ラベル付き仮想プライベートネットワーク(VPN)暗号化ネットワークトラフィックを10のアプリケーションで生成し,5つのアプリケーションカテゴリに対応する,新たなパブリックなネットワークトラフィックデータセットを提案する。
また、控えめなデータ要件で迅速にトレーニングし、キャリブレーションされた予測確率と解釈可能な ‘out-of-distribution'' (OOD)スコアを提供し、新しいトラフィックサンプルをフラグ付けするMLフレームワークを提案する。
我々は,いわゆるマハラノビス距離のp値から校正OOD値を計算する方法について述べる。
我々は,本フレームワークがデータセット上で0.98のF1スコアを達成し,(1)類似アプリケーションのデータ,(2)既存カテゴリのアプリケーショントラフィック,(3)新しいカテゴリのアプリケーショントラフィックなど,企業ネットワークに拡張可能であることを実証した。
モデルは不確実なトラフィックを正しくフラグ付けし、再トレーニングすると、新しいデータを正確に組み込む。
また、特定の暗号化プロトコルで発生するパケットサイズを均一にする際の性能(F1スコア0.97)も示す。
関連論文リスト
- Pretraining Graph Neural Networks for few-shot Analog Circuit Modeling
and Design [68.1682448368636]
本稿では、新しい未知のトポロジや未知の予測タスクに適応可能な回路表現を学習するための教師付き事前学習手法を提案する。
異なる回路の変動位相構造に対処するため、各回路をグラフとして記述し、グラフニューラルネットワーク(GNN)を用いてノード埋め込みを学習する。
出力ノード電圧の予測における事前学習GNNは、新しい未知のトポロジや新しい回路レベル特性の予測に適応可能な学習表現を促進することができることを示す。
論文 参考訳(メタデータ) (2022-03-29T21:18:47Z) - Data-Driven Traffic Assignment: A Novel Approach for Learning Traffic
Flow Patterns Using a Graph Convolutional Neural Network [1.3706331473063877]
本稿では,交通ネットワークのトラフィックフローパターンを学習する新しいデータ駆動手法を提案する。
我々は、グラフ畳み込みニューラルネットワーク(GCNN)と呼ばれるニューラルネットワークベースのフレームワークを開発し、その問題を解決する。
モデルのトレーニングが完了すると、大規模ネットワークのトラフィックフローを即座に決定できる。
論文 参考訳(メタデータ) (2022-02-21T19:45:15Z) - ET-BERT: A Contextualized Datagram Representation with Pre-training
Transformers for Encrypted Traffic Classification [9.180725486824118]
トランスフォーマー(ET-BERT)からの暗号化トラフィック双方向表現と呼ばれる新しいトラフィック表現モデルを提案する。
事前訓練されたモデルは、少数のタスク固有のラベル付きデータに基づいて微調整し、5つの暗号化されたトラフィック分類タスクで最先端のパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2022-02-13T14:54:48Z) - A Lightweight, Efficient and Explainable-by-Design Convolutional Neural
Network for Internet Traffic Classification [66.58073672357064]
本稿では、インターネットトラフィック分類のための軽量で効率的なeXplainable-by-design畳み込みニューラルネットワーク(LEXNet)を提案する。
LEXNetは(軽量で効率の良い目的のために)新しい残留ブロックと(説明可能性のために)プロトタイプ層に依存している。
商用グレードのデータセットに基づいて、LEXNetは最先端のニューラルネットワークと同じ精度を維持することに成功した。
論文 参考訳(メタデータ) (2022-02-11T10:21:34Z) - Robust Semi-supervised Federated Learning for Images Automatic
Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。
異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。
本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文 参考訳(メタデータ) (2022-01-03T16:49:33Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - CGNN: Traffic Classification with Graph Neural Network [13.851922724661538]
本稿では,連鎖グラフ上で自動的に抽出された特徴に対してグラフ分類器を構築するグラフニューラルネットワークに基づくトラフィック分類手法を提案する。
CGNNは、アプリケーション分類における予測精度を23%から29%改善し、悪意のあるトラフィック分類では2%から37%改善し、暗号化されたトラフィック分類では同じ精度に達する。
論文 参考訳(メタデータ) (2021-10-19T04:10:07Z) - RoFL: Attestable Robustness for Secure Federated Learning [59.63865074749391]
フェデレートラーニング(Federated Learning)により、多数のクライアントが、プライベートデータを共有することなく、ジョイントモデルをトレーニングできる。
クライアントのアップデートの機密性を保証するため、フェデレートラーニングシステムはセキュアなアグリゲーションを採用している。
悪意のあるクライアントに対する堅牢性を向上させるセキュアなフェデレート学習システムであるRoFLを提案する。
論文 参考訳(メタデータ) (2021-07-07T15:42:49Z) - Federated Traffic Synthesizing and Classification Using Generative
Adversarial Networks [30.686118264562598]
本稿では,FGAN-AC(Federated Generative Adversarial Networks and Automatic Classification)という新しいフレームワークを紹介する。
FGAN-ACは、大量の手動ラベル付きデータセットを必要とせず、データ漏洩を引き起こすことなく、分散型ローカルデータセットから複数のタイプのサービスデータトラフィックを合成および分類することができます。
論文 参考訳(メタデータ) (2021-04-21T08:10:46Z) - Deep Learning and Traffic Classification: Lessons learned from a
commercial-grade dataset with hundreds of encrypted and zero-day applications [72.02908263225919]
商業用DLトラフィック分類エンジンでの経験を共有します。
暗号化トラフィックから既知のアプリケーションや未知のゼロデイアプリケーションを特定します。
DLモデルに合わせ、最新技術よりも正確で軽量な新しい手法を提案します。
論文 参考訳(メタデータ) (2021-04-07T15:21:22Z) - Improving Video Instance Segmentation by Light-weight Temporal
Uncertainty Estimates [11.580916951856256]
本稿では,インスタンスセグメンテーションネットワークの不確かさをモデル化するための時間動的手法を提案する。
本稿では,偽陽性の検出と予測品質の推定に本手法を適用した。
提案手法は、容易に訓練されたニューラルネットワークとビデオシーケンス入力のみを必要とする。
論文 参考訳(メタデータ) (2020-12-14T13:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。