論文の概要: Extensible Machine Learning for Encrypted Network Traffic Application
Labeling via Uncertainty Quantification
- arxiv url: http://arxiv.org/abs/2205.05628v1
- Date: Wed, 11 May 2022 16:54:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-12 21:40:01.167432
- Title: Extensible Machine Learning for Encrypted Network Traffic Application
Labeling via Uncertainty Quantification
- Title(参考訳): 不確実性量子化による暗号化ネットワークトラフィックアプリケーションラベリングのための拡張型機械学習
- Authors: Steven Jorgensen, John Holodnak, Jensen Dempsey, Karla de Souza,
Ananditha Raghunath, Vernon Rivet, Noah DeMoes, Andr\'es Alejos, and Allan
Wollaber (MIT Lincoln Laboratory)
- Abstract要約: ラベル付き仮想プライベートネットワーク(VPN)暗号化ネットワークトラフィックを10のアプリケーションで生成し,5つのアプリケーションカテゴリに対応する,新たなパブリックなネットワークトラフィックデータセットを提案する。
また、控えめなデータ要件で迅速にトレーニングし、キャリブレーションされた予測確率と、新しいトラフィックサンプルにフラグをつけるための解釈可能なアウト・オブ・ディストリビューション(OOD)スコアを提供するように設計されたMLフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the increasing prevalence of encrypted network traffic, cyber security
analysts have been turning to machine learning (ML) techniques to elucidate the
traffic on their networks. However, ML models can become stale as known traffic
features can shift between networks and as new traffic emerges that is outside
of the distribution of the training set. In order to reliably adapt in this
dynamic environment, ML models must additionally provide contextualized
uncertainty quantification to their predictions, which has received little
attention in the cyber security domain. Uncertainty quantification is necessary
both to signal when the model is uncertain about which class to choose in its
label assignment and when the traffic is not likely to belong to any
pre-trained classes.
We present a new, public dataset of network traffic that includes labeled,
Virtual Private Network (VPN)-encrypted network traffic generated by 10
applications and corresponding to 5 application categories. We also present an
ML framework that is designed to rapidly train with modest data requirements
and provide both calibrated, predictive probabilities as well as an
interpretable ``out-of-distribution'' (OOD) score to flag novel traffic
samples. We describe how to compute a calibrated OOD score from p-values of the
so-called relative Mahalanobis distance.
We demonstrate that our framework achieves an F1 score of 0.98 on our dataset
and that it can extend to an enterprise network by testing the model: (1) on
data from similar applications, (2) on dissimilar application traffic from an
existing category, and (3) on application traffic from a new category. The
model correctly flags uncertain traffic and, upon retraining, accurately
incorporates the new data. We additionally demonstrate good performance (F1
score of 0.97) when packet sizes are made to be uniform, as occurs for certain
encryption protocols.
- Abstract(参考訳): 暗号化されたネットワークトラフィックの増加に伴い、サイバーセキュリティアナリストは、ネットワーク上のトラフィックを解明するマシンラーニング(ML)技術に目を向けている。
しかし、既知のトラフィック機能がネットワーク間でシフトし、トレーニングセットの配布外にある新しいトラフィックが出現するにつれて、MLモデルは不安定になる可能性がある。
この動的環境に確実に適応するためには、MLモデルは、サイバーセキュリティ領域でほとんど注目を集めていない予測に文脈化された不確実性定量化を提供する必要がある。
不確かさの定量化は、モデルがそのラベルの割り当てでどのクラスを選択するべきかが不確かで、トラフィックが事前訓練されたクラスに属さない場合にも必要である。
ラベル付き仮想プライベートネットワーク(VPN)暗号化ネットワークトラフィックを10のアプリケーションで生成し,5つのアプリケーションカテゴリに対応する,新たなパブリックなネットワークトラフィックデータセットを提案する。
また、控えめなデータ要件で迅速にトレーニングし、キャリブレーションされた予測確率と解釈可能な ‘out-of-distribution'' (OOD)スコアを提供し、新しいトラフィックサンプルをフラグ付けするMLフレームワークを提案する。
我々は,いわゆるマハラノビス距離のp値から校正OOD値を計算する方法について述べる。
我々は,本フレームワークがデータセット上で0.98のF1スコアを達成し,(1)類似アプリケーションのデータ,(2)既存カテゴリのアプリケーショントラフィック,(3)新しいカテゴリのアプリケーショントラフィックなど,企業ネットワークに拡張可能であることを実証した。
モデルは不確実なトラフィックを正しくフラグ付けし、再トレーニングすると、新しいデータを正確に組み込む。
また、特定の暗号化プロトコルで発生するパケットサイズを均一にする際の性能(F1スコア0.97)も示す。
関連論文リスト
- Lens: A Foundation Model for Network Traffic [19.3652490585798]
Lensは、T5アーキテクチャを活用して、大規模な未ラベルデータから事前訓練された表現を学習するネットワークトラフィックの基礎モデルである。
Masked Span Prediction(MSP)、Packet Order Prediction(POP)、Homologous Traffic Prediction(HTP)の3つの異なるタスクを組み合わせた新しい損失を設計する。
論文 参考訳(メタデータ) (2024-02-06T02:45:13Z) - Hybrid PLS-ML Authentication Scheme for V2I Communication Networks [0.0]
本稿では,送信機の位置をデバイス指紋として利用して,PLS(Hybrid physical Layer Security)-machine Learning (ML)認証手法を提案する。
我々は、ToAを道路側ユニット(RSU)で推定し、基地局(BS)で送信機の座標を抽出する、ToA(Time-of-arrival)ベースのローカライゼーション機構を用いる。
移動車両の移動性を追跡するため,複数のシステムパラメータに基づいて学習したMLモデルを用いて,提案した位置ベース機構が検出に失敗した場合のベースラインスキームを著しく上回っていることを観察した。
論文 参考訳(メタデータ) (2023-08-28T16:34:50Z) - Convolutional Neural Networks for the classification of glitches in
gravitational-wave data streams [52.77024349608834]
我々は、高度LIGO検出器のデータから過渡ノイズ信号(グリッチ)と重力波を分類する。
どちらも、Gravity Spyデータセットを使用して、スクラッチからトレーニングされた、教師付き学習アプローチのモデルを使用します。
また、擬似ラベルの自動生成による事前学習モデルの自己教師型アプローチについても検討する。
論文 参考訳(メタデータ) (2023-03-24T11:12:37Z) - Multi-view Multi-label Anomaly Network Traffic Classification based on
MLP-Mixer Neural Network [55.21501819988941]
畳み込みニューラルネットワーク(CNN)に基づく既存のネットワークトラフィック分類は、グローバルな情報関連を無視しながら、トラフィックデータの局所的なパターンを強調することが多い。
本稿では,エンドツーエンドのネットワークトラフィック分類手法を提案する。
論文 参考訳(メタデータ) (2022-10-30T01:52:05Z) - ET-BERT: A Contextualized Datagram Representation with Pre-training
Transformers for Encrypted Traffic Classification [9.180725486824118]
トランスフォーマー(ET-BERT)からの暗号化トラフィック双方向表現と呼ばれる新しいトラフィック表現モデルを提案する。
事前訓練されたモデルは、少数のタスク固有のラベル付きデータに基づいて微調整し、5つの暗号化されたトラフィック分類タスクで最先端のパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2022-02-13T14:54:48Z) - Robust Semi-supervised Federated Learning for Images Automatic
Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。
異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。
本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文 参考訳(メタデータ) (2022-01-03T16:49:33Z) - CGNN: Traffic Classification with Graph Neural Network [13.851922724661538]
本稿では,連鎖グラフ上で自動的に抽出された特徴に対してグラフ分類器を構築するグラフニューラルネットワークに基づくトラフィック分類手法を提案する。
CGNNは、アプリケーション分類における予測精度を23%から29%改善し、悪意のあるトラフィック分類では2%から37%改善し、暗号化されたトラフィック分類では同じ精度に達する。
論文 参考訳(メタデータ) (2021-10-19T04:10:07Z) - Enabling certification of verification-agnostic networks via
memory-efficient semidefinite programming [97.40955121478716]
本稿では,ネットワークアクティベーションの総数にのみ線形なメモリを必要とする一階二重SDPアルゴリズムを提案する。
L-inf の精度は 1% から 88% ,6% から 40% に改善した。
また,変分オートエンコーダの復号器に対する2次安定性仕様の厳密な検証を行った。
論文 参考訳(メタデータ) (2020-10-22T12:32:29Z) - Pre-Trained Models for Heterogeneous Information Networks [57.78194356302626]
異種情報ネットワークの特徴を捉えるための自己教師付き事前学習・微調整フレームワークPF-HINを提案する。
PF-HINは4つのデータセットにおいて、各タスクにおける最先端の代替よりも一貫して、大幅に優れています。
論文 参考訳(メタデータ) (2020-07-07T03:36:28Z) - Federated Learning in Vehicular Networks [41.89469856322786]
フェデレートラーニング(FL)フレームワークは、トランスミッションオーバーヘッドを減らすことを目的として、効率的なツールとして導入された。
本稿では,車載ネットワークアプリケーションにおける一元学習(CL)によるFLを用いたインテリジェント交通システムの構築について検討する。
データラベリングやモデルトレーニングといった学習の観点からも,コミュニケーションの観点からも,データレート,信頼性,送信オーバーヘッド,プライバシ,リソース管理といった面から,大きな課題を識別する。
論文 参考訳(メタデータ) (2020-06-02T06:32:59Z) - Key Points Estimation and Point Instance Segmentation Approach for Lane
Detection [65.37887088194022]
本稿では,PINet (Point Instance Network) と呼ばれるトラヒックライン検出手法を提案する。
PINetには、同時にトレーニングされる複数のスタックされた時間ガラスネットワークが含まれている。
PINetはTuSimpleとCulaneのデータセットで競合精度と偽陽性を達成する。
論文 参考訳(メタデータ) (2020-02-16T15:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。