論文の概要: Fine-grained TLS Services Classification with Reject Option
- arxiv url: http://arxiv.org/abs/2202.11984v1
- Date: Thu, 24 Feb 2022 09:44:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-25 18:10:33.955849
- Title: Fine-grained TLS Services Classification with Reject Option
- Title(参考訳): Reject Option を用いた細粒度TLSサービス分類
- Authors: Jan Luxemburk, Tom\'a\v{s} \v{C}ejka
- Abstract要約: 本稿では,パケットレベルのメタデータで拡張された200近いきめ細かいサービスラベルと1億4000万のネットワークフローを持つ,大規模で最新のデータセットの収集に焦点をあてる。
フローの数は、他の公開ラベル付き暗号化トラフィックデータセットよりも3桁高い。
公開されたデータセットは、暗号化されたトラフィック内のサービスを特定するためのベンチマークとして意図されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent success and proliferation of machine learning and deep learning
have provided powerful tools, which are also utilized for encrypted traffic
analysis, classification, and threat detection. These methods, neural networks
in particular, are often complex and require a huge corpus of training data.
Therefore, this paper focuses on collecting a large up-to-date dataset with
almost 200 fine-grained service labels and 140 million network flows extended
with packet-level metadata. The number of flows is three orders of magnitude
higher than in other existing public labeled datasets of encrypted traffic. The
number of service labels, which is important to make the problem hard and
realistic, is four times higher than in the public dataset with the most class
labels. The published dataset is intended as a benchmark for identifying
services in encrypted traffic. Service identification can be further extended
with the task of "rejecting" unknown services, i.e., the traffic not seen
during the training phase. Neural networks offer superior performance for
tackling this more challenging problem. To showcase the dataset's usefulness,
we implemented a neural network with a multi-modal architecture, which is the
state-of-the-art approach, and achieved 97.04% classification accuracy and
detected 91.94% of unknown services with 5% false positive rate.
- Abstract(参考訳): 最近の機械学習とディープラーニングの成功と普及は強力なツールを提供しており、暗号化されたトラフィック分析、分類、脅威検出にも利用されている。
これらの手法、特にニューラルネットワークは、しばしば複雑で、大量のトレーニングデータを必要とする。
そこで本稿では,200以上の細粒度サービスラベルと1億4000万のネットワークフローをパケットレベルのメタデータで拡張した,最新の大規模データセットの収集に注目する。
フローの数は、暗号化トラフィックの他の公開ラベル付きデータセットよりも3桁高い。
問題を困難かつ現実的なものにするために重要なサービスラベルの数は、ほとんどのクラスラベルを持つ公開データセットの4倍である。
公開されたデータセットは、暗号化トラフィック内のサービスを識別するためのベンチマークとして意図されている。
サービス識別は、未知のサービスを"リジェクト"するタスク、すなわちトレーニングフェーズで見られないトラフィックによってさらに拡張することができる。
ニューラルネットワークは、この問題に取り組む上で優れたパフォーマンスを提供する。
データセットの有用性を示すために、最先端のアプローチであるマルチモーダルアーキテクチャを備えたニューラルネットワークを実装し、97.04%の分類精度を達成し、未知サービスの91.94%を、5%の偽陽性率で検出した。
関連論文リスト
- Lens: A Foundation Model for Network Traffic [19.3652490585798]
Lensは、T5アーキテクチャを活用して、大規模な未ラベルデータから事前訓練された表現を学習するネットワークトラフィックの基礎モデルである。
Masked Span Prediction(MSP)、Packet Order Prediction(POP)、Homologous Traffic Prediction(HTP)の3つの異なるタスクを組み合わせた新しい損失を設計する。
論文 参考訳(メタデータ) (2024-02-06T02:45:13Z) - A Survey of Label-Efficient Deep Learning for 3D Point Clouds [109.07889215814589]
本稿では,点雲のラベル効率学習に関する包括的調査を行う。
本稿では,ラベルの種類によって提供されるデータ前提条件に基づいて,ラベル効率のよい学習手法を整理する分類法を提案する。
それぞれのアプローチについて、問題設定の概要と、関連する進展と課題を示す広範な文献レビューを提供する。
論文 参考訳(メタデータ) (2023-05-31T12:54:51Z) - ET-BERT: A Contextualized Datagram Representation with Pre-training
Transformers for Encrypted Traffic Classification [9.180725486824118]
トランスフォーマー(ET-BERT)からの暗号化トラフィック双方向表現と呼ばれる新しいトラフィック表現モデルを提案する。
事前訓練されたモデルは、少数のタスク固有のラベル付きデータに基づいて微調整し、5つの暗号化されたトラフィック分類タスクで最先端のパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2022-02-13T14:54:48Z) - Auto-Transfer: Learning to Route Transferrable Representations [77.30427535329571]
本稿では,適切なターゲット表現にソース表現をルートする方法を自動学習する,新しい対向型マルチアームバンディット手法を提案する。
最先端の知識伝達手法と比較すると,5%以上の精度向上が期待できる。
論文 参考訳(メタデータ) (2022-02-02T13:09:27Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - Generative Conversational Networks [67.13144697969501]
本稿では,対話エージェントが独自のラベル付き学習データを生成することを学習する,生成会話ネットワーク(Generative Conversational Networks)というフレームワークを提案する。
そこで本研究では,シードデータから学習したベースラインモデルに対して,意図検出が平均35%,スロットタグが平均21%向上したことを示す。
論文 参考訳(メタデータ) (2021-06-15T23:19:37Z) - Deep Learning for Network Traffic Classification [0.0]
ネットワークトラフィックを監視してコンテンツ、サービス、アプリケーションを特定することは、ネットワークトラフィック制御システムにおいて活発な研究トピックである。
これまでの研究では、アプリケーションとサービスの識別を可能にする機械学習の手法が特定されていた。
本稿では,パケット,ペイロード,時間列の深層学習アーキテクチャのアンサンブルを用いた分類手法を提案する。
論文 参考訳(メタデータ) (2021-06-02T04:11:32Z) - Leveraging Multi-domain, Heterogeneous Data using Deep Multitask
Learning for Hate Speech Detection [21.410160004193916]
畳み込みニューラルネットワークに基づくマルチタスク学習モデル(MTL)フットノートコードを提案し,複数のソースからの情報を活用する。
3つのベンチマークデータセットで実施した実証分析は,提案手法の有効性を示す。
論文 参考訳(メタデータ) (2021-03-23T09:31:01Z) - Adversarial Knowledge Transfer from Unlabeled Data [62.97253639100014]
本稿では,インターネット規模の未ラベルデータから知識を伝達し,分類器の性能を向上させるための新しいAdversarial Knowledge Transferフレームワークを提案する。
我々の手法の重要な新しい側面は、ラベル付けされていないソースデータは、ラベル付けされたターゲットデータと異なるクラスであることができ、個別のプリテキストタスクを定義する必要がないことである。
論文 参考訳(メタデータ) (2020-08-13T08:04:27Z) - Learning to Count in the Crowd from Limited Labeled Data [109.2954525909007]
我々は,限られた数のラベル付きサンプルから参加者を数えることを学ぶことで,アノテーションの努力を減らすことに重点を置いている。
具体的には,未ラベルデータに対する擬似地下真理推定を含むガウス過程に基づく反復学習機構を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:17:01Z) - Learning Cross-domain Generalizable Features by Representation
Disentanglement [11.74643883335152]
ディープラーニングモデルは、異なるドメイン間で限定的な一般化性を示す。
本稿では,MIDNet(Multual-Information-based Disentangled Neural Networks)を提案する。
本手法は手書き桁データセットと胎児超音波データセットを用いて画像分類を行う。
論文 参考訳(メタデータ) (2020-02-29T17:53:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。