論文の概要: SoK: Decoding the Enigma of Encrypted Network Traffic Classifiers
- arxiv url: http://arxiv.org/abs/2503.20093v1
- Date: Tue, 25 Mar 2025 22:15:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-27 13:19:22.010644
- Title: SoK: Decoding the Enigma of Encrypted Network Traffic Classifiers
- Title(参考訳): SoK: 暗号化されたネットワークトラフィック分類器のエニグマをデコードする
- Authors: Nimesha Wickramasinghe, Arash Shaghaghi, Gene Tsudik, Sanjay Jha,
- Abstract要約: TLS 1.3のような現代の暗号化プロトコルは、従来のネットワークトラフィック分類(NTC)手法に挑戦している。
本稿では,MLに基づくNTC研究を包括的に分析し,その設計選択の分類とベンチマークスイートを開発する。
時代遅れのデータセット、設計選択の監視、そして根拠のない仮定の結果に広く依存していることを示します。
- 参考スコア(独自算出の注目度): 12.048303829428448
- License:
- Abstract: The adoption of modern encryption protocols such as TLS 1.3 has significantly challenged traditional network traffic classification (NTC) methods. As a consequence, researchers are increasingly turning to machine learning (ML) approaches to overcome these obstacles. In this paper, we comprehensively analyze ML-based NTC studies, developing a taxonomy of their design choices, benchmarking suites, and prevalent assumptions impacting classifier performance. Through this systematization, we demonstrate widespread reliance on outdated datasets, oversights in design choices, and the consequences of unsubstantiated assumptions. Our evaluation reveals that the majority of proposed encrypted traffic classifiers have mistakenly utilized unencrypted traffic due to the use of legacy datasets. Furthermore, by conducting 348 feature occlusion experiments on state-of-the-art classifiers, we show how oversights in NTC design choices lead to overfitting, and validate or refute prevailing assumptions with empirical evidence. By highlighting lessons learned, we offer strategic insights, identify emerging research directions, and recommend best practices to support the development of real-world applicable NTC methodologies.
- Abstract(参考訳): TLS 1.3のような現代的な暗号化プロトコルの採用は、従来のネットワークトラフィック分類(NTC)手法に大きく挑戦してきた。
その結果、研究者たちは機械学習(ML)アプローチに目を向けて、これらの障害を克服しようとしている。
本稿では,MLに基づくNTC研究を包括的に分析し,設計選択の分類,ベンチマークスイート,そして分類器の性能に影響を与える前提について検討する。
この体系化を通じて、時代遅れのデータセット、設計選択の監視、そして未確定な仮定の結果に広く依存していることを明らかにする。
提案する暗号化トラフィック分類器の大部分は,レガシデータセットの使用により,誤って暗号化されていないトラフィックを利用していることが明らかとなった。
さらに,最先端の分類器に関する348個の機能閉塞実験を行うことで,NTC設計選択の過度な監視が過度に適合し,実証的な証拠で一般的な仮定を検証または否定することを示す。
得られた教訓を強調することにより、戦略的な洞察を提供し、新たな研究方向を特定し、実世界に適用可能なNTC方法論の開発を支援するためのベストプラクティスを推奨する。
関連論文リスト
- An investigation into the performances of the Current state-of-the-art Naive Bayes, Non-Bayesian and Deep Learning Based Classifier for Phishing Detection: A Survey [0.9567504785687562]
フィッシングは、サイバー犯罪者が潜在的な犠牲者から機密情報を入手する最も効果的な方法の1つである。
本研究では,最先端の機械学習とディープラーニングフィッシング検出技術について概説した。
論文 参考訳(メタデータ) (2024-11-24T05:20:09Z) - Coding for Intelligence from the Perspective of Category [66.14012258680992]
符号化の対象はデータの圧縮と再構成、インテリジェンスである。
最近の傾向は、これらの2つの分野の潜在的均一性を示している。
本稿では,カテゴリ理論の観点から,インテリジェンスのためのコーディングの新たな問題を提案する。
論文 参考訳(メタデータ) (2024-07-01T07:05:44Z) - Towards Evaluating Transfer-based Attacks Systematically, Practically,
and Fairly [79.07074710460012]
ディープニューラルネットワーク(DNN)の敵対的脆弱性に大きな注目を集めている。
ブラックボックスDNNモデルを騙すための転送ベース手法が増えている。
30以上のメソッドを実装した転送ベースアタックベンチマーク(TA-Bench)を確立する。
論文 参考訳(メタデータ) (2023-11-02T15:35:58Z) - Facing Unknown: Open-World Encrypted Traffic Classification Based on Contrastive Pre-Training [5.318006462723139]
オープンワールドコントラスト事前学習(OWCP)フレームワークを提案する。
OWCPは、頑健な特徴表現を得るために、対照的な事前訓練を行う。
OWCPの各成分の総合的アブレーション研究と感度解析を行い,各成分の妥当性を検証した。
論文 参考訳(メタデータ) (2023-08-31T17:04:20Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - Uncertainty Estimation by Fisher Information-based Evidential Deep
Learning [61.94125052118442]
不確実性推定は、ディープラーニングを実用アプリケーションで信頼できるものにする鍵となる要素である。
漁業情報に基づくエビデンシャルディープラーニング(mathcalI$-EDL)を提案する。
特に,各サンプルが有する証拠の情報量を測定するためにFisher Information Matrix (FIM)を導入し,目的的損失項を動的に重み付けし,不確実なクラスの表現学習に集中させる。
論文 参考訳(メタデータ) (2023-03-03T16:12:59Z) - Bridging the gap to real-world for network intrusion detection systems
with data-centric approach [1.4699455652461724]
本稿では、NIDS研究の現在の限界に対処するために、体系的なデータ中心のアプローチを提案する。
最新のネットワークトラフィックとアタックで構成されたNIDSデータセットを生成し、ラベリングプロセスは設計によって統合される。
論文 参考訳(メタデータ) (2021-10-25T04:50:12Z) - Semi-Supervised Few-Shot Intent Classification and Slot Filling [3.602651625446309]
インテント分類(IC)とスロットフィリング(SF)は、現代の自然言語理解(NLU)システムにおける2つの基本的なタスクである。
本研究では,既存の教師付きメタ学習パイプラインに対して,コントラスト学習と教師なしデータ拡張がどのような効果をもたらすかを検討する。
論文 参考訳(メタデータ) (2021-09-17T20:26:23Z) - Boosting the Generalization Capability in Cross-Domain Few-shot Learning
via Noise-enhanced Supervised Autoencoder [23.860842627883187]
我々は、新しいノイズ強調型教師付きオートエンコーダ(NSAE)を用いて、特徴分布のより広範なバリエーションを捉えるようモデルに教える。
NSAEは入力を共同で再構築し、入力のラベルと再構成されたペアを予測することによってモデルを訓練する。
また、NSAE構造を利用して、より適応性を高め、対象領域の分類性能を向上させる2段階の微調整手順を提案する。
論文 参考訳(メタデータ) (2021-08-11T04:45:56Z) - A Survey on Concept Factorization: From Shallow to Deep Representation
Learning [104.78577405792592]
概念因子化(CF)は、機械学習とデータマイニングの分野で大きな関心を集めています。
まず、ルートCF法を再検討し、CFに基づく表現学習の進歩について検討する。
また、CFベースの手法の潜在的な適用領域についても紹介する。
論文 参考訳(メタデータ) (2020-07-31T04:19:14Z) - Prototypical Contrastive Learning of Unsupervised Representations [171.3046900127166]
原型コントラスト学習(Prototypeal Contrastive Learning, PCL)は、教師なし表現学習法である。
PCLは暗黙的にデータのセマンティック構造を学習された埋め込み空間にエンコードする。
PCLは、複数のベンチマークで最先端のインスタンスワイド・コントラスト学習法より優れている。
論文 参考訳(メタデータ) (2020-05-11T09:53:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。