論文の概要: Exploring Unsupervised Learning Methods for Automated Protocol Analysis
- arxiv url: http://arxiv.org/abs/2111.09061v1
- Date: Wed, 17 Nov 2021 12:02:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 15:20:41.784661
- Title: Exploring Unsupervised Learning Methods for Automated Protocol Analysis
- Title(参考訳): 自動プロトコル分析のための教師なし学習手法の探索
- Authors: Arijit Dasgupta, Yi-Xue Yan, Clarence Ong, Jenn-Yue Teo, Chia-Wei Lim
- Abstract要約: 自動プロトコル分析(APA)は、効率を大幅に改善し、人間の専門家への依存を減らすために重要である。
APAには未知のプロトコルをクラスタリングするための非教師なしの自動化方法が数多くある。
本研究では,APAにおける特徴抽出とクラスタリングの様々な組み合わせを総合的に評価する枠組みを提案する。
また、特徴抽出のためのデータセット依存モデルパラメータの選択を自動化する新しい手法を提案した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ability to analyse and differentiate network protocol traffic is crucial
for network resource management to provide differentiated services by Telcos.
Automated Protocol Analysis (APA) is crucial to significantly improve
efficiency and reduce reliance on human experts. There are numerous automated
state-of-the-art unsupervised methods for clustering unknown protocols in APA.
However, many such methods have not been sufficiently explored using diverse
test datasets. Thus failing to demonstrate their robustness to generalise. This
study proposed a comprehensive framework to evaluate various combinations of
feature extraction and clustering methods in APA. It also proposed a novel
approach to automate selection of dataset dependent model parameters for
feature extraction, resulting in improved performance. Promising results of a
novel field-based tokenisation approach also led to our proposal of a novel
automated hybrid approach for feature extraction and clustering of unknown
protocols in APA. Our proposed hybrid approach performed the best in 7 out of 9
of the diverse test datasets, thus displaying the robustness to generalise
across diverse unknown protocols. It also outperformed the unsupervised
clustering technique in state-of-the-art open-source APA tool, NETZOB in all
test datasets.
- Abstract(参考訳): ネットワークプロトコルトラフィックを分析し、区別する能力は、通信会社によって差別化されたサービスを提供するために、ネットワークリソース管理にとって不可欠である。
自動プロトコル分析(APA)は、効率を大幅に改善し、人間の専門家への依存を減らすために重要である。
APAには未知のプロトコルをクラスタリングするための非教師なしの自動化方法が数多くある。
しかし、このような手法の多くは多様なテストデータセットを用いて十分に検討されていない。
したがって、その強固さを一般化できない。
本研究では,APAにおける特徴抽出とクラスタリングの様々な組み合わせを総合的に評価する枠組みを提案する。
また、特徴抽出のためのデータセット依存モデルパラメータの選択を自動化する新しい手法を提案し、性能を改善した。
新しいフィールドベースのトークン化アプローチの有望な成果は、apaにおける未知プロトコルの機能抽出とクラスタリングのための新しい自動ハイブリッドアプローチの提案にもつながった。
提案手法は, 多様なテストデータセットのうち7つ中7つで最良であり, 未知プロトコルを一般化するための堅牢性を示す。
また、すべてのテストデータセットにおいて、最先端のオープンソースAPAツールであるNETZOBにおいて、教師なしクラスタリング技術よりも優れています。
関連論文リスト
- Annotation-Efficient Polyp Segmentation via Active Learning [45.59503015577479]
アノテーション効率の良いポリプセグメンテーションのための深層能動的学習フレームワークを提案する。
実際に,ポリプの予測マップと背景領域の類似性を調べることで,各試料の不確実性を測定する。
提案手法は,パブリックデータセットと大規模社内データセットの双方において,競合相手と比較して,最先端性能を実現していることを示す。
論文 参考訳(メタデータ) (2024-03-21T12:25:17Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - BMD: A General Class-balanced Multicentric Dynamic Prototype Strategy
for Source-free Domain Adaptation [74.93176783541332]
Source-free Domain Adaptation (SFDA)は、トレーニング済みのソースモデルを、十分にラベル付けされたソースデータにアクセスすることなく、未ラベルのターゲットドメインに適応することを目的としている。
ソースデータの欠如を補うため、既存のほとんどのメソッドは、機能プロトタイプベースの擬似ラベル戦略を導入した。
SFDAタスクのための汎用クラスベース多中心動的プロトタイプ戦略を提案する。
論文 参考訳(メタデータ) (2022-04-06T13:23:02Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - Low-rank Dictionary Learning for Unsupervised Feature Selection [11.634317251468968]
低ランク表現に辞書学習のアイデアを適用することで、教師なしの新たな特徴選択手法を導入する。
非教師付き特徴選択のための統一目的関数は、$ell_2,1$-norm正規化によってスパースな方法で提案される。
実験の結果,提案手法は最先端のアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-06-21T13:39:10Z) - Multi-Pretext Attention Network for Few-shot Learning with
Self-supervision [37.6064643502453]
補助的なサンプルに依存しない自己教師付き学習のための,新しい拡張不要な手法を提案する。
さらに,従来の拡張信頼手法とGCを組み合わせるために,特定の注意機構を利用するマルチテキスト注意ネットワーク(MAN)を提案する。
miniImageNetおよびtieredImageNetデータセット上でMANを幅広く評価し、提案手法が最新(SOTA)関連手法より優れていることを実証した。
論文 参考訳(メタデータ) (2021-03-10T10:48:37Z) - Quasi-Global Momentum: Accelerating Decentralized Deep Learning on
Heterogeneous Data [77.88594632644347]
ディープラーニングモデルの分散トレーニングは、ネットワーク上でデータプライバシとデバイス上での学習を可能にする重要な要素である。
現実的な学習シナリオでは、異なるクライアントのローカルデータセットに異質性が存在することが最適化の課題となる。
本稿では,この分散学習の難しさを軽減するために,運動量に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2021-02-09T11:27:14Z) - Detection of Insider Attacks in Distributed Projected Subgradient
Algorithms [11.096339082411882]
汎用ニューラルネットワークは悪質なエージェントの検出とローカライズに特に適していることを示す。
本稿では,連合学習における最先端のアプローチ,すなわち協調型ピアツーピア機械学習プロトコルを採用することを提案する。
シミュレーションでは,AIに基づく手法の有効性と有効性を検証するために,最小二乗問題を考える。
論文 参考訳(メタデータ) (2021-01-18T08:01:06Z) - EXPLAIN-IT: Towards Explainable AI for Unsupervised Network Traffic
Analysis [7.447122949368314]
ラベルのないデータを扱う手法であるEXPLAIN-ITを導入し、意味のあるクラスタを作成し、エンドユーザのクラスタリング結果の説明を提案する。
暗号化されたトラフィックシナリオ下でのYouTubeビデオ品質分類の問題に対してEXPLAIN-ITを適用し,有望な結果を示す。
論文 参考訳(メタデータ) (2020-03-03T17:54:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。