論文の概要: FastPacket: Towards Pre-trained Packets Embedding based on FastText for
next-generation NIDS
- arxiv url: http://arxiv.org/abs/2209.14727v1
- Date: Thu, 29 Sep 2022 12:47:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 18:21:18.338021
- Title: FastPacket: Towards Pre-trained Packets Embedding based on FastText for
next-generation NIDS
- Title(参考訳): FastPacket: 次世代NIDS用のFastTextをベースとした事前トレーニングパッケージの埋め込みを目指す
- Authors: Khloud Al Jallad
- Abstract要約: 本稿では,テキストデータ上でのFastTextの成功にインスパイアされた,文字レベルの埋め込みに基づくパケットの埋め込み手法を提案する。
結果はCIC-IDS-2017データセットのサブセットで測定されるが,ビッグデータ事前学習モデルでは有望な結果が期待できる。
トレーニング済みのFastPacketをMAWIビッグデータセット上に構築し、FastTextのようなコミュニティで利用できるようにすることを提案します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: New Attacks are increasingly used by attackers everyday but many of them are
not detected by Intrusion Detection Systems as most IDS ignore raw packet
information and only care about some basic statistical information extracted
from PCAP files. Using networking programs to extract fixed statistical
features from packets is good, but may not enough to detect nowadays
challenges. We think that it is time to utilize big data and deep learning for
automatic dynamic feature extraction from packets. It is time to get inspired
by deep learning pre-trained models in computer vision and natural language
processing, so security deep learning solutions will have its pre-trained
models on big datasets to be used in future researches. In this paper, we
proposed a new approach for embedding packets based on character-level
embeddings, inspired by FastText success on text data. We called this approach
FastPacket. Results are measured on subsets of CIC-IDS-2017 dataset, but we
expect promising results on big data pre-trained models. We suggest building
pre-trained FastPacket on MAWI big dataset and make it available to community,
similar to FastText. To be able to outperform currently used NIDS, to start a
new era of packet-level NIDS that can better detect complex attacks.
- Abstract(参考訳): 新しい攻撃は攻撃者によって日常的に使用されるようになっているが、ほとんどのIDSは生のパケット情報を無視し、PCAPファイルから抽出された基本的な統計情報を気にするので、侵入検知システムでは検出されない。
ネットワークプログラムを用いてパケットから固定された統計的特徴を抽出することはよいが、現在の課題を検出するには不十分である。
我々は,パケットから動的特徴の自動抽出にビッグデータとディープラーニングを利用する時が来たと考えている。
コンピュータービジョンと自然言語処理におけるディープラーニング事前学習モデルに触発される時が来たので、セキュリティ深層学習ソリューションは、将来の研究で使用される大規模なデータセットの事前学習モデルを持つことになる。
本稿では,テキストデータに対する高速テキストの成功に触発された文字レベルの埋め込みに基づくパケット埋め込み手法を提案する。
このアプローチをfastpacketと呼んでいます。
結果はCIC-IDS-2017データセットのサブセットで測定されるが,ビッグデータ事前学習モデルでは有望な結果が期待できる。
トレーニング済みのFastPacketをMAWIビッグデータセット上に構築し、FastTextのようなコミュニティで利用できるようにすることを提案します。
現在使われているNIDSより優れているように、複雑な攻撃を検知できるパケットレベルのNIDSの新しい時代を始めることができる。
関連論文リスト
- BoostAdapter: Improving Vision-Language Test-Time Adaptation via Regional Bootstrapping [64.8477128397529]
本稿では,テスト時間適応フレームワークを提案する。
我々は、インスタンスに依存しない履歴サンプルとインスタンスを意識したブースティングサンプルから特徴を検索するための軽量なキー値メモリを維持している。
理論的には,本手法の背後にある合理性を正当化し,アウト・オブ・ディストリビューションとクロスドメイン・データセットの両方において,その有効性を実証的に検証する。
論文 参考訳(メタデータ) (2024-10-20T15:58:43Z) - Towards Novel Malicious Packet Recognition: A Few-Shot Learning Approach [0.0]
Deep Packet Inspection (DPI)は、ネットワークセキュリティを強化する重要な技術として登場した。
本研究では,大規模言語モデル(LLM)と少数ショット学習を活用する新しいアプローチを提案する。
提案手法は,マルウェアの種類によって平均精度86.35%,F1スコア86.40%の有望な結果を示す。
論文 参考訳(メタデータ) (2024-09-17T15:02:32Z) - Adaptive Pre-training Data Detection for Large Language Models via Surprising Tokens [1.2549198550400134]
大きな言語モデル(LLM)は広く使われているが、プライバシー、セキュリティ、著作権については不透明なトレーニングデータのために懸念されている。
この問題に対する現在の解決策は、メンバーシップ推論攻撃(MIA)のような機械学習プライバシで探索されたテクニックを活用する。
本稿では、この信頼性を軽減し、同定を効果的に増幅する適応型事前学習データ検出法を提案する。
論文 参考訳(メタデータ) (2024-07-30T23:43:59Z) - Unsupervised Pre-training with Language-Vision Prompts for Low-Data Instance Segmentation [105.23631749213729]
低データ体制における教師なし事前学習のための新しい手法を提案する。
最近成功したプロンプト技術に触発されて,言語ビジョンプロンプトを用いた教師なし事前学習法を導入した。
提案手法は,低データ方式のCNNモデルよりも高速に収束し,性能がよいことを示す。
論文 参考訳(メタデータ) (2024-05-22T06:48:43Z) - Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - A Comprehensive Python Library for Deep Learning-Based Event Detection
in Multivariate Time Series Data and Information Retrieval in NLP [0.0]
時系列データ中の事象を検出するための新しいディープラーニング制御手法を提案する。
これは二項分類ではなく回帰に基づく。
ラベル付きデータセットは必要とせず、各ポイントにラベルが付けられている。
時間ポイントや時間間隔として定義された参照イベントのみを必要とする。
論文 参考訳(メタデータ) (2023-10-25T09:13:19Z) - Improved Flow Recovery from Packet Data [0.0]
本稿では,パケットデータからフローレコードや要約メタデータを高精度かつ堅牢に抽出する方法に焦点を当てる。
このデータは、機械学習とサイバー脅威検出技術のためのトレーニングデータとして有用である。
論文 参考訳(メタデータ) (2023-10-15T13:36:33Z) - Bag of Tricks for Training Data Extraction from Language Models [98.40637430115204]
公開データセットを用いてトレーニングデータ抽出を改善するための手法とベンチマーク手法について検討する。
実験結果から,これまで見過ごされていたいくつかのトリックが,トレーニングデータ抽出の成功に不可欠であることが示唆された。
論文 参考訳(メタデータ) (2023-02-09T06:46:42Z) - Prompt-driven efficient Open-set Semi-supervised Learning [52.30303262499391]
オープンセット半教師付き学習(OSSL)は関心を集めており、未ラベルデータにのみOOD(Out-of-distribution)サンプルが組み込まれているというより実践的なシナリオを調査している。
我々はOpenPromptと呼ばれる,プロンプト駆動の効率的なOSSLフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-28T16:25:08Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。