論文の概要: MambaNetBurst: Direct Byte-level Network Traffic Classification without Tokenization or Pretraining
- arxiv url: http://arxiv.org/abs/2605.11034v1
- Date: Mon, 11 May 2026 02:01:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.319871
- Title: MambaNetBurst: Direct Byte-level Network Traffic Classification without Tokenization or Pretraining
- Title(参考訳): MambaNetBurst: トークン化や事前トレーニングなしで直接バイトレベルのネットワークトラフィック分類
- Authors: Gayan K. Kulatilleke, Siamak Layeghy, Mahsa Baktashmotlagh, Marius Portmann,
- Abstract要約: MambaNetBurstは、Mamba-2のバックボーンに基づくネットワークバースト分類のための、コンパクトなトークンライザなしバイトレベルのシークエンス分類器である。
本手法は, 生パケットバイトを直接操作し, トークン化, パッチ, 重工業化されたマルチモーダル表現を回避する。
MambaNetBurstは一貫して強力な結果をもたらし、かなり重く、しばしばトレーニング済みのベースラインと競合する。
- 参考スコア(独自算出の注目度): 12.060053394320725
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present MambaNetBurst, a compact tokenizer-free byte-level sequence classifier for network burst classification based on a Mamba-2 backbone. In contrast to most recent strong traffic-classification and intrusion-detection approaches, our method operates directly on raw packet bytes, avoids tokenization, patching, and heavy engineered multimodal representations, and does not require any self-supervised pre-training stage. Given a packet flow, we form a fixed-length burst from the first few packets, embed the resulting byte sequence appending a learnable CLS token, and process it with a stack of residual pre-normalized Mamba-2 blocks for end-to-end supervised classification. Across six public benchmarks spanning encrypted mobile app identification, VPN/Tor traffic classification, malware traffic classification, and IoT attack traffic, MambaNetBurst achieves consistently strong results and is competitive with, or outperforms, substantially heavier and often pre-trained baselines. Our ablation study shows that preserving byte-level temporal resolution is critical, that early downsampling through striding is consistently harmful, and that moderate state sizes are sufficient for robust generalization. We further show that Mamba-2, despite its more constrained transition structure relative to Mamba-1, remains highly effective for packet-byte modeling while providing clear efficiency advantages, particularly in training speed. Overall, our results demonstrate that direct **undiluted** byte-to-classification learning with compact selective state space models is a practical, effective and novel direction for efficient, deployable traffic analysis that bypasses the complexity of pre-training pipelines even over highly optimized linear attention architectures.
- Abstract(参考訳): MambaNetBurstは,Mamba-2のバックボーンをベースとしたネットワークバースト分類のための,コンパクトなトークンライザフリーバイトレベルのシークエンス分類器である。
近年の強いトラフィック分類や侵入検出手法とは対照的に,本手法は生のパケットバイトを直接操作し,トークン化やパッチ,重工業的なマルチモーダル表現を回避し,自己管理型事前学習の段階を必要としない。
パケットフローが与えられた場合、最初の数個のパケットから固定長バーストを作成し、学習可能なCLSトークンを付加したバイト列を埋め込んで、エンド・ツー・エンドの教師付き分類のために正規化されたMamba-2ブロックの残余のスタックで処理する。
暗号化されたモバイルアプリの識別、VPN/Torトラフィックの分類、マルウェアトラフィックの分類、IoTアタックトラフィックにまたがる6つの公開ベンチマークにおいて、MambaNetBurstは一貫して強力な結果を獲得し、非常に重く、しばしばトレーニング済みのベースラインと競合する、あるいはパフォーマンスに優れている。
我々のアブレーション研究は、バイトレベルの時間分解能の保存が重要であり、ストライディングによる早期のダウンサンプリングは一貫して有害であり、中程度の状態サイズは堅牢な一般化に十分であることを示している。
さらに、Mamba-2は、より制約のある遷移構造であるにもかかわらず、パケットバイトのモデリングに非常に有効でありながら、特にトレーニング速度において明確な効率性を提供していることを示す。
全体として、コンパクトな選択的状態空間モデルを用いた***バイト分類学習は、高度に最適化された線形アテンションアーキテクチャでさえも、事前学習パイプラインの複雑さを回避し、効率的でデプロイ可能なトラフィック分析のための実用的で効果的で斬新な方向であることを示す。
関連論文リスト
- Stateful Token Reduction for Long-Video Hybrid VLMs [69.6930118088911]
ハイブリッドビデオビジョン言語モデル(VLM)のクエリ条件付きトークン削減について検討する。
本稿では,低段階から高段階の減算スケジュールと,注意とマンバブロックの両ブロックを対象とした言語認識スコアリング機構を提案する。
積極的圧縮条件下では,本手法はテスト時にほぼベースライン精度で精度の高いプリフィルング・スピードアップを実現する。
論文 参考訳(メタデータ) (2026-02-27T08:11:06Z) - U-Mamba2-SSL for Semi-Supervised Tooth and Pulp Segmentation in CBCT [44.3806898357896]
U-Mamba2-SSLは,U-Mamba2モデル上に構築され,多段階の学習戦略を用いる,新しい半教師付き学習フレームワークである。
U-Mamba2-SSLは平均スコア0.789、DSC0.917を隠しテストセットで達成し、STSR 2025のタスク1で1位となった。
論文 参考訳(メタデータ) (2025-09-24T14:19:33Z) - Convolutions are Competitive with Transformers for Encrypted Traffic Classification with Pre-training [12.150588010496165]
我々は,線形複雑化と暗黙的な位置符号化を伴う畳み込みが,事前学習を伴う暗号化トラフィック分類において,トランスフォーマーと競合するかどうかを検討する。
我々は,暗号化トラフィック分類のための新しい学習済み畳み込みモデルであるNetConvを提案する。
我々はNetConvが既存の事前学習モデルよりも平均分類性能を6.88%向上し、モデルのスループットを7.41倍向上することを示した。
論文 参考訳(メタデータ) (2025-08-04T02:42:44Z) - MIETT: Multi-Instance Encrypted Traffic Transformer for Encrypted Traffic Classification [59.96233305733875]
トラフィックの分類は、セキュリティの脅威を検出し、ネットワーク管理を最適化するために不可欠である。
トークンレベルとパケットレベルの両方の関係をキャプチャするMulti-Instance Encrypted Traffic Transformer (MIETT)を提案する。
MIETTは5つのデータセットにまたがって結果を達成し、暗号化されたトラフィックの分類と複雑なネットワーク動作の理解の有効性を示す。
論文 参考訳(メタデータ) (2024-12-19T12:52:53Z) - SIGMA: Selective Gated Mamba for Sequential Recommendation [56.85338055215429]
最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-08-21T09:12:59Z) - NetMamba: Efficient Network Traffic Classification via Pre-training Unidirectional Mamba [14.02833253204577]
ネットワークトラフィックの分類は、サービス品質の向上、ネットワーク管理の効率化、サイバーセキュリティの強化を目的とした重要な研究分野である。
既存のアプローチは2つの大きな課題に直面している。まず、広く使われているTransformerアーキテクチャの2次複雑さのために、モデル非効率に苦しむ。
本稿では,包括的トラフィック表現方式を備えた線形時間空間モデルであるNetMambaを提案する。
論文 参考訳(メタデータ) (2024-05-19T04:58:53Z) - One Train for Two Tasks: An Encrypted Traffic Classification Framework
Using Supervised Contrastive Learning [18.63871240173137]
CLE-TFE(Contrastive Learning Enhanced Temporal Fusion)と呼ばれる効果的なモデルを提案する。
特に、教師付きコントラスト学習を利用して、パケットレベルおよびフローレベル表現を強化する。
また、パケットレベルとフローレベルの分類タスクを1つのトレーニングで同時に行うクロスレベルマルチタスク学習を提案する。
論文 参考訳(メタデータ) (2024-02-12T09:10:09Z) - Distributed Adversarial Training to Robustify Deep Neural Networks at
Scale [100.19539096465101]
現在のディープニューラルネットワーク(DNN)は、入力に対する敵の摂動が分類を変更したり操作したりする敵の攻撃に対して脆弱である。
このような攻撃を防御するために、敵の訓練(AT)として知られる効果的なアプローチが、堅牢な訓練を緩和するために示されている。
複数のマシンにまたがって実装された大規模バッチ対逆トレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-13T15:39:43Z) - The Devil is in the Boundary: Exploiting Boundary Representation for
Basis-based Instance Segmentation [85.153426159438]
本研究では,既存のグローバルマスクベースの手法を補完するグローバル境界表現を学習するために,Basisベースのインスタンス(B2Inst)を提案する。
私たちのB2Instは一貫した改善をもたらし、シーン内のインスタンス境界を正確に解析します。
論文 参考訳(メタデータ) (2020-11-26T11:26:06Z) - Improving Semantic Segmentation via Self-Training [75.07114899941095]
半教師付きアプローチ,特に自己学習パラダイムを用いて,最先端の成果を得ることができることを示す。
まず、ラベル付きデータに基づいて教師モデルを訓練し、次にラベルなしデータの大規模なセット上で擬似ラベルを生成する。
私たちの堅牢なトレーニングフレームワークは、人名と擬似ラベルを共同で消化し、Cityscapes、CamVid、KITTIデータセット上で最高のパフォーマンスを達成することができます。
論文 参考訳(メタデータ) (2020-04-30T17:09:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。