論文の概要: Bias in the Shadows: Explore Shortcuts in Encrypted Network Traffic Classification
- arxiv url: http://arxiv.org/abs/2601.10180v1
- Date: Thu, 15 Jan 2026 08:39:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-16 19:43:19.0566
- Title: Bias in the Shadows: Explore Shortcuts in Encrypted Network Traffic Classification
- Title(参考訳): シャドーのバイアス:暗号化されたネットワークトラフィック分類におけるショートカットの探索
- Authors: Chuyi Wang, Xiaohui Xie, Tongze Wang, Yong Cui,
- Abstract要約: BiasSeekerは、暗号化トラフィックにおけるデータセット固有のショートカット機能を検出するための半自動フレームワークである。
系統分類を導入し,有意義な情報を保存しながらバイアスを低減するカテゴリ固有の検証戦略を適用した。
我々は3つのNTCタスクにわたる19の公開データセットでBiasSeekerを評価した。
- 参考スコア(独自算出の注目度): 8.740413164300957
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pre-trained models operating directly on raw bytes have achieved promising performance in encrypted network traffic classification (NTC), but often suffer from shortcut learning-relying on spurious correlations that fail to generalize to real-world data. Existing solutions heavily rely on model-specific interpretation techniques, which lack adaptability and generality across different model architectures and deployment scenarios. In this paper, we propose BiasSeeker, the first semi-automated framework that is both model-agnostic and data-driven for detecting dataset-specific shortcut features in encrypted traffic. By performing statistical correlation analysis directly on raw binary traffic, BiasSeeker identifies spurious or environment-entangled features that may compromise generalization, independent of any classifier. To address the diverse nature of shortcut features, we introduce a systematic categorization and apply category-specific validation strategies that reduce bias while preserving meaningful information. We evaluate BiasSeeker on 19 public datasets across three NTC tasks. By emphasizing context-aware feature selection and dataset-specific diagnosis, BiasSeeker offers a novel perspective for understanding and addressing shortcut learning in encrypted network traffic classification, raising awareness that feature selection should be an intentional and scenario-sensitive step prior to model training.
- Abstract(参考訳): 生のバイト上で直接動作する事前訓練されたモデルは、暗号化ネットワークトラフィック分類(NTC)において有望な性能を達成しているが、実世界のデータへの一般化に失敗する急激な相関に基づくショートカット学習に悩まされることが多い。
既存のソリューションはモデル固有の解釈技術に大きく依存しており、異なるモデルアーキテクチャやデプロイメントシナリオに対する適応性と汎用性が欠如している。
本稿では,BiasSeekerを提案する。BiasSeekerは,暗号化トラフィックにおけるデータセット固有のショートカット機能を検出するための,モデルに依存しない,データ駆動型の,最初の半自動フレームワークである。
BiasSeekerは、生のバイナリトラフィックを直接統計的に相関解析することにより、任意の分類器から独立して一般化を損なう可能性のある、急激な、あるいは環境に絡み合った特徴を特定する。
ショートカットの特徴の多様性に対処するため、系統分類を導入し、有意義な情報を保存しながらバイアスを低減するカテゴリ固有の検証戦略を適用した。
我々は3つのNTCタスクにわたる19の公開データセットでBiasSeekerを評価した。
BiasSeekerは、コンテキスト対応の機能選択とデータセット固有の診断を強調することで、暗号化されたネットワークトラフィック分類におけるショートカット学習を理解し、対処するための新しい視点を提供する。
関連論文リスト
- Preventing Shortcut Learning in Medical Image Analysis through Intermediate Layer Knowledge Distillation from Specialist Teachers [0.0]
ディープラーニングモデルは、トレーニングデータの急激な相関と無関係な特徴を使って、問題に対するショートカットを学習する傾向がある。
医用画像解析などの高リスクアプリケーションでは、この現象は、予測を行うときに臨床的に意味のある特徴を使用するのを防ぐことができる。
本稿では,タスク関連データの小さなサブセットに微調整された教師ネットワークを活用して,ショートカット学習を緩和する新しい知識蒸留フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-21T17:18:35Z) - Shortcut Learning Susceptibility in Vision Classifiers [11.599035626374409]
ショートカット学習は、機械学習モデルが意味のある特徴をキャプチャする代わりに、データの急激な相関を利用する場所である。
本研究では,クラスラベルと位置と強度の相関関係にあるデータセットに意図的にショートカットを導入する。
異なる学習率で学習をショートカットする可能性を評価する。
論文 参考訳(メタデータ) (2025-02-13T10:25:52Z) - Common-Sense Bias Modeling for Classification Tasks [15.683471433842492]
テキスト記述に基づく画像データセットの包括的バイアスを抽出する新しい枠組みを提案する。
提案手法は,複数の画像ベンチマークデータセットにおける新しいモデルバイアスを明らかにする。
発見されたバイアスは、機能の非相関化のために、単純なデータ再重み付けによって緩和することができる。
論文 参考訳(メタデータ) (2024-01-24T03:56:07Z) - Causality and Independence Enhancement for Biased Node Classification [56.38828085943763]
各種グラフニューラルネットワーク(GNN)に適用可能な新しい因果性・独立性向上(CIE)フレームワークを提案する。
提案手法は,ノード表現レベルでの因果的特徴と突発的特徴を推定し,突発的相関の影響を緩和する。
我々のアプローチCIEは、GNNの性能を大幅に向上するだけでなく、最先端の debiased ノード分類法よりも優れています。
論文 参考訳(メタデータ) (2023-10-14T13:56:24Z) - An Additive Instance-Wise Approach to Multi-class Model Interpretation [53.87578024052922]
解釈可能な機械学習は、ブラックボックスシステムの特定の予測を駆動する要因に関する洞察を提供する。
既存の手法は主に、局所的な加法的あるいはインスタンス的なアプローチに従う説明的入力特徴の選択に重点を置いている。
本研究は,両手法の長所を生かし,複数の対象クラスに対する局所的な説明を同時に学習するためのグローバルフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-07T06:50:27Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Learning What Makes a Difference from Counterfactual Examples and
Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。
我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。
このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2020-04-20T02:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。