論文の概要: Synthetic Network Packet Generation through Statistical Learning and Genetic Algorithms
- arxiv url: http://arxiv.org/abs/2606.20864v1
- Date: Thu, 18 Jun 2026 18:52:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 12:30:24.87389
- Title: Synthetic Network Packet Generation through Statistical Learning and Genetic Algorithms
- Title(参考訳): 統計的学習と遺伝的アルゴリズムによる合成ネットワークパケット生成
- Authors: Mayank Raj, Nathaniel D. Bastian, Lance Fiondella, Gokhan Kul,
- Abstract要約: 本稿では,合成IoTネットワークパケット生成のための2つの制約付きアプローチを提案し,比較する。
ACI IoT 2023データセットの完全な評価は、両方のメソッドがすべてのカテゴリにわたるPASSステータスを達成することを示している。
- 参考スコア(独自算出の注目度): 6.42094170804706
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing robust intrusion detection systems (IDS) for IoT environments requires large, labeled datasets capturing realistic traffic distributions across both benign and malicious activity. Existing public datasets suffer from fixed activity distributions and extreme class imbalance, while deep generative models (GANs, VAEs) provide no mechanism to enforce that synthetic packets remain within physically valid feature ranges. This paper proposes and compares two constraint-enforcing approaches for synthetic IoT network packet generation: (i) a statistical learning method combining PCA-based latent space sampling with dual One-Class SVM (OCSVM) and Isolation Forest (IF) boundary enforcement, and (ii) a genetic algorithm (GA) method that treats packet generation as a multi-objective optimization problem with explicit fitness criteria for anomaly model acceptance and distributional fidelity. Both methods embed hard validity constraints -- dual anomaly-detection gating, feature-range clamping, and independent validation -- directly into the synthesis pipeline. Evaluation on the complete ACI IoT 2023 dataset (1,231,411 packets, 12 attack categories, class imbalance up to 175,805:1) demonstrates that both methods achieve PASS status across all categories under independently trained validators with a 30% anomaly rate threshold: the statistical method attains 1.20% average anomaly rate with ~1,091 packets/s throughput, while the GA attains 0.62% average anomaly rate with organic per-class variance (0.00%-2.50%) at ~5.7 packets/s. Both methods successfully amplify the 5-sample ARP Spoofing category by 200x to 1,000 validated packets. The ~190:1 throughput ratio between methods, combined with their complementary quality profiles, provides evidence-based selection criteria for deployment contexts ranging from rapid dataset augmentation to adversarial robustness testing.
- Abstract(参考訳): IoT環境用の堅牢な侵入検知システム(IDS)を開発するには、良質なアクティビティと悪意のあるアクティビティの両方にわたる現実的なトラフィック分布をキャプチャするラベル付きデータセットが必要になる。
既存のデータセットは、固定された活動分布と極端なクラス不均衡に悩まされており、一方、深層生成モデル(GAN、VAE)は、合成パケットが物理的に有効な特徴範囲内に留まることを強制するメカニズムを提供していない。
本稿では,合成IoTネットワークパケット生成のための2つの制約付きアプローチを提案し,比較する。
i)PCAに基づく潜伏空間サンプリングとOCSVM(One-Class SVM)とIF(Isolation Forest)境界法を組み合わせた統計的学習手法
(II) パケット生成を多目的最適化問題として扱う遺伝的アルゴリズム(GA) の手法で, 異常モデルの受容と分布の忠実度に対する明示的な適合度基準を定めている。
どちらのメソッドも、二重異常検出ゲーティング、特徴範囲のクランプ、独立したバリデーションといったハードな妥当性の制約を、合成パイプラインに直接埋め込む。
完全なACI IoT 2023データセット(1,231,411パケット、12の攻撃カテゴリ、クラス不均衡175,805:1)の評価は、両方の手法が独立に訓練されたバリデータの下で、30%の異常レート閾値でPASSステータスを達成していることを示している。
どちらの手法も、5サンプルのAPPスポフィングカテゴリを200倍から1,000個の検証パケットに増幅することに成功した。
メソッド間のスループット比 ~190:1 は、その補完的な品質プロファイルと組み合わせて、迅速なデータセット拡張から敵の堅牢性テストまで、デプロイメントコンテキストに対するエビデンスベースの選択基準を提供する。
関連論文リスト
- UniPCB: A Generation-Assisted Detection Framework for PCB Defect Inspection [16.687894734386322]
制御された欠陥合成とタスク固有の欠陥検出を統合した世代別PCB欠陥検査フレームワークを提案する。
DsPCBSD+の実験では、UniPCBは98.0%のmAP@0.5と61.8%のmAP@0.5:0.95の欠陥検出を達成した。
論文 参考訳(メタデータ) (2026-05-06T08:30:27Z) - Reliable Self-Harm Risk Screening via Adaptive Multi-Agent LLM Systems [6.14481021961242]
有向非巡回グラフ(DAG)として構造化されたマルチエージェントパイプラインの統計的枠組みを提案する。
我々は各エージェントをカテゴリー決定としてモデル化し、より厳密なエージェントレベルのパフォーマンス信頼境界を導入する。
本研究では,2つのラベル付きデータセットを用いた行動保健システムの評価を行った。
論文 参考訳(メタデータ) (2026-04-24T01:52:54Z) - Too Correct to Learn: Reinforcement Learning on Saturated Reasoning Data [55.84428098924793]
構造保存探索を行うためのパラメータ自由復号法である Constrained Uniform Top-K Smpling (CUTS) を提案する。
グループ内の利点分散を増幅するために、エクスプロイトと探索的なロールアウトを相乗化するためのトレーニングフレームワークであるMixed-CUTSに統合する。
特にMixed-CUTSは、AIME25ベンチマークのPass@1の精度を標準のGRPOよりも15.1%向上している。
論文 参考訳(メタデータ) (2026-04-20T16:43:28Z) - AVP-Fusion: Adaptive Multi-Modal Fusion and Contrastive Learning for Two-Stage Antiviral Peptide Identification [2.242125769416219]
AVP-Fusionは、適応的な特徴融合と対照的な学習を統合した、新しい2段階のディープラーニングフレームワークである。
精度は 0.9531 であり、MCC は 0.9064 であり、最先端の手法を著しく上回っている。
移行学習を利用する第2段階では、このモデルは6つのウイルスファミリーと8つの特定のウイルスの正確なサブクラス予測を可能にする。
論文 参考訳(メタデータ) (2025-12-25T07:29:39Z) - Heterogeneous Multisource Transfer Learning via Model Averaging for Positive-Unlabeled Data [2.030810815519794]
本研究では,異種データソースからの情報を直接データ共有なしで統合するトランスファー学習フレームワークを提案する。
各ソースドメインタイプに対して、調整されたロジスティック回帰モデルを実行し、平均化によって知識をPUターゲットドメインに転送する。
提案手法は,特にラベル付きデータや異種環境において,予測精度とロバスト性において,他の比較手法よりも優れる。
論文 参考訳(メタデータ) (2025-11-14T03:15:31Z) - ExDD: Explicit Dual Distribution Learning for Surface Defect Detection via Diffusion Synthesis [2.7215409221888476]
産業欠陥検出システムは、一級異常検出パラダイムに制限された場合、限界に直面する。
両機能分布を明示的にモデル化することで,これらの制約を超越する新しいフレームワークであるExDDを提案する。
論文 参考訳(メタデータ) (2025-07-21T07:49:00Z) - Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。
動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。
これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文 参考訳(メタデータ) (2025-07-14T16:19:00Z) - A Channel-ensemble Approach: Unbiased and Low-variance Pseudo-labels is Critical for Semi-supervised Classification [61.473485511491795]
半教師付き学習(SSL)はコンピュータビジョンにおける実践的な課題である。
Pseudo-label (PL) メソッド、例えば FixMatch や FreeMatch は SSL で State of The Art (SOTA) のパフォーマンスを取得する。
本稿では,複数の下位PLを理論的に保証された非偏りと低分散のPLに集約する,軽量なチャネルベースアンサンブル法を提案する。
論文 参考訳(メタデータ) (2024-03-27T09:49:37Z) - Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文 参考訳(メタデータ) (2023-10-01T05:07:17Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。