論文の概要: S-DAPT-2026: A Stage-Aware Synthetic Dataset for Advanced Persistent Threat Detection
- arxiv url: http://arxiv.org/abs/2601.06690v1
- Date: Sat, 10 Jan 2026 21:25:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.940399
- Title: S-DAPT-2026: A Stage-Aware Synthetic Dataset for Advanced Persistent Threat Detection
- Title(参考訳): S-DAPT-2026 高度な脅威検出のための段階認識合成データセット
- Authors: Saleem Ishaq Tijjani, Bogdan Ghita, Nathan Clarke, Matthew Craven,
- Abstract要約: 本稿では,ほぼ現実的な合成APTデータセットと効果的な警告相関フレームワークを提案する。
提案手法では,K Nearest Neighbors(KNN)クラスタリングとコサイン類似度メトリクスを併用した機械学習ベースの相関モジュールを導入し,セマンティック関連アラートをグループ化する。
APTステージ予測の認識と支援を容易にするため、データセットの包括的な統計的特徴付けが提供される。
- 参考スコア(独自算出の注目度): 0.0538441598991272
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The detection of advanced persistent threats (APTs) remains a crucial challenge due to their stealthy, multistage nature and the limited availability of realistic, labeled datasets for systematic evaluation. Synthetic dataset generation has emerged as a practical approach for modeling APT campaigns; however, existing methods often rely on computationally expensive alert correlation mechanisms that limit scalability. Motivated by these limitations, this paper presents a near realistic synthetic APT dataset and an efficient alert correlation framework. The proposed approach introduces a machine learning based correlation module that employs K Nearest Neighbors (KNN) clustering with a cosine similarity metric to group semantically related alerts within a temporal context. The dataset emulates multistage APT campaigns across campus and organizational network environments and captures a diverse set of fourteen distinct alert types, exceeding the coverage of commonly used synthetic APT datasets. In addition, explicit APT campaign states and alert to stage mappings are defined to enable flexible integration of new alert types and support stage aware analysis. A comprehensive statistical characterization of the dataset is provided to facilitate reproducibility and support APT stage predictions.
- Abstract(参考訳): 高度な永続的脅威(APT)の検出は、ステルス性、マルチステージの性質、そして体系的な評価のためにラベル付きリアルデータセットの可用性が制限されているため、依然として重要な課題である。
合成データセット生成は、APTキャンペーンをモデル化するための実用的なアプローチとして現れてきたが、既存の手法はスケーラビリティを制限する計算コストの高い警告相関機構に依存していることが多い。
これらの制約により,本論文では,ほぼ現実的な合成APTデータセットと,効率的な警告相関フレームワークを提案する。
提案手法では,K Nearest Neighbors(KNN)クラスタリングとコサイン類似度指標を用いて,時間的コンテキスト内での意味的関連アラートをグループ化する機械学習ベースの相関モジュールを提案する。
このデータセットは、キャンパスや組織ネットワーク環境における多段階のAPTキャンペーンをエミュレートし、一般的に使用される合成APTデータセットのカバレッジを超えた、14の異なる警告タイプのさまざまなセットをキャプチャする。
さらに、明示的なAPTキャンペーンステートとステージマッピングへの警告を定義し、新しい警告タイプを柔軟に統合し、ステージアウェアネス分析をサポートする。
再現性を容易にし、APTステージ予測をサポートするために、データセットの包括的な統計的特徴付けを提供する。
関連論文リスト
- Deep Recurrent Hidden Markov Learning Framework for Multi-Stage Advanced Persistent Threat Prediction [0.0538441598991272]
Advanced Persistent Threats (APTs)は、長期持続性と適応行動が従来の侵入検知システム(IDS)に挑戦する、隠れた多段階のサイバー攻撃を表す。
本稿では,畳み込み型ニューラルネットワークとHMM(Hidden Markov Model)を統合し,APTキャンペーンの進行の正確な予測を可能にするハイブリッド深層確率学習フレームワークであるE-HiDNetを提案する。
シミュレーションの結果、E-HiDNetはステージ予測において最大98.8-100%の精度を達成し、4つ以上の観測が可能な場合、スタンドアロンのHMMよりも大幅に優れていた。
論文 参考訳(メタデータ) (2026-01-11T01:01:10Z) - APT-CGLP: Advanced Persistent Threat Hunting via Contrastive Graph-Language Pre-Training [33.84587345029278]
Provenance-based threat Huntは、CTI(Cyber Threat Intelligence)に記述されている攻撃パターンと、システム監査ログから派生した証明グラフを関連付けて、エンドポイント上のAdvanced Persistent Threats(APT)を特定する。
このパラダイムの根本的な課題は、前駆グラフとCTIレポートの間の構造的および意味的な切り離しであるモダリティギャップにある。
APT-CGLPは,コントラストグラフ・ランゲージ事前学習による新しいAPT狩猟システムである。
論文 参考訳(メタデータ) (2025-11-25T13:20:12Z) - Spatial-Temporal-Spectral Unified Modeling for Remote Sensing Dense Prediction [20.1863553357121]
リモートセンシングのための現在のディープラーニングアーキテクチャは、基本的に堅固である。
本稿では,統合モデリングのための空間時間スペクトル統一ネットワーク(STSUN)について紹介する。
STSUNは任意の空間サイズ、時間長、スペクトル帯域で入力および出力データに適応することができる。
様々な密集した予測タスクと多様な意味クラス予測を統一する。
論文 参考訳(メタデータ) (2025-05-18T07:39:17Z) - Conditional Data Synthesis Augmentation [4.3108820946281945]
Conditional Data Synthesis Augmentation (CoDSA)は、マルチモーダルドメイン間のモデルパフォーマンスを改善するために高忠実度データを合成する新しいフレームワークである。
合成データの現実性を高め,スパース領域の試料密度を高めるために,CoDSAファインチューン事前学習生成モデルを構築した。
本稿では,合成サンプル量と対象領域割り当ての関数として,CoDSAが実現した統計的精度向上を定量化する理論的枠組みを提案する。
論文 参考訳(メタデータ) (2025-04-10T03:38:11Z) - CTI-HAL: A Human-Annotated Dataset for Cyber Threat Intelligence Analysis [2.7862108332002546]
サイバー脅威インテリジェンス(CTI)の情報源は、しばしば非構造化されており、自然言語で情報を自動的に抽出することは困難である。
近年,CTIデータからAIを自動抽出する方法が研究されている。
我々は,MITRE ATT&CKフレームワークに基づいて,CTIレポートを手作業で構築し,構造化した新しいデータセットを提案する。
論文 参考訳(メタデータ) (2025-04-08T09:47:15Z) - AdvKT: An Adversarial Multi-Step Training Framework for Knowledge Tracing [64.79967583649407]
知識追跡(KT)は、学生の知識状態を監視し、質問シーケンスに対する反応をシミュレートする。
既存のKTモデルは通常、単一ステップのトレーニングパラダイムに従っており、大きなエラーの蓄積につながる。
本稿では,多段階KTタスクに着目した新しい知識追跡のための多段階学習フレームワーク(AdvKT)を提案する。
論文 参考訳(メタデータ) (2025-04-07T03:31:57Z) - Model Stealing Attack against Graph Classification with Authenticity, Uncertainty and Diversity [80.16488817177182]
GNNは、クエリ許可を通じてターゲットモデルを複製するための悪行であるモデル盗難攻撃に対して脆弱である。
異なるシナリオに対応するために,3つのモデルステルス攻撃を導入する。
論文 参考訳(メタデータ) (2023-12-18T05:42:31Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。