論文の概要: LMDG: Advancing Lateral Movement Detection Through High-Fidelity Dataset Generation
- arxiv url: http://arxiv.org/abs/2508.02942v1
- Date: Mon, 04 Aug 2025 22:49:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:55.70795
- Title: LMDG: Advancing Lateral Movement Detection Through High-Fidelity Dataset Generation
- Title(参考訳): LMDG:高忠実度データセット生成による横動き検出の高速化
- Authors: Anas Mabrouk, Mohamed Hatem, Mohammad Mamun, Sherif Saad,
- Abstract要約: 横行運動(LM)攻撃は企業のセキュリティに重大な脅威をもたらす。
LM検出システムの開発と評価は, 現実的, 順調なデータセットの欠如によって妨げられる。
高忠実度LMデータセットを生成するためのスケーラブルなフレームワーク LMDG を提案する。
- 参考スコア(独自算出の注目度): 0.2399911126932527
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Lateral Movement (LM) attacks continue to pose a significant threat to enterprise security, enabling adversaries to stealthily compromise critical assets. However, the development and evaluation of LM detection systems are impeded by the absence of realistic, well-labeled datasets. To address this gap, we propose LMDG, a reproducible and extensible framework for generating high-fidelity LM datasets. LMDG automates benign activity generation, multi-stage attack execution, and comprehensive labeling of system and network logs, dramatically reducing manual effort and enabling scalable dataset creation. A central contribution of LMDG is Process Tree Labeling, a novel agent-based technique that traces all malicious activity back to its origin with high precision. Unlike prior methods such as Injection Timing or Behavioral Profiling, Process Tree Labeling enables accurate, step-wise labeling of malicious log entries, correlating each with a specific attack step and MITRE ATT\&CK TTPs. To our knowledge, this is the first approach to support fine-grained labeling of multi-step attacks, providing critical context for detection models such as attack path reconstruction. We used LMDG to generate a 25-day dataset within a 25-VM enterprise environment containing 22 user accounts. The dataset includes 944 GB of host and network logs and embeds 35 multi-stage LM attacks, with malicious events comprising less than 1% of total activity, reflecting a realistic benign-to-malicious ratio for evaluating detection systems. LMDG-generated datasets improve upon existing ones by offering diverse LM attacks, up-to-date attack patterns, longer attack timeframes, comprehensive data sources, realistic network architectures, and more accurate labeling.
- Abstract(参考訳): 横行運動(LM)攻撃は企業セキュリティに重大な脅威を与え続けており、敵は密かに重要な資産を侵害することができる。
しかし, LM検出システムの開発と評価は, 現実的, 良質なデータセットの欠如によって妨げられている。
このギャップに対処するために、高忠実なLMデータセットを生成するための再現可能で拡張可能なフレームワークであるLMDGを提案する。
LMDGは、良質なアクティビティ生成、マルチステージアタック実行、システムとネットワークログの包括的なラベル付けを自動化する。
LMDGの中心的な貢献はプロセスツリーラベリング(Process Tree Labeling)である。
インジェクションタイミングやビヘイビアプロファイリングといった従来の方法とは異なり、プロセスツリーラベリングは悪意のあるログエントリの正確な段階的なラベル付けを可能にし、それぞれを特定のアタックステップとMITRE ATT\&CK TTPと関連付ける。
我々の知る限り、これはマルチステップ攻撃のきめ細かいラベル付けをサポートする最初のアプローチであり、攻撃経路再構成などの検出モデルに重要なコンテキストを提供する。
LMDGを使用して、22のユーザアカウントを含む25VMのエンタープライズ環境で25日間のデータセットを生成しました。
データセットには944GBのホストとネットワークログが含まれており、35のマルチステージLM攻撃を埋め込んでいる。
LMDGが生成するデータセットは、多様なLMアタック、最新のアタックパターン、より長いアタックタイムフレーム、包括的なデータソース、リアルネットワークアーキテクチャ、より正確なラベリングを提供することによって、既存のデータセットを改善している。
関連論文リスト
- MrM: Black-Box Membership Inference Attacks against Multimodal RAG Systems [31.53306157650065]
マルチモーダル検索拡張生成(RAG)システムは、クロスモーダル知識を統合することで、大きな視覚言語モデルを強化する。
これらの知識データベースには、プライバシー保護を必要とする機密情報が含まれている可能性がある。
MrMはマルチモーダルRAGシステムを対象とした最初のブラックボックスMIAフレームワークである。
論文 参考訳(メタデータ) (2025-06-09T03:48:50Z) - Backdoor Cleaning without External Guidance in MLLM Fine-tuning [76.82121084745785]
Believe Your Eyes (BYE)は、アテンションエントロピーパターンを自己教師信号として活用して、バックドアサンプルを特定してフィルタリングするデータフィルタリングフレームワークである。
クリーンタスクのパフォーマンスを維持しながら、ほぼゼロの攻撃成功率を達成する。
論文 参考訳(メタデータ) (2025-05-22T17:11:58Z) - Technical Report: Generating the WEB-IDS23 Dataset [1.1101390076342181]
いくつかの広く使われているデータセットは、十分にきめ細かいラベルを含まない。
モジュラートラフィックジェネレータは 様々な良質で悪意のあるトラフィックをシミュレートできます
データセットは、82のフローレベルの特徴と21のきめ細かいラベルを持つ1200万以上のサンプルをキャプチャする。
論文 参考訳(メタデータ) (2025-02-06T09:33:02Z) - Mitigating Forgetting in LLM Fine-Tuning via Low-Perplexity Token Learning [61.99353167168545]
LLM生成データによる微調整により,目標タスクの性能が向上し,非目標タスクの劣化が低減されることを示す。
微調整後のLSMにおける破滅的忘れを緩和するために、トークンの難易度低減に基づく経験的説明を提供する最初の研究である。
論文 参考訳(メタデータ) (2025-01-24T08:18:56Z) - Security Vulnerability Detection with Multitask Self-Instructed Fine-Tuning of Large Language Models [8.167614500821223]
脆弱性検出のためのMSIVD, マルチタスクによる自己指示型微調整を, チェーン・オブ・シント・プロンプトとLDMによる自己指示にインスパイアした。
実験の結果,MSIVDは高い性能を示し,LineVul(LLMベースの脆弱性検出ベースライン)はBigVulデータセットでは0.92点,PreciseBugsデータセットでは0.48点であった。
論文 参考訳(メタデータ) (2024-06-09T19:18:05Z) - Robust Synthetic Data-Driven Detection of Living-Off-the-Land Reverse Shells [14.710331873072146]
LOTL(Living-off-the-land)技術は、セキュリティ運用において大きな課題となる。
セキュリティ情報およびイベント管理(SIEM)ソリューションとして,サイバー防衛システムのための堅牢な拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-28T13:49:23Z) - Model Stealing Attack against Graph Classification with Authenticity, Uncertainty and Diversity [80.16488817177182]
GNNは、クエリ許可を通じてターゲットモデルを複製するための悪行であるモデル盗難攻撃に対して脆弱である。
異なるシナリオに対応するために,3つのモデルステルス攻撃を導入する。
論文 参考訳(メタデータ) (2023-12-18T05:42:31Z) - Task-Distributionally Robust Data-Free Meta-Learning [99.56612787882334]
Data-Free Meta-Learning (DFML)は、複数の事前学習モデルを活用することで、独自のトレーニングデータを必要とせずに、新しいタスクを効率的に学習することを目的としている。
TDS(Task-Distribution Shift)とTDC(Task-Distribution Corruption)の2つの大きな課題を初めて明らかにした。
論文 参考訳(メタデータ) (2023-11-23T15:46:54Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Graph Backdoor [53.70971502299977]
GTAはグラフニューラルネットワーク(GNN)に対する最初のバックドア攻撃である。
GTAは、トポロジカル構造と記述的特徴の両方を含む特定の部分グラフとしてトリガーを定義する。
トランスダクティブ(ノード分類など)とインダクティブ(グラフ分類など)の両方のタスクに対してインスタンス化することができる。
論文 参考訳(メタデータ) (2020-06-21T19:45:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。