論文の概要: PROVSYN: Synthesizing Provenance Graphs for Data Augmentation in Intrusion Detection Systems
- arxiv url: http://arxiv.org/abs/2506.06226v1
- Date: Fri, 06 Jun 2025 16:41:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.556397
- Title: PROVSYN: Synthesizing Provenance Graphs for Data Augmentation in Intrusion Detection Systems
- Title(参考訳): PROVSYN:侵入検知システムにおけるデータ拡張のための前処理グラフの合成
- Authors: Yi Huang, Wajih UI Hassan, Yao Guo, Xiangqun Chen, Ding Li,
- Abstract要約: プロヴァンスグラフ解析は侵入検知に重要な役割を果たし、特にAPT(Advanced Persistent Threats)に対して重要である。
ProVSYNは,3相パイプラインを通じてプロファイランスグラフを合成する自動フレームワークである。
ProVSYNは高忠実度グラフを生成し,有効データ拡張による検出性能の向上を図っている。
- 参考スコア(独自算出の注目度): 10.160654114774513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Provenance graph analysis plays a vital role in intrusion detection, particularly against Advanced Persistent Threats (APTs), by exposing complex attack patterns. While recent systems combine graph neural networks (GNNs) with natural language processing (NLP) to capture structural and semantic features, their effectiveness is limited by class imbalance in real-world data. To address this, we introduce PROVSYN, an automated framework that synthesizes provenance graphs through a three-phase pipeline: (1) heterogeneous graph structure synthesis with structural-semantic modeling, (2) rule-based topological refinement, and (3) context-aware textual attribute synthesis using large language models (LLMs). PROVSYN includes a comprehensive evaluation framework that integrates structural, textual, temporal, and embedding-based metrics, along with a semantic validation mechanism to assess the correctness of generated attack patterns and system behaviors. To demonstrate practical utility, we use the synthetic graphs to augment training datasets for downstream APT detection models. Experimental results show that PROVSYN produces high-fidelity graphs and improves detection performance through effective data augmentation.
- Abstract(参考訳): 特にAPT(Advanced Persistent Threats)に対して、複雑な攻撃パターンを露呈することで、侵入検知に重要な役割を果たす。
最近のシステムは、グラフニューラルネットワーク(GNN)と自然言語処理(NLP)を組み合わせて構造的特徴と意味的特徴を捉えるが、それらの効果は実世界のデータにおけるクラス不均衡によって制限される。
そこで我々は,(1)構造意味モデリングを用いた不均一なグラフ構造合成,(2)規則に基づくトポロジ的洗練,(3)大規模言語モデル(LLM)を用いた文脈認識型テキスト属性合成という,3段階のパイプラインを通じてプロファイナンスグラフを自動生成するフレームワーク PROVSYNを紹介した。
PROVSYNには、構造的、テキスト的、時間的、埋め込みベースのメトリクスを統合する包括的な評価フレームワークと、生成された攻撃パターンとシステム動作の正確性を評価するセマンティック検証メカニズムが含まれている。
実用性を示すために、合成グラフを用いて、下流のAPT検出モデルのためのトレーニングデータセットを増強する。
実験結果から, ProVSYNは高忠実度グラフを生成し, 有効データ拡張による検出性能の向上を図っている。
関連論文リスト
- Persistent Homology-induced Graph Ensembles for Time Series Regressions [1.5728609542259502]
永続ホモロジーフィルタに基づくグラフニューラルネットワークのアンサンブルを作成する。
アンサンブルは、注目に基づくルーティング機構を介して、個々の学習者からの信号を集約する。
地震活動予測と交通予測に関する4つの異なる実世界の実験は、我々のアプローチが一本のグラフベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-03-18T13:22:52Z) - GraphSeqLM: A Unified Graph Language Framework for Omic Graph Learning [20.906136206438102]
Graph Neural Networks (GNN)は、大規模シグナル伝達経路とタンパク質-タンパク質相互作用ネットワークを解析するための堅牢なフレームワークを提供する。
生物シークエンスを組み込んだGNNを強化するフレームワークであるグラフシーケンス言語モデル(GraphSeqLM)を提案する。
論文 参考訳(メタデータ) (2024-12-20T11:05:26Z) - S$^2$GSL: Incorporating Segment to Syntactic Enhanced Graph Structure Learning for Aspect-based Sentiment Analysis [19.740223755240734]
ABSAのための構文強化グラフ構造学習にセグメンテーションを取り入れた2$GSLを提案する。
S$2$GSLはセグメント対応セマンティックグラフ学習と構文ベースの潜在グラフ学習を備えている。
論文 参考訳(メタデータ) (2024-06-05T03:44:35Z) - EasyDGL: Encode, Train and Interpret for Continuous-time Dynamic Graph Learning [92.71579608528907]
本稿では,3つのモジュールから構成される使い勝手の良いパイプライン(EasyDGL)を設計することを目的とする。
EasyDGLは、進化するグラフデータからモデルが学習する周波数コンテンツの予測力を効果的に定量化することができる。
論文 参考訳(メタデータ) (2023-03-22T06:35:08Z) - Heterogeneous Graph Neural Networks using Self-supervised Reciprocally
Contrastive Learning [102.9138736545956]
不均一グラフニューラルネットワーク(HGNN)は異種グラフのモデリングと解析において非常に一般的な手法である。
我々は,ノード属性とグラフトポロジの各ガイダンスに関する2つの視点を取り入れた,新規で頑健なヘテロジニアスグラフコントラスト学習手法であるHGCLを初めて開発する。
この新しいアプローチでは,属性とトポロジに関連情報を別々にマイニングする手法として,異なるが最も適した属性とトポロジの融合機構を2つの視点に適用する。
論文 参考訳(メタデータ) (2022-04-30T12:57:02Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - Structural Landmarking and Interaction Modelling: on Resolution Dilemmas
in Graph Classification [50.83222170524406]
解法ジレンマの統一概念に基づくグラフ分類における本質的難易度の研究」
構造ランドマークと相互作用モデリングのためのインダクティブニューラルネットワークモデルSLIM'を提案する。
論文 参考訳(メタデータ) (2020-06-29T01:01:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。