論文の概要: PROVSYN: Synthesizing Provenance Graphs for Data Augmentation in Intrusion Detection Systems
- arxiv url: http://arxiv.org/abs/2506.06226v1
- Date: Fri, 06 Jun 2025 16:41:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.556397
- Title: PROVSYN: Synthesizing Provenance Graphs for Data Augmentation in Intrusion Detection Systems
- Title(参考訳): PROVSYN:侵入検知システムにおけるデータ拡張のための前処理グラフの合成
- Authors: Yi Huang, Wajih UI Hassan, Yao Guo, Xiangqun Chen, Ding Li,
- Abstract要約: プロヴァンスグラフ解析は侵入検知に重要な役割を果たし、特にAPT(Advanced Persistent Threats)に対して重要である。
ProVSYNは,3相パイプラインを通じてプロファイランスグラフを合成する自動フレームワークである。
ProVSYNは高忠実度グラフを生成し,有効データ拡張による検出性能の向上を図っている。
- 参考スコア(独自算出の注目度): 10.160654114774513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Provenance graph analysis plays a vital role in intrusion detection, particularly against Advanced Persistent Threats (APTs), by exposing complex attack patterns. While recent systems combine graph neural networks (GNNs) with natural language processing (NLP) to capture structural and semantic features, their effectiveness is limited by class imbalance in real-world data. To address this, we introduce PROVSYN, an automated framework that synthesizes provenance graphs through a three-phase pipeline: (1) heterogeneous graph structure synthesis with structural-semantic modeling, (2) rule-based topological refinement, and (3) context-aware textual attribute synthesis using large language models (LLMs). PROVSYN includes a comprehensive evaluation framework that integrates structural, textual, temporal, and embedding-based metrics, along with a semantic validation mechanism to assess the correctness of generated attack patterns and system behaviors. To demonstrate practical utility, we use the synthetic graphs to augment training datasets for downstream APT detection models. Experimental results show that PROVSYN produces high-fidelity graphs and improves detection performance through effective data augmentation.
- Abstract(参考訳): 特にAPT(Advanced Persistent Threats)に対して、複雑な攻撃パターンを露呈することで、侵入検知に重要な役割を果たす。
最近のシステムは、グラフニューラルネットワーク(GNN)と自然言語処理(NLP)を組み合わせて構造的特徴と意味的特徴を捉えるが、それらの効果は実世界のデータにおけるクラス不均衡によって制限される。
そこで我々は,(1)構造意味モデリングを用いた不均一なグラフ構造合成,(2)規則に基づくトポロジ的洗練,(3)大規模言語モデル(LLM)を用いた文脈認識型テキスト属性合成という,3段階のパイプラインを通じてプロファイナンスグラフを自動生成するフレームワーク PROVSYNを紹介した。
PROVSYNには、構造的、テキスト的、時間的、埋め込みベースのメトリクスを統合する包括的な評価フレームワークと、生成された攻撃パターンとシステム動作の正確性を評価するセマンティック検証メカニズムが含まれている。
実用性を示すために、合成グラフを用いて、下流のAPT検出モデルのためのトレーニングデータセットを増強する。
実験結果から, ProVSYNは高忠実度グラフを生成し, 有効データ拡張による検出性能の向上を図っている。
関連論文リスト
- AnomalyGen: An Automated Semantic Log Sequence Generation Framework with LLM for Anomaly Detection [25.83270938475311]
AnomalyGenは、異常検出用に特別に設計された最初の自動ログ合成フレームワークである。
本フレームワークは,プログラム解析とChain-of-Thought推論(CoT推論)を統合し,反復的なログ生成と異常アノテーションを実現する。
合成ログでベンチマークデータセットを増大させると、最大F1スコアの3.7%の改善が観測される。
論文 参考訳(メタデータ) (2025-04-16T16:54:38Z) - Multi-Modality Representation Learning for Antibody-Antigen Interactions Prediction [6.681379194115459]
グラフアテンションネットワークを利用してグラフレベルの構造特徴を照らし、正規化適応グラフ畳み込みネットワークを用いて抗体間の配列関係を捕捉するAAI予測フレームワークであるMuLAAIPを提案する。
以上の結果から, MuLAAIP は現在の最先端手法よりも予測性能に優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-03-22T06:23:51Z) - Persistent Homology-induced Graph Ensembles for Time Series Regressions [1.5728609542259502]
永続ホモロジーフィルタに基づくグラフニューラルネットワークのアンサンブルを作成する。
アンサンブルは、注目に基づくルーティング機構を介して、個々の学習者からの信号を集約する。
地震活動予測と交通予測に関する4つの異なる実世界の実験は、我々のアプローチが一本のグラフベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-03-18T13:22:52Z) - GraphSeqLM: A Unified Graph Language Framework for Omic Graph Learning [20.906136206438102]
Graph Neural Networks (GNN)は、大規模シグナル伝達経路とタンパク質-タンパク質相互作用ネットワークを解析するための堅牢なフレームワークを提供する。
生物シークエンスを組み込んだGNNを強化するフレームワークであるグラフシーケンス言語モデル(GraphSeqLM)を提案する。
論文 参考訳(メタデータ) (2024-12-20T11:05:26Z) - Learning to Model Graph Structural Information on MLPs via Graph Structure Self-Contrasting [50.181824673039436]
本稿では,グラフ構造情報をメッセージパッシングなしで学習するグラフ構造自己コントラスト(GSSC)フレームワークを提案する。
提案するフレームワークは,構造情報を事前知識として暗黙的にのみ組み込む,MLP(Multi-Layer Perceptrons)に基づいている。
これはまず、近傍の潜在的非形式的あるいはノイズの多いエッジを取り除くために構造的スペーシングを適用し、その後、スペーシングされた近傍で構造的自己コントラストを行い、ロバストなノード表現を学ぶ。
論文 参考訳(メタデータ) (2024-09-09T12:56:02Z) - S$^2$GSL: Incorporating Segment to Syntactic Enhanced Graph Structure Learning for Aspect-based Sentiment Analysis [19.740223755240734]
ABSAのための構文強化グラフ構造学習にセグメンテーションを取り入れた2$GSLを提案する。
S$2$GSLはセグメント対応セマンティックグラフ学習と構文ベースの潜在グラフ学習を備えている。
論文 参考訳(メタデータ) (2024-06-05T03:44:35Z) - EasyDGL: Encode, Train and Interpret for Continuous-time Dynamic Graph Learning [92.71579608528907]
本稿では,3つのモジュールから構成される使い勝手の良いパイプライン(EasyDGL)を設計することを目的とする。
EasyDGLは、進化するグラフデータからモデルが学習する周波数コンテンツの予測力を効果的に定量化することができる。
論文 参考訳(メタデータ) (2023-03-22T06:35:08Z) - Energy-based Out-of-Distribution Detection for Graph Neural Networks [76.0242218180483]
我々は,GNNSafeと呼ばれるグラフ上での学習のための,シンプルで強力で効率的なOOD検出モデルを提案する。
GNNSafeは、最先端技術に対するAUROCの改善を最大17.0%で達成しており、そのような未開発領域では単純だが強力なベースラインとして機能する可能性がある。
論文 参考訳(メタデータ) (2023-02-06T16:38:43Z) - Heterogeneous Graph Neural Networks using Self-supervised Reciprocally
Contrastive Learning [102.9138736545956]
不均一グラフニューラルネットワーク(HGNN)は異種グラフのモデリングと解析において非常に一般的な手法である。
我々は,ノード属性とグラフトポロジの各ガイダンスに関する2つの視点を取り入れた,新規で頑健なヘテロジニアスグラフコントラスト学習手法であるHGCLを初めて開発する。
この新しいアプローチでは,属性とトポロジに関連情報を別々にマイニングする手法として,異なるが最も適した属性とトポロジの融合機構を2つの視点に適用する。
論文 参考訳(メタデータ) (2022-04-30T12:57:02Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - Structural Landmarking and Interaction Modelling: on Resolution Dilemmas
in Graph Classification [50.83222170524406]
解法ジレンマの統一概念に基づくグラフ分類における本質的難易度の研究」
構造ランドマークと相互作用モデリングのためのインダクティブニューラルネットワークモデルSLIM'を提案する。
論文 参考訳(メタデータ) (2020-06-29T01:01:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。