論文の概要: PROVCREATOR: Synthesizing Complex Heterogenous Graphs with Node and Edge Attributes
- arxiv url: http://arxiv.org/abs/2507.20967v1
- Date: Mon, 28 Jul 2025 16:22:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:58.203756
- Title: PROVCREATOR: Synthesizing Complex Heterogenous Graphs with Node and Edge Attributes
- Title(参考訳): PROVCREATOR: ノードとエッジ属性による複素ヘテロジニアスグラフの合成
- Authors: Tianhao Wang, Simon Klancher, Kunal Mukherjee, Josh Wiedemeier, Feng Chen, Murat Kantarcioglu, Kangkook Jee,
- Abstract要約: 複素異種グラフのための合成グラフフレームワークであるProvCreatorを紹介する。
ProvCreatorはシーケンス生成タスクとしてグラフ合成を定式化する。
汎用的なグラフからシーケンスへのエンコーダ・デコーダを備え、エンドツーエンドで学習可能なグラフ生成をサポートする。
- 参考スコア(独自算出の注目度): 14.078355036170155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rise of graph-structured data has driven interest in graph learning and synthetic data generation. While successful in text and image domains, synthetic graph generation remains challenging -- especially for real-world graphs with complex, heterogeneous schemas. Existing research has focused mostly on homogeneous structures with simple attributes, limiting their usefulness and relevance for application domains requiring semantic fidelity. In this research, we introduce ProvCreator, a synthetic graph framework designed for complex heterogeneous graphs with high-dimensional node and edge attributes. ProvCreator formulates graph synthesis as a sequence generation task, enabling the use of transformer-based large language models. It features a versatile graph-to-sequence encoder-decoder that 1. losslessly encodes graph structure and attributes, 2. efficiently compresses large graphs for contextual modeling, and 3. supports end-to-end, learnable graph generation. To validate our research, we evaluate ProvCreator on two challenging domains: system provenance graphs in cybersecurity and knowledge graphs from IntelliGraph Benchmark Dataset. In both cases, ProvCreator captures intricate dependencies between structure and semantics, enabling the generation of realistic and privacy-aware synthetic datasets.
- Abstract(参考訳): グラフ構造化データの台頭は、グラフ学習と合成データ生成に関心を惹き付けている。
テキストや画像ドメインで成功したが、合成グラフ生成は、特に複雑で異質なスキーマを持つ現実世界のグラフでは、依然として困難である。
既存の研究は主に単純な属性を持つ均質構造に焦点を合わせており、意味的忠実さを必要とするアプリケーションドメインの有用性と妥当性を制限している。
本研究では,高次元ノードおよびエッジ属性を持つ複素異種グラフのための合成グラフフレームワークであるProvCreatorを紹介する。
ProvCreatorはグラフ合成をシーケンス生成タスクとして定式化し、トランスフォーマーベースの大規模言語モデルの使用を可能にする。
汎用的なグラフ・ツー・シーケンス・エンコーダ・デコーダを備えている。
1.無益にグラフ構造と属性をエンコードする。
2. 文脈モデリングのための大きなグラフを効率よく圧縮し、
エンドツーエンドで学習可能なグラフ生成をサポートする。
我々の研究を検証するため、IntelliGraph Benchmark Datasetのサイバーセキュリティにおけるシステム証明グラフと知識グラフの2つの挑戦的な領域でProvCreatorを評価した。
どちらの場合も、ProvCreatorは構造とセマンティクスの間の複雑な依存関係をキャプチャし、現実的でプライバシに配慮した合成データセットの生成を可能にする。
関連論文リスト
- Data Augmentation in Graph Neural Networks: The Role of Generated Synthetic Graphs [0.24999074238880487]
本研究では,データ拡張のための生成グラフについて検討する。
生成したグラフを実グラフと組み合わせることのパフォーマンスを比較し、生成したグラフの量が異なることがグラフ分類タスクに与える影響を調べる。
その結果,グラフデータの拡張,一貫性のあるラベルの確保,分類性能の向上など,新たなアプローチが導入された。
論文 参考訳(メタデータ) (2024-07-20T06:05:26Z) - GraphMaker: Can Diffusion Models Generate Large Attributed Graphs? [7.330479039715941]
ノード属性を持つ大規模グラフは、様々な現実世界のアプリケーションでますます一般的になっている。
従来のグラフ生成法は、これらの複雑な構造を扱う能力に制限がある。
本稿では,大きな属性グラフを生成するために特別に設計された新しい拡散モデルであるGraphMakerを紹介する。
論文 参考訳(メタデータ) (2023-10-20T22:12:46Z) - Structure-free Graph Condensation: From Large-scale Graphs to Condensed
Graph-free Data [91.27527985415007]
既存のグラフ凝縮法は、凝縮グラフ内のノードと構造の合同最適化に依存している。
我々は、大規模グラフを小さなグラフノード集合に蒸留する、SFGCと呼ばれる新しい構造自由グラフ凝縮パラダイムを提唱する。
論文 参考訳(メタデータ) (2023-06-05T07:53:52Z) - Heterogeneous Graph Neural Networks using Self-supervised Reciprocally
Contrastive Learning [102.9138736545956]
不均一グラフニューラルネットワーク(HGNN)は異種グラフのモデリングと解析において非常に一般的な手法である。
我々は,ノード属性とグラフトポロジの各ガイダンスに関する2つの視点を取り入れた,新規で頑健なヘテロジニアスグラフコントラスト学習手法であるHGCLを初めて開発する。
この新しいアプローチでは,属性とトポロジに関連情報を別々にマイニングする手法として,異なるが最も適した属性とトポロジの融合機構を2つの視点に適用する。
論文 参考訳(メタデータ) (2022-04-30T12:57:02Z) - GoGNN: Graph of Graphs Neural Network for Predicting Structured Entity
Interactions [70.9481395807354]
本稿では,構造化エンティティグラフとエンティティ相互作用グラフの両方の特徴を階層的に抽出するグラフ・オブ・グラフニューラルネットワーク(GoGNN)を提案する。
GoGNNは、2つの代表的な構造化エンティティ相互作用予測タスクにおいて最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-05-12T03:46:15Z) - Adaptive Graph Auto-Encoder for General Data Clustering [90.8576971748142]
グラフベースのクラスタリングは、クラスタリング領域において重要な役割を果たす。
グラフ畳み込みニューラルネットワークに関する最近の研究は、グラフ型データにおいて驚くべき成功を収めている。
本稿では,グラフの生成的視点に応じて適応的にグラフを構成する汎用データクラスタリングのためのグラフ自動エンコーダを提案する。
論文 参考訳(メタデータ) (2020-02-20T10:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。