論文の概要: Synthesizing Diverse Network Flow Datasets with Scalable Dynamic Multigraph Generation
- arxiv url: http://arxiv.org/abs/2505.07777v1
- Date: Mon, 12 May 2025 17:26:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.518572
- Title: Synthesizing Diverse Network Flow Datasets with Scalable Dynamic Multigraph Generation
- Title(参考訳): スケーラブルな動的マルチグラフ生成による分散ネットワークフローデータセットの合成
- Authors: Arya Grayeli, Vipin Swarup, Steven E. Noel,
- Abstract要約: 本稿では,高忠実度合成ネットワークフローデータセットを生成する機械学習モデルを提案する。
本研究では,従来の大規模グラフ生成手法よりも精度が向上したことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Obtaining real-world network datasets is often challenging because of privacy, security, and computational constraints. In the absence of such datasets, graph generative models become essential tools for creating synthetic datasets. In this paper, we introduce a novel machine learning model for generating high-fidelity synthetic network flow datasets that are representative of real-world networks. Our approach involves the generation of dynamic multigraphs using a stochastic Kronecker graph generator for structure generation and a tabular generative adversarial network for feature generation. We further employ an XGBoost (eXtreme Gradient Boosting) model for graph alignment, ensuring accurate overlay of features onto the generated graph structure. We evaluate our model using new metrics that assess both the accuracy and diversity of the synthetic graphs. Our results demonstrate improvements in accuracy over previous large-scale graph generation methods while maintaining similar efficiency. We also explore the trade-off between accuracy and diversity in synthetic graph dataset creation, a topic not extensively covered in related works. Our contributions include the synthesis and evaluation of large real-world netflow datasets and the definition of new metrics for evaluating synthetic graph generative models.
- Abstract(参考訳): 現実のネットワークデータセットの取得は、プライバシ、セキュリティ、計算上の制約のため、しばしば困難である。
このようなデータセットがないと、グラフ生成モデルは合成データセットを作成するのに不可欠なツールとなる。
本稿では,実世界のネットワークを代表する高忠実な合成ネットワークフローデータセットを生成する機械学習モデルを提案する。
提案手法は,構造生成のための確率的クロネッカーグラフ生成器と特徴生成のための表生成対向ネットワークを用いた動的マルチグラフの生成を含む。
さらに、グラフアライメントにXGBoost(eXtreme Gradient Boosting)モデルを使用し、生成されたグラフ構造に対する機能の正確なオーバーレイを保証する。
合成グラフの精度と多様性の両方を評価する新しい指標を用いて,本モデルを評価する。
その結果,従来の大規模グラフ生成手法よりも精度が向上し,類似の効率性を維持した。
また、合成グラフデータセット作成における精度と多様性のトレードオフについても検討する。
コントリビューションには、大規模な実世界のネットフローデータセットの合成と評価、および合成グラフ生成モデルを評価するための新しいメトリクスの定義が含まれる。
関連論文リスト
- Revisiting Graph Neural Networks on Graph-level Tasks: Comprehensive Experiments, Analysis, and Improvements [54.006506479865344]
グラフレベルグラフニューラルネットワーク(GNN)のための統一評価フレームワークを提案する。
このフレームワークは、さまざまなデータセットにわたるGNNを評価するための標準化された設定を提供する。
また,表現性の向上と一般化機能を備えた新しいGNNモデルを提案する。
論文 参考訳(メタデータ) (2025-01-01T08:48:53Z) - LLM-Based Multi-Agent Systems are Scalable Graph Generative Models [73.28294528654885]
GraphAgent-Generator (GAG) は動的でテキスト対応のソーシャルグラフ生成のための新しいシミュレーションベースのフレームワークである。
GAGは、ゼロショットソーシャルグラフ生成のための時間ノードとエッジ生成プロセスをシミュレートする。
得られたグラフは7つの主要なマクロ的ネットワーク特性に付着し、微視的グラフ構造測定において11%の改善が達成される。
論文 参考訳(メタデータ) (2024-10-13T12:57:08Z) - Data Augmentation in Graph Neural Networks: The Role of Generated Synthetic Graphs [0.24999074238880487]
本研究では,データ拡張のための生成グラフについて検討する。
生成したグラフを実グラフと組み合わせることのパフォーマンスを比較し、生成したグラフの量が異なることがグラフ分類タスクに与える影響を調べる。
その結果,グラフデータの拡張,一貫性のあるラベルの確保,分類性能の向上など,新たなアプローチが導入された。
論文 参考訳(メタデータ) (2024-07-20T06:05:26Z) - SynHING: Synthetic Heterogeneous Information Network Generation for Graph Learning and Explanation [31.89877722246351]
合成不均一情報ネットワーク生成のための新しいフレームワークであるSynHingを紹介する。
SynHingは、ターゲットHINの主要なモチーフを体系的に識別し、クラスタ内およびクラスタ間マージモジュールによるボトムアップ生成プロセスを使用する。
GNN説明器モデルを評価するための基礎的なモチーフを提供し、説明可能な合成HIN生成のための新しい標準を設定する。
論文 参考訳(メタデータ) (2024-01-07T04:43:36Z) - GraphMaker: Can Diffusion Models Generate Large Attributed Graphs? [7.330479039715941]
ノード属性を持つ大規模グラフは、様々な現実世界のアプリケーションでますます一般的になっている。
従来のグラフ生成法は、これらの複雑な構造を扱う能力に制限がある。
本稿では,大きな属性グラフを生成するために特別に設計された新しい拡散モデルであるGraphMakerを紹介する。
論文 参考訳(メタデータ) (2023-10-20T22:12:46Z) - A Framework for Large Scale Synthetic Graph Dataset Generation [2.248608623448951]
この研究は、データセットをプロダクションサイズのグラフにスケールするスケーラブルな合成グラフ生成ツールを提案する。
このツールは、研究者にリリース可能なプロプライエタリなデータセットから、一連のパラメトリックモデルを学ぶ。
一連のデータセットにまたがるフレームワークの一般化可能性を示す。
論文 参考訳(メタデータ) (2022-10-04T22:41:33Z) - Dynamic Graph Message Passing Networks for Visual Recognition [112.49513303433606]
長距離依存のモデリングは、コンピュータビジョンにおけるシーン理解タスクに不可欠である。
完全連結グラフはそのようなモデリングには有益であるが、計算オーバーヘッドは禁じられている。
本稿では,計算複雑性を大幅に低減する動的グラフメッセージパッシングネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-20T14:41:37Z) - Auto-decoding Graphs [91.3755431537592]
生成モデルは、潜在コードからグラフを合成することを学ぶ自動デコーダである。
グラフは、おそらく接続パターンを特定するためにトレーニングされた自己アテンションモジュールを使用して合成される。
論文 参考訳(メタデータ) (2020-06-04T14:23:01Z) - Adaptive Graph Auto-Encoder for General Data Clustering [90.8576971748142]
グラフベースのクラスタリングは、クラスタリング領域において重要な役割を果たす。
グラフ畳み込みニューラルネットワークに関する最近の研究は、グラフ型データにおいて驚くべき成功を収めている。
本稿では,グラフの生成的視点に応じて適応的にグラフを構成する汎用データクラスタリングのためのグラフ自動エンコーダを提案する。
論文 参考訳(メタデータ) (2020-02-20T10:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。