論文の概要: A Framework for Large Scale Synthetic Graph Dataset Generation
- arxiv url: http://arxiv.org/abs/2210.01944v2
- Date: Thu, 6 Oct 2022 15:17:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 14:58:01.663084
- Title: A Framework for Large Scale Synthetic Graph Dataset Generation
- Title(参考訳): 大規模合成グラフデータセット生成のためのフレームワーク
- Authors: Sajad Darabi, Piotr Bigaj, Dawid Majchrowski, Pawel Morkisz, Alex
Fit-Florea
- Abstract要約: 利用可能なグラフ構造化データセットは限られている。
新しいアルゴリズムとモデルは、同様の特性を持つ類似データセットにわたってベンチマークされる。
実世界のグラフのオリジナルのデータ分布を模倣するスケーラブルな合成グラフ生成ツールを提案する。
- 参考スコア(独自算出の注目度): 1.9686770963118383
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently there has been increasing interest in developing and deploying deep
graph learning algorithms for many graph analysis tasks such as node and edge
classification, link prediction, and clustering with numerous practical
applications such as fraud detection, drug discovery, or recommender systems.
Allbeit there is a limited number of publicly available graph-structured
datasets, most of which are tiny compared to production-sized applications with
trillions of edges and billions of nodes. Further, new algorithms and models
are benchmarked across similar datasets with similar properties. In this work,
we tackle this shortcoming by proposing a scalable synthetic graph generation
tool that can mimic the original data distribution of real-world graphs and
scale them to arbitrary sizes. This tool can be used then to learn a set of
parametric models from proprietary datasets that can subsequently be released
to researchers to study various graph methods on the synthetic data increasing
prototype development and novel applications. Finally, the performance of the
graph learning algorithms depends not only on the size but also on the
dataset's structure. We show how our framework generalizes across a set of
datasets, mimicking both structural and feature distributions as well as its
scalability across varying dataset sizes.
- Abstract(参考訳): 近年,ノードやエッジの分類,リンクの予測,クラスタリングといった多くのグラフ解析タスクに対して,不正検出や薬物発見,レコメンダシステムなど,多数の実用的な応用によるディープグラフ学習アルゴリズムの開発や展開への関心が高まっている。
一般に利用可能なグラフ構造データセットは限られており、そのほとんどが数十兆のエッジと数十億のノードを持つ実運用規模のアプリケーションと比べて小さなものだ。
さらに、同様の特性を持つ類似データセット間で、新しいアルゴリズムとモデルがベンチマークされる。
本研究では,実世界のグラフの本来のデータ分布を模倣し,任意のサイズにスケール可能な,スケーラブルな合成グラフ生成ツールを提案する。
このツールは、プロプライエタリなデータセットからパラメトリックモデルのセットを学習するために使用され、その後研究者にリリースされ、プロトタイプ開発と新規アプリケーションの増加する合成データに関する様々なグラフメソッドを研究することができる。
最後に、グラフ学習アルゴリズムの性能は、サイズだけでなく、データセットの構造にも依存する。
我々のフレームワークがデータセットの集合をまたいでどのように一般化し、構造的および特徴的分布と、さまざまなデータセットサイズにまたがるスケーラビリティの両方を模倣するかを示します。
関連論文リスト
- GraphStorm: all-in-one graph machine learning framework for industry applications [75.23076561638348]
GraphStormはスケーラブルなグラフ構築、グラフモデルのトレーニング、推論のためのエンドツーエンドソリューションである。
GraphStormのすべてのコンポーネントは数十億のノードを持つグラフ上で動作でき、コードを変更することなく、モデルのトレーニングと推論を異なるハードウェアにスケールすることができる。
GraphStormは、2023年5月にリリースされて以来、数十億以上の業界アプリケーションで使われ、デプロイされてきた。
論文 参考訳(メタデータ) (2024-06-10T04:56:16Z) - Graph data augmentation with Gromow-Wasserstein Barycenters [0.0]
非ユークリッド空間で動作するグラフに対する新たな拡張戦略が提案されている。
非ユークリッド距離、特にグロモウ=ワッサーシュタイン距離は、グラフンのより良い近似をもたらす。
このフレームワークはまた、異なるグラフオン推定アプローチを検証する手段を提供する。
論文 参考訳(メタデータ) (2024-04-12T10:22:55Z) - GraphMaker: Can Diffusion Models Generate Large Attributed Graphs? [7.330479039715941]
ノード属性を持つ大規模グラフは、様々な現実世界のアプリケーションでますます一般的になっている。
従来のグラフ生成法は、これらの複雑な構造を扱う能力に制限がある。
本稿では,大きな属性グラフを生成するために特別に設計された新しい拡散モデルであるGraphMakerを紹介する。
論文 参考訳(メタデータ) (2023-10-20T22:12:46Z) - Sparsity exploitation via discovering graphical models in multi-variate
time-series forecasting [1.2762298148425795]
本稿では,グラフ生成モジュールとGNN予測モジュールを含む分離学習手法を提案する。
まず、Graphical Lasso(またはGraphLASSO)を使用して、データから空間パターンを直接利用してグラフ構造を構築します。
次に、これらのグラフ構造と入力データをGCRN(Graph Convolutional Recurrent Network)に適合させて予測モデルをトレーニングする。
論文 参考訳(メタデータ) (2023-06-29T16:48:00Z) - GSHOT: Few-shot Generative Modeling of Labeled Graphs [44.94210194611249]
少数ショットグラフ生成モデリングの未探索パラダイムについて紹介する。
グラフ生成モデリングのためのフレームワークであるGSHOTを開発した。
GSHOTは、セルフペースの微調整を通じて、目に見えないグラフデータセットに適応する。
論文 参考訳(メタデータ) (2023-06-06T08:03:18Z) - Bures-Wasserstein Means of Graphs [60.42414991820453]
本研究では,スムーズなグラフ信号分布の空間への埋め込みを通じて,グラフ平均を定義する新しいフレームワークを提案する。
この埋め込み空間において平均を求めることにより、構造情報を保存する平均グラフを復元することができる。
我々は,新しいグラフの意味の存在と特異性を確立し,それを計算するための反復アルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-05-31T11:04:53Z) - Graph Generative Model for Benchmarking Graph Neural Networks [73.11514658000547]
本稿では,プライバシ制御により実世界のグラフの分布を学習し,再現する新しいグラフ生成モデルを提案する。
我々のモデルは、GNNモデルのベンチマークに効果的に使用できる大規模な実世界のグラフの、プライバシ制御された合成代用をうまく生成することができる。
論文 参考訳(メタデータ) (2022-07-10T06:42:02Z) - A Robust Stacking Framework for Training Deep Graph Models with
Multifaceted Node Features [61.92791503017341]
数値ノード特徴とグラフ構造を入力とするグラフニューラルネットワーク(GNN)は,グラフデータを用いた各種教師付き学習タスクにおいて,優れた性能を示した。
IID(non-graph)データをGNNに簡単に組み込むことはできない。
本稿では、グラフ認識の伝播をIDデータに意図した任意のモデルで融合するロバストな積み重ねフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-16T22:46:33Z) - Condensing Graphs via One-Step Gradient Matching [50.07587238142548]
ネットワーク重みを訓練せずに1ステップのみの勾配マッチングを行う1ステップ勾配マッチング方式を提案する。
我々の理論的分析は、この戦略が実際のグラフの分類損失を減少させる合成グラフを生成することができることを示している。
特に、元のパフォーマンスの最大98%を近似しながら、データセットサイズを90%削減することが可能です。
論文 参考訳(メタデータ) (2022-06-15T18:20:01Z) - Synthetic Graph Generation to Benchmark Graph Learning [7.914804101579097]
グラフ学習アルゴリズムは多くのグラフ解析タスクで最先端のパフォーマンスを達成した。
1つの理由は、グラフ学習アルゴリズムのパフォーマンスをベンチマークするために実際に使用されるデータセットが極めて少ないためである。
本稿では,合成グラフの生成と,制御シナリオにおけるグラフ学習アルゴリズムの挙動について検討する。
論文 参考訳(メタデータ) (2022-04-04T10:48:32Z) - Adaptive Graph Auto-Encoder for General Data Clustering [90.8576971748142]
グラフベースのクラスタリングは、クラスタリング領域において重要な役割を果たす。
グラフ畳み込みニューラルネットワークに関する最近の研究は、グラフ型データにおいて驚くべき成功を収めている。
本稿では,グラフの生成的視点に応じて適応的にグラフを構成する汎用データクラスタリングのためのグラフ自動エンコーダを提案する。
論文 参考訳(メタデータ) (2020-02-20T10:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。