Fugu-MT 論文翻訳(概要): A Framework for Large Scale Synthetic Graph Dataset Generation

論文の概要: A Framework for Large Scale Synthetic Graph Dataset Generation

arxiv url: http://arxiv.org/abs/2210.01944v4
Date: Thu, 5 Oct 2023 05:22:43 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-06 23:11:53.268897
Title: A Framework for Large Scale Synthetic Graph Dataset Generation
Title（参考訳）: 大規模合成グラフデータセット生成のためのフレームワーク
Authors: Sajad Darabi, Piotr Bigaj, Dawid Majchrowski, Artur Kasymov, Pawel Morkisz, Alex Fit-Florea
Abstract要約: この研究は、データセットをプロダクションサイズのグラフにスケールするスケーラブルな合成グラフ生成ツールを提案する。このツールは、研究者にリリース可能なプロプライエタリなデータセットから、一連のパラメトリックモデルを学ぶ。一連のデータセットにまたがるフレームワークの一般化可能性を示す。
参考スコア（独自算出の注目度）: 2.248608623448951
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recently there has been increasing interest in developing and deploying deep graph learning algorithms for many tasks, such as fraud detection and recommender systems. Albeit, there is a limited number of publicly available graph-structured datasets, most of which are tiny compared to production-sized applications or are limited in their application domain. This work tackles this shortcoming by proposing a scalable synthetic graph generation tool to scale the datasets to production-size graphs with trillions of edges and billions of nodes. The tool learns a series of parametric models from proprietary datasets that can be released to researchers to study various graph methods on the synthetic data increasing prototype development and novel applications. We demonstrate the generalizability of the framework across a series of datasets, mimicking structural and feature distributions as well as the ability to scale them across varying sizes demonstrating their usefulness for benchmarking and model development. Code can be found on https://github.com/NVIDIA/DeepLearningExamples/tree/master/Tools/DGLPyTorch/SyntheticGraphGeneration .
Abstract（参考訳）: 近年,不正検出やレコメンダシステムなど,多くのタスクにおいて,ディープグラフ学習アルゴリズムの開発とデプロイに対する関心が高まっている。しかし、公開可能なグラフ構造化データセットの数は限られており、そのほとんどは本番サイズのアプリケーションに比べて小さいか、あるいはアプリケーションドメインに限られている。この作業は、数十兆のエッジと数十億のノードを持つ実運用規模のグラフにデータセットをスケールするためのスケーラブルな合成グラフ生成ツールを提案することで、この欠点に対処する。このツールは、プロプライエタリなデータセットから一連のパラメトリックモデルを学習し、プロトタイプ開発と新規アプリケーションの増加する合成データに関する様々なグラフ手法を研究するために研究者にリリースすることができる。一連のデータセットにまたがるフレームワークの一般化性を実証し、構造的および特徴分布を模倣するとともに、ベンチマークやモデル開発に有用であることを示す様々なサイズに拡張する能力を示す。コードはhttps://github.com/NVIDIA/DeepLearningExamples/tree/master/Tools/DGLPyTorch/SyntheticGraphGeneration で見ることができる。

関連論文リスト

Revisiting Graph Neural Networks on Graph-level Tasks: Comprehensive Experiments, Analysis, and Improvements [54.006506479865344]
グラフレベルグラフニューラルネットワーク(GNN)のための統一評価フレームワークを提案する。このフレームワークは、さまざまなデータセットにわたるGNNを評価するための標準化された設定を提供する。また,表現性の向上と一般化機能を備えた新しいGNNモデルを提案する。
論文参考訳（メタデータ） (2025-01-01T08:48:53Z)
GraphStorm: all-in-one graph machine learning framework for industry applications [75.23076561638348]
GraphStormはスケーラブルなグラフ構築、グラフモデルのトレーニング、推論のためのエンドツーエンドソリューションである。 GraphStormのすべてのコンポーネントは数十億のノードを持つグラフ上で動作でき、コードを変更することなく、モデルのトレーニングと推論を異なるハードウェアにスケールすることができる。 GraphStormは、2023年5月にリリースされて以来、数十億以上の業界アプリケーションで使われ、デプロイされてきた。
論文参考訳（メタデータ） (2024-06-10T04:56:16Z)
Graph data augmentation with Gromow-Wasserstein Barycenters [0.0]
非ユークリッド空間で動作するグラフに対する新たな拡張戦略が提案されている。非ユークリッド距離、特にグロモウ=ワッサーシュタイン距離は、グラフンのより良い近似をもたらす。このフレームワークはまた、異なるグラフオン推定アプローチを検証する手段を提供する。
論文参考訳（メタデータ） (2024-04-12T10:22:55Z)
GraphMaker: Can Diffusion Models Generate Large Attributed Graphs? [7.330479039715941]
ノード属性を持つ大規模グラフは、様々な現実世界のアプリケーションでますます一般的になっている。従来のグラフ生成法は、これらの複雑な構造を扱う能力に制限がある。本稿では,大きな属性グラフを生成するために特別に設計された新しい拡散モデルであるGraphMakerを紹介する。
論文参考訳（メタデータ） (2023-10-20T22:12:46Z)
Sparsity exploitation via discovering graphical models in multi-variate time-series forecasting [1.2762298148425795]
本稿では,グラフ生成モジュールとGNN予測モジュールを含む分離学習手法を提案する。まず、Graphical Lasso(またはGraphLASSO)を使用して、データから空間パターンを直接利用してグラフ構造を構築します。次に、これらのグラフ構造と入力データをGCRN(Graph Convolutional Recurrent Network)に適合させて予測モデルをトレーニングする。
論文参考訳（メタデータ） (2023-06-29T16:48:00Z)
GSHOT: Few-shot Generative Modeling of Labeled Graphs [44.94210194611249]
少数ショットグラフ生成モデリングの未探索パラダイムについて紹介する。グラフ生成モデリングのためのフレームワークであるGSHOTを開発した。 GSHOTは、セルフペースの微調整を通じて、目に見えないグラフデータセットに適応する。
論文参考訳（メタデータ） (2023-06-06T08:03:18Z)
Bures-Wasserstein Means of Graphs [60.42414991820453]
本研究では,スムーズなグラフ信号分布の空間への埋め込みを通じて,グラフ平均を定義する新しいフレームワークを提案する。この埋め込み空間において平均を求めることにより、構造情報を保存する平均グラフを復元することができる。我々は,新しいグラフの意味の存在と特異性を確立し,それを計算するための反復アルゴリズムを提供する。
論文参考訳（メタデータ） (2023-05-31T11:04:53Z)
Graph Generative Model for Benchmarking Graph Neural Networks [73.11514658000547]
本稿では,プライバシ制御により実世界のグラフの分布を学習し,再現する新しいグラフ生成モデルを提案する。我々のモデルは、GNNモデルのベンチマークに効果的に使用できる大規模な実世界のグラフの、プライバシ制御された合成代用をうまく生成することができる。
論文参考訳（メタデータ） (2022-07-10T06:42:02Z)
A Robust Stacking Framework for Training Deep Graph Models with Multifaceted Node Features [61.92791503017341]
数値ノード特徴とグラフ構造を入力とするグラフニューラルネットワーク(GNN)は,グラフデータを用いた各種教師付き学習タスクにおいて,優れた性能を示した。 IID(non-graph)データをGNNに簡単に組み込むことはできない。本稿では、グラフ認識の伝播をIDデータに意図した任意のモデルで融合するロバストな積み重ねフレームワークを提案する。
論文参考訳（メタデータ） (2022-06-16T22:46:33Z)
Condensing Graphs via One-Step Gradient Matching [50.07587238142548]
ネットワーク重みを訓練せずに1ステップのみの勾配マッチングを行う1ステップ勾配マッチング方式を提案する。我々の理論的分析は、この戦略が実際のグラフの分類損失を減少させる合成グラフを生成することができることを示している。特に、元のパフォーマンスの最大98%を近似しながら、データセットサイズを90%削減することが可能です。
論文参考訳（メタデータ） (2022-06-15T18:20:01Z)
Synthetic Graph Generation to Benchmark Graph Learning [7.914804101579097]
グラフ学習アルゴリズムは多くのグラフ解析タスクで最先端のパフォーマンスを達成した。 1つの理由は、グラフ学習アルゴリズムのパフォーマンスをベンチマークするために実際に使用されるデータセットが極めて少ないためである。本稿では,合成グラフの生成と,制御シナリオにおけるグラフ学習アルゴリズムの挙動について検討する。
論文参考訳（メタデータ） (2022-04-04T10:48:32Z)
Adaptive Graph Auto-Encoder for General Data Clustering [90.8576971748142]
グラフベースのクラスタリングは、クラスタリング領域において重要な役割を果たす。グラフ畳み込みニューラルネットワークに関する最近の研究は、グラフ型データにおいて驚くべき成功を収めている。本稿では,グラフの生成的視点に応じて適応的にグラフを構成する汎用データクラスタリングのためのグラフ自動エンコーダを提案する。
論文参考訳（メタデータ） (2020-02-20T10:11:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。