論文の概要: GraphWorld: Fake Graphs Bring Real Insights for GNNs
- arxiv url: http://arxiv.org/abs/2203.00112v1
- Date: Mon, 28 Feb 2022 22:00:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-03 03:08:58.051174
- Title: GraphWorld: Fake Graphs Bring Real Insights for GNNs
- Title(参考訳): GraphWorld: Fake GraphsがGNNのリアルインサイトを提供
- Authors: John Palowitch, Anton Tsitsulin, Brandon Mayer, Bryan Perozzi
- Abstract要約: GraphWorldは、ユーザが何百万もの統計的に多様なデータセットで効率的に世界を生成することを可能にする。
数百万のベンチマークデータセットに対する数万のGNNモデルの性能特性について,GraphWorldの実験結果から考察した。
- 参考スコア(独自算出の注目度): 4.856486822139849
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite advances in the field of Graph Neural Networks (GNNs), only a small
number (~5) of datasets are currently used to evaluate new models. This
continued reliance on a handful of datasets provides minimal insight into the
performance differences between models, and is especially challenging for
industrial practitioners who are likely to have datasets which look very
different from those used as academic benchmarks. In the course of our work on
GNN infrastructure and open-source software at Google, we have sought to
develop improved benchmarks that are robust, tunable, scalable,and
generalizable. In this work we introduce GraphWorld, a novel methodology and
system for benchmarking GNN models on an arbitrarily-large population of
synthetic graphs for any conceivable GNN task. GraphWorld allows a user to
efficiently generate a world with millions of statistically diverse datasets.
It is accessible, scalable, and easy to use. GraphWorld can be run on a single
machine without specialized hardware, or it can be easily scaled up to run on
arbitrary clusters or cloud frameworks. Using GraphWorld, a user has
fine-grained control over graph generator parameters, and can benchmark
arbitrary GNN models with built-in hyperparameter tuning. We present insights
from GraphWorld experiments regarding the performance characteristics of tens
of thousands of GNN models over millions of benchmark datasets. We further show
that GraphWorld efficiently explores regions of benchmark dataset space
uncovered by standard benchmarks, revealing comparisons between models that
have not been historically obtainable. Using GraphWorld, we also are able to
study in-detail the relationship between graph properties and task performance
metrics, which is nearly impossible with the classic collection of real-world
benchmarks.
- Abstract(参考訳): グラフニューラルネットワーク(GNN)の分野での進歩にもかかわらず、現在、新しいモデルを評価するために使用されるデータセットはわずか (~5) である。
この少数のデータセットへの継続的な依存は、モデル間のパフォーマンスの違いに関する最小限の洞察を与えます。
GoogleのGNNインフラストラクチャとオープンソースソフトウェアに関する作業の中で、堅牢でチューニング可能で、スケーラブルで、一般化可能な、改良されたベンチマークの開発を模索しました。
本研究では,任意のGNNタスクに対して,任意の集団の合成グラフ上でGNNモデルをベンチマークするための新しい方法論とシステムであるGraphWorldを紹介する。
graphworldは、何百万もの統計的に多様なデータセットを持つ世界を効率的に生成できる。
アクセス可能で、スケーラブルで、使いやすくなります。
GraphWorldは特別なハードウェアを使わずに単一のマシン上で実行できるし、任意のクラスタやクラウドフレームワーク上でも簡単にスケールアップできる。
GraphWorldを使用すると、ユーザはグラフジェネレータパラメータをきめ細かいコントロールができ、任意のGNNモデルをハイパーパラメータチューニングでベンチマークすることができる。
数百万のベンチマークデータセットに対する数万のGNNモデルの性能特性について,GraphWorldの実験結果から考察した。
さらに、GraphWorldは、標準ベンチマークによって発見されたベンチマークデータセット空間の領域を効率的に探索し、歴史的に取得できないモデルの比較を明らかにする。
GraphWorldを使用することで、グラフプロパティとタスクパフォーマンスメトリクスの関係を詳細に調査することが可能になります。
関連論文リスト
- DA-MoE: Addressing Depth-Sensitivity in Graph-Level Analysis through Mixture of Experts [70.21017141742763]
グラフニューラルネットワーク(GNN)は、グラフ構造化データを処理することで人気を集めている。
既存のメソッドは通常、固定数のGNNレイヤを使用して、すべてのグラフの表現を生成する。
本稿では,GNNに2つの改良を加えたDA-MoE法を提案する。
論文 参考訳(メタデータ) (2024-11-05T11:46:27Z) - GraphStorm: all-in-one graph machine learning framework for industry applications [75.23076561638348]
GraphStormはスケーラブルなグラフ構築、グラフモデルのトレーニング、推論のためのエンドツーエンドソリューションである。
GraphStormのすべてのコンポーネントは数十億のノードを持つグラフ上で動作でき、コードを変更することなく、モデルのトレーニングと推論を異なるハードウェアにスケールすることができる。
GraphStormは、2023年5月にリリースされて以来、数十億以上の業界アプリケーションで使われ、デプロイされてきた。
論文 参考訳(メタデータ) (2024-06-10T04:56:16Z) - Examining the Effects of Degree Distribution and Homophily in Graph
Learning Models [19.060710813929354]
GraphWorldは,GNNタスクのベンチマークを行うための,多種多様な合成グラフを生成するソリューションだ。
その成功にもかかわらず、SBMはグラフワールドが生み出すことのできるグラフ構造に根本的な制限を課した。
本研究では,2つの合成グラフ生成器がGraphWorldの評価を改善する方法について検討する。
論文 参考訳(メタデータ) (2023-07-17T22:35:46Z) - Graphtester: Exploring Theoretical Boundaries of GNNs on Graph Datasets [10.590698823137755]
我々は、さまざまなデータセット、タスク、スコアに対するGNNの理論的能力を総合的に分析するための、Graphtesterと呼ばれる新しいツールを提供する。
我々はGraphtesterを使用して40以上のグラフデータセットを分析し、レイヤ数に基づいて様々なGNNのパフォーマンスの上限を決定する。
このツールは、位置ノードエンコーディングを用いてグラフトランスフォーマーにも使用でき、それによってスコープを拡大できることを示す。
論文 参考訳(メタデータ) (2023-06-30T08:53:23Z) - Graph Generative Model for Benchmarking Graph Neural Networks [73.11514658000547]
本稿では,プライバシ制御により実世界のグラフの分布を学習し,再現する新しいグラフ生成モデルを提案する。
我々のモデルは、GNNモデルのベンチマークに効果的に使用できる大規模な実世界のグラフの、プライバシ制御された合成代用をうまく生成することができる。
論文 参考訳(メタデータ) (2022-07-10T06:42:02Z) - NAS-Bench-Graph: Benchmarking Graph Neural Architecture Search [55.75621026447599]
NAS-Bench-Graphは、GraphNASの統一的、再現可能、効率的な評価をサポートする調整されたベンチマークである。
具体的には,26,206のユニークなグラフニューラルネットワーク(GNN)アーキテクチャを網羅した,統一的で表現力のあるコンパクトな検索空間を構築する。
提案したベンチマークに基づいて,GNNアーキテクチャの性能を検索テーブルから直接取得できるが,それ以上の計算は行わない。
論文 参考訳(メタデータ) (2022-06-18T10:17:15Z) - Node Feature Extraction by Self-Supervised Multi-scale Neighborhood
Prediction [123.20238648121445]
我々は、新しい自己教師型学習フレームワーク、グラフ情報支援ノード機能exTraction (GIANT)を提案する。
GIANT は eXtreme Multi-label Classification (XMC) 形式を利用しており、これはグラフ情報に基づいた言語モデルの微調整に不可欠である。
我々は,Open Graph Benchmarkデータセット上での標準GNNパイプラインよりもGIANTの方が優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-29T19:55:12Z) - Scalable Graph Neural Networks for Heterogeneous Graphs [12.44278942365518]
グラフニューラルネットワーク(GNN)は、グラフ構造化データを学習するためのパラメトリックモデルの一般的なクラスである。
最近の研究は、GNNが主に機能をスムースにするためにグラフを使用しており、ベンチマークタスクで競合する結果を示していると主張している。
本研究では、これらの結果が異種グラフに拡張可能かどうかを問うとともに、異なるエンティティ間の複数のタイプの関係を符号化する。
論文 参考訳(メタデータ) (2020-11-19T06:03:35Z) - Learning to Drop: Robust Graph Neural Network via Topological Denoising [50.81722989898142]
グラフニューラルネットワーク(GNN)のロバスト性および一般化性能を向上させるために,パラメータ化トポロジカルデノイングネットワークであるPTDNetを提案する。
PTDNetは、パラメータ化されたネットワークでスパーシファイドグラフ内のエッジ数をペナル化することで、タスク非関連エッジを創出する。
PTDNetはGNNの性能を著しく向上させ,さらにノイズの多いデータセットでは性能が向上することを示す。
論文 参考訳(メタデータ) (2020-11-13T18:53:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。