論文の概要: Open Graph Benchmark: Datasets for Machine Learning on Graphs
- arxiv url: http://arxiv.org/abs/2005.00687v7
- Date: Thu, 25 Feb 2021 02:06:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 12:06:38.089359
- Title: Open Graph Benchmark: Datasets for Machine Learning on Graphs
- Title(参考訳): Open Graphベンチマーク:グラフ上の機械学習のためのデータセット
- Authors: Weihua Hu, Matthias Fey, Marinka Zitnik, Yuxiao Dong, Hongyu Ren,
Bowen Liu, Michele Catasta, Jure Leskovec
- Abstract要約: スケーラブルで堅牢で再現可能なグラフ機械学習(ML)の研究を容易にするために,Open Graph Benchmark(OGB)を提案する。
OGBデータセットは大規模で、複数の重要なグラフMLタスクを含み、さまざまなドメインをカバーする。
各データセットに対して,有意義なアプリケーション固有のデータ分割と評価指標を用いた統一評価プロトコルを提供する。
- 参考スコア(独自算出の注目度): 86.96887552203479
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present the Open Graph Benchmark (OGB), a diverse set of challenging and
realistic benchmark datasets to facilitate scalable, robust, and reproducible
graph machine learning (ML) research. OGB datasets are large-scale, encompass
multiple important graph ML tasks, and cover a diverse range of domains,
ranging from social and information networks to biological networks, molecular
graphs, source code ASTs, and knowledge graphs. For each dataset, we provide a
unified evaluation protocol using meaningful application-specific data splits
and evaluation metrics. In addition to building the datasets, we also perform
extensive benchmark experiments for each dataset. Our experiments suggest that
OGB datasets present significant challenges of scalability to large-scale
graphs and out-of-distribution generalization under realistic data splits,
indicating fruitful opportunities for future research. Finally, OGB provides an
automated end-to-end graph ML pipeline that simplifies and standardizes the
process of graph data loading, experimental setup, and model evaluation. OGB
will be regularly updated and welcomes inputs from the community. OGB datasets
as well as data loaders, evaluation scripts, baseline code, and leaderboards
are publicly available at https://ogb.stanford.edu .
- Abstract(参考訳): Open Graph Benchmark(OGB)は、スケーラブルで堅牢で再現可能なグラフ機械学習(ML)の研究を容易にするための、挑戦的で現実的なベンチマークデータセットである。
ogbデータセットは大規模で、複数の重要なグラフmlタスクを包含しており、社会ネットワークや情報ネットワーク、生体ネットワーク、分子グラフ、ソースコードast、知識グラフなど、さまざまなドメインをカバーする。
各データセットに対して,アプリケーション固有のデータ分割と評価指標を用いた統一評価プロトコルを提供する。
データセットの構築に加えて、各データセットに対する広範なベンチマーク実験も行っています。
実験の結果,ogbデータセットは,大規模グラフへのスケーラビリティと,現実的なデータ分割下での分散一般化という重大な課題を呈し,今後の研究に実りある機会を示唆する。
最後に、OGBは、グラフデータのロード、実験的なセットアップ、モデル評価のプロセスを簡素化し、標準化する、エンドツーエンドのグラフMLパイプラインを提供する。
OGBは定期的に更新され、コミュニティからのインプットを歓迎する。
OGBデータセットに加えて、データローダ、評価スクリプト、ベースラインコード、リーダボードもhttps://ogb.stanford.eduで公開されている。
関連論文リスト
- DA-MoE: Addressing Depth-Sensitivity in Graph-Level Analysis through Mixture of Experts [70.21017141742763]
グラフニューラルネットワーク(GNN)は、グラフ構造化データを処理することで人気を集めている。
既存のメソッドは通常、固定数のGNNレイヤを使用して、すべてのグラフの表現を生成する。
本稿では,GNNに2つの改良を加えたDA-MoE法を提案する。
論文 参考訳(メタデータ) (2024-11-05T11:46:27Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - Temporal Graph Benchmark for Machine Learning on Temporal Graphs [54.52243310226456]
テンポラルグラフベンチマーク(TGB)は、困難で多様なベンチマークデータセットのコレクションである。
各データセットをベンチマークし、共通のモデルのパフォーマンスがデータセット間で大きく異なることを発見した。
TGBは、再現可能でアクセス可能な時間グラフ研究のための自動機械学習パイプラインを提供する。
論文 参考訳(メタデータ) (2023-07-03T13:58:20Z) - Graphtester: Exploring Theoretical Boundaries of GNNs on Graph Datasets [10.590698823137755]
我々は、さまざまなデータセット、タスク、スコアに対するGNNの理論的能力を総合的に分析するための、Graphtesterと呼ばれる新しいツールを提供する。
我々はGraphtesterを使用して40以上のグラフデータセットを分析し、レイヤ数に基づいて様々なGNNのパフォーマンスの上限を決定する。
このツールは、位置ノードエンコーディングを用いてグラフトランスフォーマーにも使用でき、それによってスコープを拡大できることを示す。
論文 参考訳(メタデータ) (2023-06-30T08:53:23Z) - IGB: Addressing The Gaps In Labeling, Features, Heterogeneity, and Size
of Public Graph Datasets for Deep Learning Research [14.191338008898963]
グラフニューラルネットワーク(GNN)は、さまざまな現実的、挑戦的なアプリケーションに対して高い可能性を示している。
GNN研究の大きな障害の1つは、大規模なフレキシブルデータセットの欠如である。
イリノイグラフベンチマーク(IGB)は、開発者がGNNモデルをトレーニング、精査、評価するために使用できる研究データセットツールである。
論文 参考訳(メタデータ) (2023-02-27T05:21:35Z) - GraphWorld: Fake Graphs Bring Real Insights for GNNs [4.856486822139849]
GraphWorldは、ユーザが何百万もの統計的に多様なデータセットで効率的に世界を生成することを可能にする。
数百万のベンチマークデータセットに対する数万のGNNモデルの性能特性について,GraphWorldの実験結果から考察した。
論文 参考訳(メタデータ) (2022-02-28T22:00:02Z) - Graph Contrastive Learning Automated [94.41860307845812]
グラフコントラスト学習(GraphCL)は、有望な表現学習性能とともに登場した。
GraphCLのヒンジがアドホックなデータ拡張に与える影響は、データセット毎に手動で選択する必要がある。
本稿では,グラフデータ上でGraphCLを実行する際に,データ拡張を自動的に,適応的に動的に選択する統合バイレベル最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-10T16:35:27Z) - OGB-LSC: A Large-Scale Challenge for Machine Learning on Graphs [69.23600404232883]
OGB Large-Scale Challenge(OGB-LSC)は、大規模グラフMLにおける最先端の進歩のための3つの実世界のデータセットのコレクションです。
OGB-LSCは専用のベースライン実験を提供し、表現型グラフMLモデルを巨大なデータセットにスケールアップします。
論文 参考訳(メタデータ) (2021-03-17T04:08:03Z) - TUDataset: A collection of benchmark datasets for learning with graphs [21.16723995518478]
グラフ分類と回帰のためのTUDatasetを紹介する。
コレクションは、広範囲のアプリケーションから、さまざまなサイズの120以上のデータセットで構成されている。
すべてのデータセットはwww.graphlearning.ioで入手できる。
論文 参考訳(メタデータ) (2020-07-16T21:46:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。