論文の概要: GraphLand: Evaluating Graph Machine Learning Models on Diverse Industrial Data
- arxiv url: http://arxiv.org/abs/2409.14500v3
- Date: Mon, 18 Aug 2025 16:45:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:09.670981
- Title: GraphLand: Evaluating Graph Machine Learning Models on Diverse Industrial Data
- Title(参考訳): GraphLand: さまざまな産業データに基づくグラフ機械学習モデルの評価
- Authors: Gleb Bazhenov, Oleg Platonov, Liudmila Prokhorenkova,
- Abstract要約: GraphLandは、さまざまな産業アプリケーションからノードプロパティを予測するための14のグラフデータセットのベンチマークである。
さまざまなサイズ、構造特性、特徴セットを持つ幅広いグラフ上で、すべて統一された設定でグラフMLモデルを評価することができる。
- 参考スコア(独自算出の注目度): 17.277932238538302
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although data that can be naturally represented as graphs is widespread in real-world applications across diverse industries, popular graph ML benchmarks for node property prediction only cover a surprisingly narrow set of data domains, and graph neural networks (GNNs) are often evaluated on just a few academic citation networks. This issue is particularly pressing in light of the recent growing interest in designing graph foundation models. These models are supposed to be able to transfer to diverse graph datasets from different domains, and yet the proposed graph foundation models are often evaluated on a very limited set of datasets from narrow applications. To alleviate this issue, we introduce GraphLand: a benchmark of 14 diverse graph datasets for node property prediction from a range of different industrial applications. GraphLand allows evaluating graph ML models on a wide range of graphs with diverse sizes, structural characteristics, and feature sets, all in a unified setting. Further, GraphLand allows investigating such previously underexplored research questions as how realistic temporal distributional shifts under transductive and inductive settings influence graph ML model performance. To mimic realistic industrial settings, we use GraphLand to compare GNNs with gradient-boosted decision trees (GBDT) models that are popular in industrial applications and show that GBDTs provided with additional graph-based input features can sometimes be very strong baselines. Further, we evaluate currently available general-purpose graph foundation models and find that they fail to produce competitive results on our proposed datasets.
- Abstract(参考訳): グラフとして自然に表現できるデータは、様々な産業にまたがる現実世界のアプリケーションで広く使われているが、ノード特性予測のための一般的なグラフMLベンチマークは、驚くほど狭いデータ領域のみをカバーし、グラフニューラルネットワーク(GNN)は、ごく少数の学術的な引用ネットワークで評価されることが多い。
この問題は、グラフ基盤モデルの設計に対する近年の関心の高まりを踏まえて特に注目されている。
これらのモデルは、異なるドメインから多様なグラフデータセットに転送できるはずであるが、提案されたグラフ基盤モデルは、狭いアプリケーションからの非常に限られたデータセットで評価されることが多い。
この問題を軽減するために、さまざまな産業アプリケーションからノード特性を予測するための14種類のグラフデータセットのベンチマークであるGraphLandを紹介します。
GraphLandは、さまざまなサイズ、構造特性、特徴セットを持つ幅広いグラフ上で、すべて統一された設定でグラフMLモデルを評価することができる。
さらに、GraphLandは、トランスダクティブおよびインダクティブな設定の下での時間分布シフトがグラフMLモデルのパフォーマンスにどのように影響するかという、これまで未解決の研究課題を調査することができる。
現実的な産業環境を模倣するために、GNNと産業アプリケーションで人気のあるGBDTモデルを比較し、グラフベースの入力機能を備えたGBDTが強力なベースラインであることを示す。
さらに、現在利用可能な汎用グラフ基盤モデルを評価し、提案したデータセット上で競合する結果が得られないことを見出した。
関連論文リスト
- Representation Learning for Tabular Data: A Comprehensive Survey [23.606506938919605]
行と列として構造化されたタブラルデータは、機械学習の分類と回帰アプリケーションにおいて最も一般的なデータタイプの一つである。
ディープニューラルネットワーク(DNN)は、最近、表現学習の能力を通じて有望な結果を実証した。
既存の手法を一般化能力に応じて3つの主要なカテゴリに分類する。
論文 参考訳(メタデータ) (2025-04-17T17:58:23Z) - Towards Graph Foundation Models: Learning Generalities Across Graphs via Task-Trees [50.78679002846741]
グラフにおけるクロスタスクの一般性を学習するための新しいアプローチを提案する。
グラフ上のタスク空間を整列させるための基本的な学習インスタンスとしてタスクツリーを提案する。
その結果,グラフニューラルネットワークが多種多様なタスクツリーで事前訓練された場合,伝達可能な知識を取得することが示唆された。
論文 参考訳(メタデータ) (2024-12-21T02:07:43Z) - GraphGLOW: Universal and Generalizable Structure Learning for Graph
Neural Networks [72.01829954658889]
本稿では,この新たな問題設定の数学的定義を紹介する。
一つのグラフ共有構造学習者と複数のグラフ固有GNNを協調する一般的なフレームワークを考案する。
十分に訓練された構造学習者は、微調整なしで、目に見えない対象グラフの適応的な構造を直接生成することができる。
論文 参考訳(メタデータ) (2023-06-20T03:33:22Z) - Between-Sample Relationship in Learning Tabular Data Using Graph and
Attention Networks [0.0]
本論文は, サンプル間の関係を組み込むことで表型データ表現を学習するi.d仮定を緩和する。
いくつかのGNNとSOTA(State-of-the-art attention model)を用いた仮説について検討する。
その結果,5つのデータセット上での従来の機械学習と,3つのデータセット上でのSOTA深層表型学習よりも注目度の高いGNN手法が優れていることがわかった。
論文 参考訳(メタデータ) (2023-06-11T20:56:21Z) - Bures-Wasserstein Means of Graphs [60.42414991820453]
本研究では,スムーズなグラフ信号分布の空間への埋め込みを通じて,グラフ平均を定義する新しいフレームワークを提案する。
この埋め込み空間において平均を求めることにより、構造情報を保存する平均グラフを復元することができる。
我々は,新しいグラフの意味の存在と特異性を確立し,それを計算するための反復アルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-05-31T11:04:53Z) - TabGSL: Graph Structure Learning for Tabular Data Prediction [10.66048003460524]
本稿では,グラフ構造学習(Tabular Graph Structure Learning, TabGSL)という新しい手法を提案する。
30のベンチマークデータセットで実施された実験では、TabGSLがツリーベースモデルと最近のディープラーニングベースモデルの両方を著しく上回っていることが示されている。
論文 参考訳(メタデータ) (2023-05-25T08:33:48Z) - Self-supervised Learning for Heterogeneous Graph via Structure
Information based on Metapath [9.757299837675204]
自己教師付き表現学習はこの問題に対処するための潜在的アプローチである。
本稿では,メタパスに基づく構造情報を用いたヘテロジニアスグラフの教師付き学習手法を提案する。
ジャンプ数を予測するために、SESIMはデータ自体を使用してラベルを生成する。
論文 参考訳(メタデータ) (2022-09-09T10:06:18Z) - Data augmentation on graphs for table type classification [1.1859913430860336]
グラフニューラルネットワークを用いてテーブルの分類を行い、使用中のメッセージパッシングアルゴリズムのテーブル構造を利用する。
我々は,グラフベースの表表現に適したデータ拡張手法を提案することで,有望な予備結果を実現する。
論文 参考訳(メタデータ) (2022-08-23T21:54:46Z) - Similarity-aware Positive Instance Sampling for Graph Contrastive
Pre-training [82.68805025636165]
トレーニングセット内の既存グラフから直接正のグラフインスタンスを選択することを提案する。
私たちの選択は、特定のドメイン固有のペアワイズ類似度測定に基づいています。
さらに,ノードを動的にマスキングしてグラフ上に均等に分配する適応ノードレベルの事前学習手法を開発した。
論文 参考訳(メタデータ) (2022-06-23T20:12:51Z) - A Robust Stacking Framework for Training Deep Graph Models with
Multifaceted Node Features [61.92791503017341]
数値ノード特徴とグラフ構造を入力とするグラフニューラルネットワーク(GNN)は,グラフデータを用いた各種教師付き学習タスクにおいて,優れた性能を示した。
IID(non-graph)データをGNNに簡単に組み込むことはできない。
本稿では、グラフ認識の伝播をIDデータに意図した任意のモデルで融合するロバストな積み重ねフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-16T22:46:33Z) - Neural Graph Matching for Pre-training Graph Neural Networks [72.32801428070749]
グラフニューラルネットワーク(GNN)は、構造データのモデリングにおいて強力な能力を示している。
GMPTと呼ばれる新しいグラフマッチングベースのGNN事前学習フレームワークを提案する。
提案手法は,完全自己指導型プレトレーニングと粗粒型プレトレーニングに適用できる。
論文 参考訳(メタデータ) (2022-03-03T09:53:53Z) - Graph Kernel Neural Networks [53.91024360329517]
本稿では、グラフ上の内部積を計算するカーネル関数であるグラフカーネルを用いて、標準畳み込み演算子をグラフ領域に拡張することを提案する。
これにより、入力グラフの埋め込みを計算する必要のない完全に構造的なモデルを定義することができる。
私たちのアーキテクチャでは,任意の種類のグラフカーネルをプラグインすることが可能です。
論文 参考訳(メタデータ) (2021-12-14T14:48:08Z) - A Tunable Model for Graph Generation Using LSTM and Conditional VAE [1.399948157377307]
データからグラフの構造的特徴を学習しながら、特定の特徴をチューニングできる生成モデルを提案する。
モデルによって生成される様々な特徴を持つグラフのデータセットを用いて、我々のモデルが特定の特徴を持つグラフを生成できることを確認する。
論文 参考訳(メタデータ) (2021-04-15T06:47:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。