論文の概要: TabGraphs: A Benchmark and Strong Baselines for Learning on Graphs with Tabular Features
- arxiv url: http://arxiv.org/abs/2409.14500v1
- Date: Thu, 26 Sep 2024 15:26:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 22:30:40.563746
- Title: TabGraphs: A Benchmark and Strong Baselines for Learning on Graphs with Tabular Features
- Title(参考訳): TabGraphs: タブラル機能を備えたグラフを学習するためのベンチマークと強力なベースライン
- Authors: Gleb Bazhenov, Oleg Platonov, Liudmila Prokhorenkova,
- Abstract要約: タブラル機械学習はグラフ機械学習の手法の恩恵を受けるかもしれない。
グラフニューラルネットワーク(GNN)は、予測性能が向上することが多い。
単純な機能前処理により、GNNと競合し、さらに性能も向上する。
- 参考スコア(独自算出の注目度): 17.277932238538302
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tabular machine learning is an important field for industry and science. In this field, table rows are usually treated as independent data samples, but additional information about relations between them is sometimes available and can be used to improve predictive performance. Such information can be naturally modeled with a graph, thus tabular machine learning may benefit from graph machine learning methods. However, graph machine learning models are typically evaluated on datasets with homogeneous node features, which have little in common with heterogeneous mixtures of numerical and categorical features present in tabular datasets. Thus, there is a critical difference between the data used in tabular and graph machine learning studies, which does not allow one to understand how successfully graph models can be transferred to tabular data. To bridge this gap, we propose a new benchmark of diverse graphs with heterogeneous tabular node features and realistic prediction tasks. We use this benchmark to evaluate a vast set of models, including simple methods previously overlooked in the literature. Our experiments show that graph neural networks (GNNs) can indeed often bring gains in predictive performance for tabular data, but standard tabular models also can be adapted to work with graph data by using simple feature preprocessing, which sometimes enables them to compete with and even outperform GNNs. Based on our empirical study, we provide insights for researchers and practitioners in both tabular and graph machine learning fields.
- Abstract(参考訳): タブラル機械学習は産業と科学にとって重要な分野である。
この分野では、テーブル行は通常独立したデータサンプルとして扱われるが、それらの関係に関する追加情報は時々利用可能であり、予測性能を改善するために使用できる。
このような情報はグラフで自然にモデル化できるため、グラフ機械学習はグラフ機械学習の手法の恩恵を受けることができる。
しかし、グラフ機械学習モデルは通常、均質なノード特徴を持つデータセットで評価される。
このように、グラフ機械学習研究で使用されるデータとグラフ機械学習研究では重要な違いがあり、グラフモデルがどのようにグラフデータに転送できるかをうまく理解できない。
このギャップを埋めるため、不均一なタブ状ノード機能と現実的な予測タスクを備えた多種多様なグラフのベンチマークを提案する。
このベンチマークを用いて、これまで文献で見過ごされていた単純な方法を含む、膨大なモデルの集合を評価する。
実験の結果,グラフニューラルネットワーク(GNN)は表データの予測性能が向上することが多いが,標準的な表モデルでは,単純な特徴前処理を用いてグラフデータに適応することができる。
実験的な研究に基づいて、表とグラフの両方の機械学習分野の研究者や実践者に洞察を提供する。
関連論文リスト
- GraphGLOW: Universal and Generalizable Structure Learning for Graph
Neural Networks [72.01829954658889]
本稿では,この新たな問題設定の数学的定義を紹介する。
一つのグラフ共有構造学習者と複数のグラフ固有GNNを協調する一般的なフレームワークを考案する。
十分に訓練された構造学習者は、微調整なしで、目に見えない対象グラフの適応的な構造を直接生成することができる。
論文 参考訳(メタデータ) (2023-06-20T03:33:22Z) - Between-Sample Relationship in Learning Tabular Data Using Graph and
Attention Networks [0.0]
本論文は, サンプル間の関係を組み込むことで表型データ表現を学習するi.d仮定を緩和する。
いくつかのGNNとSOTA(State-of-the-art attention model)を用いた仮説について検討する。
その結果,5つのデータセット上での従来の機械学習と,3つのデータセット上でのSOTA深層表型学習よりも注目度の高いGNN手法が優れていることがわかった。
論文 参考訳(メタデータ) (2023-06-11T20:56:21Z) - Bures-Wasserstein Means of Graphs [60.42414991820453]
本研究では,スムーズなグラフ信号分布の空間への埋め込みを通じて,グラフ平均を定義する新しいフレームワークを提案する。
この埋め込み空間において平均を求めることにより、構造情報を保存する平均グラフを復元することができる。
我々は,新しいグラフの意味の存在と特異性を確立し,それを計算するための反復アルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-05-31T11:04:53Z) - TabGSL: Graph Structure Learning for Tabular Data Prediction [10.66048003460524]
本稿では,グラフ構造学習(Tabular Graph Structure Learning, TabGSL)という新しい手法を提案する。
30のベンチマークデータセットで実施された実験では、TabGSLがツリーベースモデルと最近のディープラーニングベースモデルの両方を著しく上回っていることが示されている。
論文 参考訳(メタデータ) (2023-05-25T08:33:48Z) - Self-supervised Learning for Heterogeneous Graph via Structure
Information based on Metapath [9.757299837675204]
自己教師付き表現学習はこの問題に対処するための潜在的アプローチである。
本稿では,メタパスに基づく構造情報を用いたヘテロジニアスグラフの教師付き学習手法を提案する。
ジャンプ数を予測するために、SESIMはデータ自体を使用してラベルを生成する。
論文 参考訳(メタデータ) (2022-09-09T10:06:18Z) - Data augmentation on graphs for table type classification [1.1859913430860336]
グラフニューラルネットワークを用いてテーブルの分類を行い、使用中のメッセージパッシングアルゴリズムのテーブル構造を利用する。
我々は,グラフベースの表表現に適したデータ拡張手法を提案することで,有望な予備結果を実現する。
論文 参考訳(メタデータ) (2022-08-23T21:54:46Z) - Similarity-aware Positive Instance Sampling for Graph Contrastive
Pre-training [82.68805025636165]
トレーニングセット内の既存グラフから直接正のグラフインスタンスを選択することを提案する。
私たちの選択は、特定のドメイン固有のペアワイズ類似度測定に基づいています。
さらに,ノードを動的にマスキングしてグラフ上に均等に分配する適応ノードレベルの事前学習手法を開発した。
論文 参考訳(メタデータ) (2022-06-23T20:12:51Z) - A Robust Stacking Framework for Training Deep Graph Models with
Multifaceted Node Features [61.92791503017341]
数値ノード特徴とグラフ構造を入力とするグラフニューラルネットワーク(GNN)は,グラフデータを用いた各種教師付き学習タスクにおいて,優れた性能を示した。
IID(non-graph)データをGNNに簡単に組み込むことはできない。
本稿では、グラフ認識の伝播をIDデータに意図した任意のモデルで融合するロバストな積み重ねフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-16T22:46:33Z) - Neural Graph Matching for Pre-training Graph Neural Networks [72.32801428070749]
グラフニューラルネットワーク(GNN)は、構造データのモデリングにおいて強力な能力を示している。
GMPTと呼ばれる新しいグラフマッチングベースのGNN事前学習フレームワークを提案する。
提案手法は,完全自己指導型プレトレーニングと粗粒型プレトレーニングに適用できる。
論文 参考訳(メタデータ) (2022-03-03T09:53:53Z) - Graph Kernel Neural Networks [53.91024360329517]
本稿では、グラフ上の内部積を計算するカーネル関数であるグラフカーネルを用いて、標準畳み込み演算子をグラフ領域に拡張することを提案する。
これにより、入力グラフの埋め込みを計算する必要のない完全に構造的なモデルを定義することができる。
私たちのアーキテクチャでは,任意の種類のグラフカーネルをプラグインすることが可能です。
論文 参考訳(メタデータ) (2021-12-14T14:48:08Z) - A Tunable Model for Graph Generation Using LSTM and Conditional VAE [1.399948157377307]
データからグラフの構造的特徴を学習しながら、特定の特徴をチューニングできる生成モデルを提案する。
モデルによって生成される様々な特徴を持つグラフのデータセットを用いて、我々のモデルが特定の特徴を持つグラフを生成できることを確認する。
論文 参考訳(メタデータ) (2021-04-15T06:47:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。