論文の概要: Pitfalls in Link Prediction with Graph Neural Networks: Understanding
the Impact of Target-link Inclusion & Better Practices
- arxiv url: http://arxiv.org/abs/2306.00899v2
- Date: Mon, 18 Dec 2023 01:10:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 02:19:40.730277
- Title: Pitfalls in Link Prediction with Graph Neural Networks: Understanding
the Impact of Target-link Inclusion & Better Practices
- Title(参考訳): グラフニューラルネットワークによるリンク予測の落とし穴 : ターゲットリンク包含の影響とより良い実践の理解
- Authors: Jing Zhu, Yuhang Zhou, Vassilis N. Ioannidis, Shengyi Qian, Wei Ai,
Xiang Song, Danai Koutra
- Abstract要約: グラフニューラルネットワーク(GNN)は、様々なハイインパクトアプリケーションで著しく成功している。
リンク予測では、トレーニング時やテスト時にグラフに予測されるエッジを含めるという一般的なプラクティスが、低次ノードのパフォーマンスに大きく影響している。
我々は,低次ノードに対する私たちの洞察を活用する,効果的かつ効率的なGNNトレーニングフレームワークであるSpotTargetを紹介した。
- 参考スコア(独自算出の注目度): 28.88423949622
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: While Graph Neural Networks (GNNs) are remarkably successful in a variety of
high-impact applications, we demonstrate that, in link prediction, the common
practices of including the edges being predicted in the graph at training
and/or test have outsized impact on the performance of low-degree nodes. We
theoretically and empirically investigate how these practices impact node-level
performance across different degrees. Specifically, we explore three issues
that arise: (I1) overfitting; (I2) distribution shift; and (I3) implicit test
leakage. The former two issues lead to poor generalizability to the test data,
while the latter leads to overestimation of the model's performance and
directly impacts the deployment of GNNs. To address these issues in a
systematic way, we introduce an effective and efficient GNN training framework,
SpotTarget, which leverages our insight on low-degree nodes: (1) at training
time, it excludes a (training) edge to be predicted if it is incident to at
least one low-degree node; and (2) at test time, it excludes all test edges to
be predicted (thus, mimicking real scenarios of using GNNs, where the test data
is not included in the graph). SpotTarget helps researchers and practitioners
adhere to best practices for learning from graph data, which are frequently
overlooked even by the most widely-used frameworks. Our experiments on various
real-world datasets show that SpotTarget makes GNNs up to 15x more accurate in
sparse graphs, and significantly improves their performance for low-degree
nodes in dense graphs.
- Abstract(参考訳): グラフニューラルネットワーク(GNN)は、様々な高インパクトアプリケーションで著しく成功しているが、リンク予測では、トレーニングやテストにおいてグラフ内で予測されるエッジを含む一般的なプラクティスが、低次ノードのパフォーマンスに大きく影響していることを示す。
我々はこれらのプラクティスがノードレベルのパフォーマンスにどのように影響するかを理論的および実証的に検討する。
具体的には, (I1) オーバーフィッティング, (I2) 分布シフト, (I3) 暗黙的なテストリークという3つの問題について検討する。
前者2つの問題はテストデータの一般化性を低下させ、後者はモデルの性能を過大評価し、gnnの展開に直接影響を及ぼす。
これらの問題を体系的に解決するために,我々は,低次ノードに関する我々の洞察を活用した効果的かつ効率的なgnnトレーニングフレームワークであるspottargetを導入する。(1) トレーニング時に,少なくとも1つの低次ノードにインシデントした場合に予測される(トレーニング)エッジを除外し,(2) テスト時に予測すべきすべてのテストエッジを除外する(つまり,テストデータがグラフに含まれないgnnを使用する実際のシナリオを模倣する)。
spottargetは、グラフデータから学ぶためのベストプラクティスを研究者や実践者が遵守するのに役立つ。
実世界の各種データセットを用いた実験により,疎グラフにおけるGNNの精度は最大15倍に向上し,高密度グラフにおける低次ノードの性能が大幅に向上した。
関連論文リスト
- Online GNN Evaluation Under Test-time Graph Distribution Shifts [92.4376834462224]
オンラインGNN評価という新たな研究課題は、よく訓練されたGNNが現実世界の未ラベルグラフに一般化する能力について、貴重な洞察を提供することを目的としている。
我々は、よく訓練されたGNNモデルのテスト時間一般化誤差を推定するために、LeBeDと呼ばれる効果的な学習行動不一致スコアを開発する。
論文 参考訳(メタデータ) (2024-03-15T01:28:08Z) - Breaking the Entanglement of Homophily and Heterophily in
Semi-supervised Node Classification [25.831508778029097]
統計的観点から,ノードプロファイルとトポロジの関係を定量化するAMUDを提案する。
また、AMUDのための新しい有向グラフ学習パラダイムとしてADPAを提案する。
論文 参考訳(メタデータ) (2023-12-07T07:54:11Z) - GNNEvaluator: Evaluating GNN Performance On Unseen Graphs Without Labels [81.93520935479984]
本稿では,ラベル付きおよび観測されたグラフに基づいて学習した特定のGNNモデルの性能を評価することを目的とした,新しい問題であるGNNモデル評価について検討する。
本稿では,(1) DiscGraph セット構築と(2) GNNEvaluator トレーニングと推論を含む2段階の GNN モデル評価フレームワークを提案する。
DiscGraphセットからの効果的なトレーニング監督の下で、GNNEvaluatorは、評価対象であるGNNモデルのノード分類精度を正確に推定することを学ぶ。
論文 参考訳(メタデータ) (2023-10-23T05:51:59Z) - Towards Temporal Edge Regression: A Case Study on Agriculture Trade
Between Nations [4.612412025217201]
グラフニューラルネットワーク(GNN)は、動的グラフ上のタスクにおいて有望なパフォーマンスを示している。
本稿では,GNNの静的および動的設定におけるエッジ回帰タスクへの適用について検討する。
論文 参考訳(メタデータ) (2023-08-15T17:13:16Z) - Addressing the Impact of Localized Training Data in Graph Neural
Networks [0.0]
グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習において顕著な成功を収めた。
本稿では,グラフの局所化部分集合に対するGNNのトレーニングの影響を評価することを目的とする。
本稿では,局所化学習データとグラフ推論との分散不一致を最小化する正規化手法を提案する。
論文 参考訳(メタデータ) (2023-07-24T11:04:22Z) - Stable Prediction on Graphs with Agnostic Distribution Shift [105.12836224149633]
グラフニューラルネットワーク(GNN)は、ランダムにトレーニングとテストデータを分離した様々なグラフタスクに有効であることが示されている。
しかし、実際のアプリケーションでは、トレーニンググラフの分布はテストグラフとは異なるかもしれない。
本稿では,グラフ上での局所的およびグローバル的に安定な学習と予測を可能にする,GNNのための新しい安定な予測フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-08T02:45:47Z) - Shift-Robust GNNs: Overcoming the Limitations of Localized Graph
Training data [52.771780951404565]
Shift-Robust GNN (SR-GNN) は、バイアス付きトレーニングデータとグラフの真の推論分布の分布差を考慮に入れた設計である。
SR-GNNが他のGNNベースラインを精度良く上回り、バイアス付きトレーニングデータから生じる負の効果の少なくとも40%を排除していることを示す。
論文 参考訳(メタデータ) (2021-08-02T18:00:38Z) - Combining Label Propagation and Simple Models Out-performs Graph Neural
Networks [52.121819834353865]
多くの標準的なトランスダクティブノード分類ベンチマークでは、最先端のGNNの性能を超えたり、一致させることができる。
これをC&S(Correct and Smooth)と呼ぶ。
我々のアプローチは、様々なベンチマークで最先端のGNNの性能を上回るか、ほぼ一致している。
論文 参考訳(メタデータ) (2020-10-27T02:10:52Z) - Distance Encoding: Design Provably More Powerful Neural Networks for
Graph Representation Learning [63.97983530843762]
グラフニューラルネットワーク(GNN)はグラフ表現学習において大きな成功を収めている。
GNNは、実際には非常に異なるグラフ部分構造に対して同一の表現を生成する。
より強力なGNNは、最近高階試験を模倣して提案され、基礎となるグラフ構造を疎結合にできないため、非効率である。
本稿では,グラフ表現学習の新たなクラスとして距離分解(DE)を提案する。
論文 参考訳(メタデータ) (2020-08-31T23:15:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。