論文の概要: Characterizing Graph Datasets for Node Classification: Beyond
Homophily-Heterophily Dichotomy
- arxiv url: http://arxiv.org/abs/2209.06177v1
- Date: Tue, 13 Sep 2022 17:28:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-14 13:26:52.426293
- Title: Characterizing Graph Datasets for Node Classification: Beyond
Homophily-Heterophily Dichotomy
- Title(参考訳): ノード分類のためのグラフデータセットの特徴付け
- Authors: Oleg Platonov, Denis Kuznedelev, Artem Babenko, Liudmila Prokhorenkova
- Abstract要約: ホモフィリーの測度について普遍的に合意されていないことを示す。
本稿では,近隣のラベルがノードのラベルについてどれだけの情報を提供するかを特徴付ける新しいプロパティを提案する。
LIは、ホモフィリーよりもデータセット上でのGNNの性能の予測に優れていることを示す。
- 参考スコア(独自算出の注目度): 35.251351317447686
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Homophily is a graph property describing the tendency of edges to connect
similar nodes; the opposite is called heterophily. While homophily is natural
for many real-world networks, there are also networks without this property. It
is often believed that standard message-passing graph neural networks (GNNs) do
not perform well on non-homophilous graphs, and thus such datasets need special
attention. While a lot of effort has been put into developing graph
representation learning methods for heterophilous graphs, there is no
universally agreed upon measure of homophily. Several metrics for measuring
homophily have been used in the literature, however, we show that all of them
have critical drawbacks preventing comparison of homophily levels between
different datasets. We formalize desirable properties for a proper homophily
measure and show how existing literature on the properties of classification
performance metrics can be linked to our problem. In doing so we find a measure
that we call adjusted homophily that satisfies more desirable properties than
existing homophily measures. Interestingly, this measure is related to two
classification performance metrics - Cohen's Kappa and Matthews correlation
coefficient. Then, we go beyond the homophily-heterophily dichotomy and propose
a new property that we call label informativeness (LI) that characterizes how
much information a neighbor's label provides about a node's label. We
theoretically show that LI is comparable across datasets with different numbers
of classes and class size balance. Through a series of experiments we show that
LI is a better predictor of the performance of GNNs on a dataset than
homophily. We show that LI explains why GNNs can sometimes perform well on
heterophilous datasets - a phenomenon recently observed in the literature.
- Abstract(参考訳): ホモフィリー(英: Homophily)は、類似したノードを接続するエッジの傾向を記述するグラフ特性である。
ホモフィリーは現実世界のネットワークでは自然であるが、この性質を持たないネットワークもある。
標準的なメッセージパッシンググラフニューラルネットワーク(GNN)は、好ましくないグラフではうまく機能しないと考えられており、そのようなデータセットには特別な注意が必要である。
異種グラフのグラフ表現学習法の開発には多くの努力が払われているが、ホモフィリーの測定について普遍的に合意されているものはない。
相同性を測定するためのいくつかの指標が文献で用いられてきたが、これらすべてが異なるデータセット間の相同性レベルの比較を妨げる重要な欠点を持っていることが示されている。
適切なホモフィリー測度に対する望ましい性質を定式化し、分類性能指標の特性に関する既存の文献が問題にどのように関連しているかを示す。
そうすることで、既存のホモフィリー測度よりも望ましい性質を満たす調整ホモフィリーと呼ばれる測度が見つかる。
興味深いことに、この尺度はコーエンのカッパとマシューズ相関係数の2つの分類性能指標に関連している。
次に、ホモフィエヘテロフィックな二分法を超越し、隣人のラベルがノードのラベルについてどれだけの情報を提供するかを示すラベルインフォメーションネス(li)と呼ばれる新しい特性を提案する。
理論的には、LIはクラス数とクラスサイズバランスの異なるデータセット間で比較可能であることを示す。
一連の実験を通して、LIはホモフィリーよりもデータセット上でのGNNの性能の予測に優れていることを示す。
LIは、GNNが異種データセットでうまく機能する理由を説明している。
関連論文リスト
- The Heterophilic Graph Learning Handbook: Benchmarks, Models, Theoretical Analysis, Applications and Challenges [101.83124435649358]
ホモフィリ原理では、同じラベルや類似属性を持つieノードが接続される可能性が高い。
最近の研究で、GNNのパフォーマンスとNNのパフォーマンスが満足できない非自明なデータセットが特定されている。
論文 参考訳(メタデータ) (2024-07-12T18:04:32Z) - What Is Missing In Homophily? Disentangling Graph Homophily For Graph Neural Networks [3.1227658238819855]
グラフホモフィリー(Graph homophily)は、連結ノードが同様の特性を共有する傾向にある現象を指す。
エッジやノードのホモフィリーのような最も広く使われているホモフィリー計量は、そのような「類似性」を定量化する。
グラフニューラルネットワーク(GNN)のホモフィリな影響はいまだに不明で議論の余地がある。
論文 参考訳(メタデータ) (2024-06-27T02:48:33Z) - Generation is better than Modification: Combating High Class Homophily Variance in Graph Anomaly Detection [51.11833609431406]
異なるクラス間のホモフィリー分布の差は、ホモフィリックグラフやヘテロフィリックグラフよりも著しく大きい。
我々は、この現象を定量的に記述した、クラスホモフィリーバリアンスと呼ばれる新しい計量を導入する。
その影響を軽減するために,ホモフィリーエッジ生成グラフニューラルネットワーク(HedGe)と呼ばれる新しいGNNモデルを提案する。
論文 参考訳(メタデータ) (2024-03-15T14:26:53Z) - Provable Filter for Real-world Graph Clustering [11.7278692671308]
実用的なグラフを扱うための原則的な方法が緊急に必要である。
我々は、それぞれ高度にホモ親和性とヘテロ親和性を持つ2つのグラフを構築する。
我々は、ホモフィルグラフとヘテロフィルグラフの両方に関する広範な実験を通して、我々のアプローチを検証する。
論文 参考訳(メタデータ) (2024-03-06T12:37:49Z) - Finding the Missing-half: Graph Complementary Learning for
Homophily-prone and Heterophily-prone Graphs [48.79929516665371]
ホモフィリーなエッジを持つグラフは、同じクラスでノードを接続する傾向がある。
ヘテロフィ的傾向のあるエッジは、異なるクラスを持つノード間の関係を構築する傾向がある。
既存のGNNはトレーニング中にオリジナルのグラフのみを取る。
論文 参考訳(メタデータ) (2023-06-13T08:06:10Z) - Demystifying Structural Disparity in Graph Neural Networks: Can One Size
Fit All? [61.35457647107439]
ほとんどの実世界のホモフィルグラフとヘテロフィルグラフは、ホモフィルグラフとヘテロフィルグラフの両方の構造パターンの混合ノードから構成される。
ノード分類におけるグラフニューラルネットワーク (GNN) は, 一般にホモ親和性ノード上で良好に機能することを示す。
次に、GNNに対する厳密で非I.d PAC-Bayesian一般化を提案し、性能格差の理由を明らかにした。
論文 参考訳(メタデータ) (2023-06-02T07:46:20Z) - Label-Wise Message Passing Graph Neural Network on Heterophilic Graphs [20.470934944907608]
ホモフィリーあるいはヘテロフィリーなグラフでよく機能する新しいフレームワークについて検討する。
ラベルに関するメッセージパッシングでは、類似の擬似ラベルを持つ隣人が集約される。
また、ホモフィリー・ヘテロフィリーなグラフのモデルを自動的に選択するバイレベル最適化法を提案する。
論文 参考訳(メタデータ) (2021-10-15T14:49:45Z) - Is Homophily a Necessity for Graph Neural Networks? [50.959340355849896]
グラフニューラルネットワーク(GNN)は、多数のグラフベースの機械学習タスクに適した学習表現において大きな進歩を見せている。
GNNはホモフィリーな仮定によりうまく機能し、異種ノードが接続する異種グラフへの一般化に失敗したと広く信じられている。
最近の研究は、このような不均一な制限を克服する新しいアーキテクチャを設計し、ベースライン性能の低さと、この概念の証拠として、いくつかの異種グラフベンチマークデータセットに対するアーキテクチャの改善を引用している。
我々の実験では、標準グラフ畳み込みネットワーク(GCN)が実際よりも優れた性能を実現できることを実証的に見出した。
論文 参考訳(メタデータ) (2021-06-11T02:44:00Z) - New Benchmarks for Learning on Non-Homophilous Graphs [20.082182515715182]
ホモフィリー原理を満たさないノードラベル関係を持つ改良されたグラフデータセットを多数提示する。
我々はまた、異なる体制における既存の措置よりも適しているホモフィリーの存在または不在の新しい尺度を紹介します。
論文 参考訳(メタデータ) (2021-04-03T13:45:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。