論文の概要: Synthetic Over-sampling for Imbalanced Node Classification with Graph
Neural Networks
- arxiv url: http://arxiv.org/abs/2206.05335v1
- Date: Fri, 10 Jun 2022 19:47:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-14 18:00:40.008259
- Title: Synthetic Over-sampling for Imbalanced Node Classification with Graph
Neural Networks
- Title(参考訳): グラフニューラルネットワークを用いた不均衡ノード分類のための合成オーバーサンプリング
- Authors: Tianxiang Zhao and Xiang Zhang and Suhang Wang
- Abstract要約: グラフニューラルネットワーク(GNN)はノード分類の最先端性能を実現している。
多くの実世界のシナリオでは、ノードクラスは不均衡であり、グラフのほとんどの部分を構成する多数派クラスもある。
本研究では、マイノリティクラスの擬似インスタンスを生成し、トレーニングデータのバランスをとることで、この問題に対処する。
- 参考スコア(独自算出の注目度): 34.81248024048974
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, graph neural networks (GNNs) have achieved state-of-the-art
performance for node classification. However, most existing GNNs would suffer
from the graph imbalance problem. In many real-world scenarios, node classes
are imbalanced, with some majority classes making up most parts of the graph.
The message propagation mechanism in GNNs would further amplify the dominance
of those majority classes, resulting in sub-optimal classification performance.
In this work, we seek to address this problem by generating pseudo instances of
minority classes to balance the training data, extending previous
over-sampling-based techniques. This task is non-trivial, as those techniques
are designed with the assumption that instances are independent. Neglection of
relation information would complicate this oversampling process. Furthermore,
the node classification task typically takes the semi-supervised setting with
only a few labeled nodes, providing insufficient supervision for the generation
of minority instances. Generated new nodes of low quality would harm the
trained classifier. In this work, we address these difficulties by synthesizing
new nodes in a constructed embedding space, which encodes both node attributes
and topology information. Furthermore, an edge generator is trained
simultaneously to model the graph structure and provide relations for new
samples. To further improve the data efficiency, we also explore synthesizing
mixed ``in-between'' nodes to utilize nodes from the majority class in this
over-sampling process. Experiments on real-world datasets validate the
effectiveness of our proposed framework.
- Abstract(参考訳): 近年,グラフニューラルネットワーク(GNN)はノード分類の最先端性能を実現している。
しかし、既存のほとんどのGNNはグラフの不均衡の問題に悩まされる。
多くの実世界のシナリオでは、ノードクラスは不均衡であり、グラフのほとんどの部分を構成する多数派クラスもある。
GNNのメッセージ伝搬機構は、これらの多数クラスの優位性をさらに増幅し、その結果、サブ最適分類性能が向上する。
本研究では,マイノリティクラスの擬似インスタンスを生成し,トレーニングデータのバランスを保ち,従来のオーバーサンプリング手法を拡張してこの問題に対処する。
これらのテクニックはインスタンスが独立しているという仮定で設計されているため、このタスクは自明ではありません。
関係情報の無視は、このオーバーサンプリングプロセスを複雑にする。
さらに、ノード分類タスクは、通常は少数のラベル付きノードで半教師付き設定を取るため、マイノリティインスタンスの生成の監督が不十分である。
低品質の新しいノードの生成は、訓練された分類器を傷つける。
本稿では,ノード属性とトポロジ情報の両方をエンコードする組込み空間において,新しいノードを合成することで,これらの課題に対処する。
さらに、エッジジェネレータを同時にトレーニングし、グラフ構造をモデル化し、新しいサンプルの関係を提供する。
データ効率をさらに向上するために、このオーバーサンプリングプロセスで多数派クラスのノードを利用するために、混在する `in- between'' ノードの合成についても検討する。
実世界のデータセット実験により,提案フレームワークの有効性が検証された。
関連論文リスト
- Degree-based stratification of nodes in Graph Neural Networks [66.17149106033126]
グラフニューラルネットワーク(GNN)アーキテクチャを変更して,各グループのノードに対して,重み行列を個別に学習する。
このシンプルな実装変更により、データセットとGNNメソッドのパフォーマンスが改善されているようだ。
論文 参考訳(メタデータ) (2023-12-16T14:09:23Z) - NodeFormer: A Scalable Graph Structure Learning Transformer for Node
Classification [70.51126383984555]
本稿では,任意のノード間のノード信号を効率的に伝搬する全ペアメッセージパッシング方式を提案する。
効率的な計算は、カーナライズされたGumbel-Softmax演算子によって実現される。
グラフ上のノード分類を含む様々なタスクにおいて,本手法の有望な有効性を示す実験を行った。
論文 参考訳(メタデータ) (2023-06-14T09:21:15Z) - UNREAL:Unlabeled Nodes Retrieval and Labeling for Heavily-imbalanced
Node Classification [17.23736166919287]
スクイードラベルの分布は実世界のノード分類タスクでよく見られる。
本稿では,反復的なオーバーサンプリング手法UNREALを提案する。
論文 参考訳(メタデータ) (2023-03-18T09:23:13Z) - Semantic-aware Node Synthesis for Imbalanced Heterogeneous Information
Networks [51.55932524129814]
意味認識ノード合成(SNS)と呼ばれる不均衡HINにおける意味的不均衡問題の最初の方法を提案する。
SNSは、異種隣接ノードを適応的に選択し、マイノリティのセマンティクスを維持しながら、合成ノードでネットワークを増強する。
また,HGNNに対してセマンティックおよびクラスの観点から合成ノードの表現を制約する2つの正規化手法を導入する。
論文 参考訳(メタデータ) (2023-02-27T00:21:43Z) - GraphSR: A Data Augmentation Algorithm for Imbalanced Node
Classification [10.03027886793368]
グラフニューラルネットワーク(GNN)はノード分類タスクにおいて大きな成功を収めている。
既存のGNNは、多くのラベル付きデータを持つ多数派クラスに自然に偏り、比較的少ないラベル付きデータを持つ少数派クラスを無視している。
我々は,未学習ノードを多種多様に拡張する,新しい自己学習戦略である textitGraphSR を提案する。
論文 参考訳(メタデータ) (2023-02-24T18:49:10Z) - ResNorm: Tackling Long-tailed Degree Distribution Issue in Graph Neural
Networks via Normalization [80.90206641975375]
本稿では,正規化によるGNNの性能向上に焦点をあてる。
グラフ中のノード次数の長期分布を調べることにより、GNNの新しい正規化法を提案する。
ResNormの$scale$操作は、尾ノードの精度を向上させるために、ノード単位の標準偏差(NStd)分布を再設定する。
論文 参考訳(メタデータ) (2022-06-16T13:49:09Z) - Exploiting Neighbor Effect: Conv-Agnostic GNNs Framework for Graphs with
Heterophily [58.76759997223951]
我々はフォン・ノイマンエントロピーに基づく新しい計量を提案し、GNNのヘテロフィリー問題を再検討する。
また、異種データセット上でのほとんどのGNNの性能を高めるために、Conv-Agnostic GNNフレームワーク(CAGNN)を提案する。
論文 参考訳(メタデータ) (2022-03-19T14:26:43Z) - Graph Neural Network with Curriculum Learning for Imbalanced Node
Classification [21.085314408929058]
グラフニューラルネットワーク(GNN)は,ノード分類などのグラフベースの学習タスクの新興技術である。
本研究では,ノードラベルの不均衡に対するGNNの脆弱性を明らかにする。
本稿では,2つのモジュールからなるカリキュラム学習(GNN-CL)を備えたグラフニューラルネットワークフレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-05T10:46:11Z) - GraphMixup: Improving Class-Imbalanced Node Classification on Graphs by
Self-supervised Context Prediction [25.679620842010422]
本稿では,グラフ上のクラス不均衡ノード分類を改善するための新しい混合フレームワークであるGraphMixupを提案する。
我々は,これらのマイノリティクラスに対する混合によって生成されるサンプル数を適応的に決定するEmphReinforcement Mixupメカニズムを開発した。
3つの実世界のデータセットの実験により、GraphMixupはクラス不均衡なノード分類タスクに対して真に励まされる結果が得られることが示された。
論文 参考訳(メタデータ) (2021-06-21T14:12:16Z) - GraphSMOTE: Imbalanced Node Classification on Graphs with Graph Neural
Networks [28.92347073786722]
グラフニューラルネットワーク(GNN)はノード分類の最先端性能を達成した。
本稿では,ノード間の類似性をエンコードするために埋め込み空間を構築する新しいフレームワークであるgraphsmoteを提案する。
この空間で新しいサンプルが合成され、真正性が保証される。
論文 参考訳(メタデータ) (2021-03-16T03:23:55Z) - Towards Deeper Graph Neural Networks with Differentiable Group
Normalization [61.20639338417576]
グラフニューラルネットワーク(GNN)は、隣接するノードを集約することでノードの表現を学習する。
オーバースムーシングは、レイヤーの数が増えるにつれてGNNのパフォーマンスが制限される重要な問題のひとつです。
2つのオーバースムースなメトリクスと新しいテクニック、すなわち微分可能群正規化(DGN)を導入する。
論文 参考訳(メタデータ) (2020-06-12T07:18:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。