論文の概要: UNREAL:Unlabeled Nodes Retrieval and Labeling for Heavily-imbalanced
Node Classification
- arxiv url: http://arxiv.org/abs/2303.10371v1
- Date: Sat, 18 Mar 2023 09:23:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 19:45:06.743288
- Title: UNREAL:Unlabeled Nodes Retrieval and Labeling for Heavily-imbalanced
Node Classification
- Title(参考訳): UNREAL:高度不均衡ノード分類のための未ラベルノード検索とラベル付け
- Authors: Liang Yan, Shengzhong Zhang, Bisheng Li, Min Zhou, Zengfeng Huang
- Abstract要約: スクイードラベルの分布は実世界のノード分類タスクでよく見られる。
本稿では,反復的なオーバーサンプリング手法UNREALを提案する。
- 参考スコア(独自算出の注目度): 17.23736166919287
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extremely skewed label distributions are common in real-world node
classification tasks. If not dealt with appropriately, it significantly hurts
the performance of GNNs in minority classes. Due to its practical importance,
there have been a series of recent research devoted to this challenge. Existing
over-sampling techniques smooth the label distribution by generating ``fake''
minority nodes and synthesizing their features and local topology, which
largely ignore the rich information of unlabeled nodes on graphs. In this
paper, we propose UNREAL, an iterative over-sampling method. The first key
difference is that we only add unlabeled nodes instead of synthetic nodes,
which eliminates the challenge of feature and neighborhood generation. To
select which unlabeled nodes to add, we propose geometric ranking to rank
unlabeled nodes. Geometric ranking exploits unsupervised learning in the node
embedding space to effectively calibrates pseudo-label assignment. Finally, we
identify the issue of geometric imbalance in the embedding space and provide a
simple metric to filter out geometrically imbalanced nodes. Extensive
experiments on real-world benchmark datasets are conducted, and the empirical
results show that our method significantly outperforms current state-of-the-art
methods consistent on different datasets with different imbalance ratios.
- Abstract(参考訳): 極端に歪んだラベル分布は、実世界のノード分類タスクでよく見られる。
適切に扱わなければ、少数クラスのGNNのパフォーマンスを著しく損なう。
実用上の重要性から、この課題に関する最近の研究が数多く行われている。
既存のオーバーサンプリング技術は ``fake'' 個の少数ノードを生成し、それらの特徴と局所トポロジーを合成することでラベルの分布を円滑にする。
本稿では,反復的なオーバーサンプリング手法UNREALを提案する。
最初の重要な違いは、合成ノードの代わりにラベルのないノードだけを追加することだ。
ラベルなしノードをどのノードに追加するかを選択するために,ラベルなしノードをランク付けする幾何ランキングを提案する。
幾何学的ランキングは、ノード埋め込み空間における教師なし学習を利用して、疑似ラベル割り当てを効果的に校正する。
最後に、埋め込み空間における幾何学的不均衡の問題を特定し、幾何学的不均衡ノードをフィルターする簡単なメトリックを提供する。
実世界のベンチマークデータセットに関する広範囲な実験を行い,本手法が不均衡率の異なる異なるデータセット上で一貫性のある現在の最先端手法を大幅に上回ることを示した。
関連論文リスト
- Open-World Semi-Supervised Learning for Node Classification [53.07866559269709]
ノード分類のためのオープンワールド半教師付き学習(Open World SSL)は、グラフコミュニティにおいて実用的だが未探索の課題である。
オープンワールド半教師付きノード分類のためのIM Balance-AwareメソッドOpenIMAを提案する。
論文 参考訳(メタデータ) (2024-03-18T05:12:54Z) - All Points Matter: Entropy-Regularized Distribution Alignment for
Weakly-supervised 3D Segmentation [67.30502812804271]
擬似ラベルは、弱い教師付き3Dセグメンテーションタスクに広く使われており、学習に使えるのはスパース・グラウンド・トラス・ラベルのみである。
本稿では,生成した擬似ラベルを正規化し,擬似ラベルとモデル予測とのギャップを効果的に狭めるための新しい学習戦略を提案する。
論文 参考訳(メタデータ) (2023-05-25T08:19:31Z) - Towards Label Position Bias in Graph Neural Networks [47.39692033598877]
グラフニューラルネットワーク(GNN)は、半教師付きノード分類タスクの強力なツールとして登場した。
最近の研究では、ノードの特徴とグラフトポロジの両方から生じるGNNの様々なバイアスが明らかになっている。
本研究では,ラベル付きノードに近いノードの方が性能がよいことを示す,ラベル位置バイアスという新たなバイアスを明らかにする。
論文 参考訳(メタデータ) (2023-05-25T08:06:42Z) - GraphSR: A Data Augmentation Algorithm for Imbalanced Node
Classification [10.03027886793368]
グラフニューラルネットワーク(GNN)はノード分類タスクにおいて大きな成功を収めている。
既存のGNNは、多くのラベル付きデータを持つ多数派クラスに自然に偏り、比較的少ないラベル付きデータを持つ少数派クラスを無視している。
我々は,未学習ノードを多種多様に拡張する,新しい自己学習戦略である textitGraphSR を提案する。
論文 参考訳(メタデータ) (2023-02-24T18:49:10Z) - Pseudo Contrastive Learning for Graph-based Semi-supervised Learning [67.37572762925836]
Pseudo Labelingは、グラフニューラルネットワーク(GNN)の性能向上に使用されるテクニックである。
我々はPseudo Contrastive Learning(PCL)と呼ばれるGNNのための一般的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-19T10:34:08Z) - TAM: Topology-Aware Margin Loss for Class-Imbalanced Node Classification [33.028354930416754]
学習目的の局所的トポロジを反映するトポロジ・アウェア・マージン(TAM)を提案する。
提案手法は,ノード分類ベンチマークデータセットのベースラインよりも常に優位性を示す。
論文 参考訳(メタデータ) (2022-06-26T16:29:36Z) - Synthetic Over-sampling for Imbalanced Node Classification with Graph
Neural Networks [34.81248024048974]
グラフニューラルネットワーク(GNN)はノード分類の最先端性能を実現している。
多くの実世界のシナリオでは、ノードクラスは不均衡であり、グラフのほとんどの部分を構成する多数派クラスもある。
本研究では、マイノリティクラスの擬似インスタンスを生成し、トレーニングデータのバランスをとることで、この問題に対処する。
論文 参考訳(メタデータ) (2022-06-10T19:47:05Z) - Geometer: Graph Few-Shot Class-Incremental Learning via Prototype
Representation [50.772432242082914]
既存のグラフニューラルネットワークに基づく手法は主に、豊富なラベリングを持つ固定クラス内の未ラベルノードの分類に重点を置いている。
本稿では,この難易度で実用的なグラフ数ショットクラスインクリメンタルラーニング(GFSCIL)問題に着目し,Geometerと呼ばれる新しい手法を提案する。
完全に接続されたニューラルネットワークのクラスを置き換えて再トレーニングする代わりに、Geometerは、最も近いクラスのプロトタイプを見つけることによって、ノードのラベルを予測する。
論文 参考訳(メタデータ) (2022-05-27T13:02:07Z) - GraphSMOTE: Imbalanced Node Classification on Graphs with Graph Neural
Networks [28.92347073786722]
グラフニューラルネットワーク(GNN)はノード分類の最先端性能を達成した。
本稿では,ノード間の類似性をエンコードするために埋め込み空間を構築する新しいフレームワークであるgraphsmoteを提案する。
この空間で新しいサンプルが合成され、真正性が保証される。
論文 参考訳(メタデータ) (2021-03-16T03:23:55Z) - Sequential Graph Convolutional Network for Active Learning [53.99104862192055]
逐次グラフ畳み込みネットワーク(GCN)を用いた新しいプールベースアクティブラーニングフレームワークを提案する。
少数のランダムなサンプル画像がシードラベル付き例であるので、グラフのパラメータを学習してラベル付きノードと非ラベル付きノードを区別する。
我々はGCNの特性を利用してラベル付けされたものと十分に異なる未ラベルの例を選択する。
論文 参考訳(メタデータ) (2020-06-18T00:55:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。