論文の概要: Pure Node Selection for Imbalanced Graph Node Classification
- arxiv url: http://arxiv.org/abs/2509.23662v1
- Date: Sun, 28 Sep 2025 05:53:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.358127
- Title: Pure Node Selection for Imbalanced Graph Node Classification
- Title(参考訳): 不均衡グラフノード分類のための純ノード選択
- Authors: Fanlong Zeng, Wensheng Gan, Jiayang Wu, Philip S. Yu,
- Abstract要約: グラフ構造化データではクラス不均衡が一般的であり、グラフニューラルネットワーク(GNN)は通常、クラスバランスの仮定に基づいている。
我々は、ランダム性異常接続問題(RACP)に対処するPAS(Pure Node Smpling)を提案する。
量不均衡や位相不均衡を扱うためのアルゴリズムを設計する既存のアプローチとは異なり、PNSはノード合成時に直接動作する新しいプラグアンドプレイモジュールである。
- 参考スコア(独自算出の注目度): 46.14551978150584
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The problem of class imbalance refers to an uneven distribution of quantity among classes in a dataset, where some classes are significantly underrepresented compared to others. Class imbalance is also prevalent in graph-structured data. Graph neural networks (GNNs) are typically based on the assumption of class balance, often overlooking the issue of class imbalance. In our investigation, we identified a problem, which we term the Randomness Anomalous Connectivity Problem (RACP), where certain off-the-shelf models are affected by random seeds, leading to a significant performance degradation. To eliminate the influence of random factors in algorithms, we proposed PNS (Pure Node Sampling) to address the RACP in the node synthesis stage. Unlike existing approaches that design specialized algorithms to handle either quantity imbalance or topological imbalance, PNS is a novel plug-and-play module that operates directly during node synthesis to mitigate RACP. Moreover, PNS also alleviates performance degradation caused by abnormal distribution of node neighbors. We conduct a series of experiments to identify what factors are influenced by random seeds. Experimental results demonstrate the effectiveness and stability of our method, which not only eliminates the effect of unfavorable random seeds but also outperforms the baseline across various benchmark datasets with different GNN backbones. Data and code are available at https://github.com/flzeng1/PNS.
- Abstract(参考訳): クラス不均衡の問題は、データセット内のクラス間での量の不均一な分布を指し、いくつかのクラスは他のクラスに比べて著しく過小評価されている。
クラス不均衡はグラフ構造化データでも顕著である。
グラフニューラルネットワーク(GNN)は通常、クラスバランスの仮定に基づいており、しばしばクラスバランスの問題を見落としている。
そこで本研究では,ランダム性異常接続問題 (RACP) とよばれる問題を特定した。
アルゴリズムにおけるランダム要因の影響を排除するため,ノード合成段階におけるRACPに対処するPAS(Pure Node Sampling)を提案する。
量不均衡や位相不均衡を扱うアルゴリズムを設計する既存のアプローチとは異なり、PASはRACPを緩和するためにノード合成中に直接動作する新しいプラグアンドプレイモジュールである。
さらに、PNSはノード近傍の異常分布に起因する性能劣化を緩和する。
ランダムな種子にどのような要因が影響されているかを特定するために、一連の実験を行っている。
実験により,提案手法の有効性と安定性が実証された。これは,好ましくない乱種の影響を除去するだけでなく,異なるGNNバックボーンを持つ各種ベンチマークデータセットのベースラインよりも優れる。
データとコードはhttps://github.com/flzeng1/PNSで入手できる。
関連論文リスト
- Alleviating Structural Distribution Shift in Graph Anomaly Detection [70.1022676681496]
グラフ異常検出(GAD)は二項分類の問題である。
ガロン神経ネットワーク(GNN)は、同胞性隣人からの正常の分類に有用である。
ヘテロ親水性隣人の影響を緩和し、不変にするための枠組みを提案する。
論文 参考訳(メタデータ) (2024-01-25T13:07:34Z) - Heterophily-Based Graph Neural Network for Imbalanced Classification [19.51668009720269]
グラフの不均衡な分類をグラフヘテロフィリを考慮した一意なアプローチを導入する。
我々は,不均衡な分類戦略をヘテロフィリア認識GNNと統合したFast Im-GBKを提案する。
実世界のグラフに関する我々の実験は、ノード分類タスクの分類性能と効率において、我々のモデルが優れていることを示す。
論文 参考訳(メタデータ) (2023-10-12T21:19:47Z) - When Do Graph Neural Networks Help with Node Classification?
Investigating the Impact of Homophily Principle on Node Distinguishability [92.8279562472538]
ホモフィリー原理は、ノード分類タスクにおけるニューラルネットワークよりもグラフネットワーク(GNN)の性能上の優位性の主要な理由であると考えられている。
最近の研究は、ホモフィリーがなくても、同じクラスのノードが類似した近隣パターンを共有する限り、GNNの利点は依然として存在することを示唆している。
論文 参考訳(メタデータ) (2023-04-25T09:40:47Z) - Imbalanced Nodes Classification for Graph Neural Networks Based on
Valuable Sample Mining [9.156427521259195]
不均衡問題に対する従来のアルゴリズムレベルのアプローチに基づいて、新たな損失関数FD-Lossを再構成する。
我々の損失関数は、ノード分類タスクの既存の手法と比較して、サンプルノードの不均衡を効果的に解決し、分類精度を4%向上させることができる。
論文 参考訳(メタデータ) (2022-09-18T09:22:32Z) - Synthetic Over-sampling for Imbalanced Node Classification with Graph
Neural Networks [34.81248024048974]
グラフニューラルネットワーク(GNN)はノード分類の最先端性能を実現している。
多くの実世界のシナリオでは、ノードクラスは不均衡であり、グラフのほとんどの部分を構成する多数派クラスもある。
本研究では、マイノリティクラスの擬似インスタンスを生成し、トレーニングデータのバランスをとることで、この問題に対処する。
論文 参考訳(メタデータ) (2022-06-10T19:47:05Z) - On the Prediction Instability of Graph Neural Networks [2.3605348648054463]
トレーニングされたモデルの不安定性は、マシンラーニングシステムの信頼性、信頼性、信頼性に影響を与える可能性がある。
最新のグラフニューラルネットワーク(GNN)によるノード分類の不安定性の予測を系統的に評価する。
不正に分類されたノードの最大3分の1は、アルゴリズムの実行によって異なることがわかった。
論文 参考訳(メタデータ) (2022-05-20T10:32:59Z) - Shift-Robust GNNs: Overcoming the Limitations of Localized Graph
Training data [52.771780951404565]
Shift-Robust GNN (SR-GNN) は、バイアス付きトレーニングデータとグラフの真の推論分布の分布差を考慮に入れた設計である。
SR-GNNが他のGNNベースラインを精度良く上回り、バイアス付きトレーニングデータから生じる負の効果の少なくとも40%を排除していることを示す。
論文 参考訳(メタデータ) (2021-08-02T18:00:38Z) - Stochastic Graph Neural Networks [123.39024384275054]
グラフニューラルネットワーク(GNN)は、分散エージェント調整、制御、計画に応用したグラフデータの非線形表現をモデル化する。
現在のGNNアーキテクチャは理想的なシナリオを前提として,環境やヒューマンファクタ,あるいは外部攻撃によるリンク変動を無視している。
これらの状況において、GNNは、トポロジカルなランダム性を考慮していない場合、その分散タスクに対処することができない。
論文 参考訳(メタデータ) (2020-06-04T08:00:00Z) - The Effects of Randomness on the Stability of Node Embeddings [5.126380982787905]
グラフに5つのノード埋め込みアルゴリズムを適用し,その安定性をランダムに評価する。
ノードの中心性に依存しない埋め込み空間の幾何学において重要な不安定性を見出す。
これは、ノードの埋め込みを扱う場合、不安定性の影響を考慮する必要があることを示唆している。
論文 参考訳(メタデータ) (2020-05-20T13:36:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。