論文の概要: Delving into Instance-Dependent Label Noise in Graph Data: A Comprehensive Study and Benchmark
- arxiv url: http://arxiv.org/abs/2506.12468v1
- Date: Sat, 14 Jun 2025 12:14:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:46.284789
- Title: Delving into Instance-Dependent Label Noise in Graph Data: A Comprehensive Study and Benchmark
- Title(参考訳): グラフデータにおけるインスタンス依存ラベルノイズの理解:総合的研究とベンチマーク
- Authors: Suyeon Kim, SeongKu Kang, Dongwoo Kim, Jungseul Ok, Hwanjo Yu,
- Abstract要約: グラフニューラルネットワーク(GNN)はノード分類タスクでは最先端のパフォーマンスを達成したが、実世界のデータではラベルノイズに悩まされている。
BeGINは、様々なノイズタイプでリアルなグラフデータセットを提供する新しいベンチマークである。
ノイズ処理戦略を包括的に評価することにより、BeGINは、その効果、効率、および重要なパフォーマンス要因に関する洞察を提供する。
- 参考スコア(独自算出の注目度): 25.40550479788717
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graph Neural Networks (GNNs) have achieved state-of-the-art performance in node classification tasks but struggle with label noise in real-world data. Existing studies on graph learning with label noise commonly rely on class-dependent label noise, overlooking the complexities of instance-dependent noise and falling short of capturing real-world corruption patterns. We introduce BeGIN (Benchmarking for Graphs with Instance-dependent Noise), a new benchmark that provides realistic graph datasets with various noise types and comprehensively evaluates noise-handling strategies across GNN architectures, noisy label detection, and noise-robust learning. To simulate instance-dependent corruptions, BeGIN introduces algorithmic methods and LLM-based simulations. Our experiments reveal the challenges of instance-dependent noise, particularly LLM-based corruption, and underscore the importance of node-specific parameterization to enhance GNN robustness. By comprehensively evaluating noise-handling strategies, BeGIN provides insights into their effectiveness, efficiency, and key performance factors. We expect that BeGIN will serve as a valuable resource for advancing research on label noise in graphs and fostering the development of robust GNN training methods. The code is available at https://github.com/kimsu55/BeGIN.
- Abstract(参考訳): グラフニューラルネットワーク(GNN)はノード分類タスクでは最先端のパフォーマンスを達成したが、実世界のデータではラベルノイズに悩まされている。
ラベルノイズを伴うグラフ学習に関する既存の研究は、一般的にクラス依存のラベルノイズに依存しており、インスタンス依存のノイズの複雑さを見落とし、現実世界の汚職パターンを捉えない。
BeGIN(Benchmarking for Graphs with Instance-dependent Noise)は,GNNアーキテクチャ全体にわたるノイズハンドリング戦略,ノイズラベル検出,ノイズロバスト学習を網羅的に評価し,さまざまなノイズタイプでリアルなグラフデータセットを提供するベンチマークである。
インスタンス依存の腐敗をシミュレートするために、BeGINはアルゴリズム手法とLLMに基づくシミュレーションを導入した。
我々の実験は、特にLLMに基づく汚損によるインスタンス依存ノイズの課題を明らかにし、GNNのロバスト性を高めるためにノード固有のパラメータ化の重要性を強調した。
ノイズ処理戦略を包括的に評価することにより、BeGINは、その効果、効率、および重要なパフォーマンス要因に関する洞察を提供する。
我々は、BeGINがグラフにおけるラベルノイズの研究を進め、堅牢なGNNトレーニング手法の開発を促進する上で、貴重なリソースになることを期待している。
コードはhttps://github.com/kimsu55/BeGINで入手できる。
関連論文リスト
- Training Robust Graph Neural Networks by Modeling Noise Dependencies [28.1151026795484]
実世界のアプリケーションでは、グラフのノード機能は様々なソースからのノイズを含むことが多く、性能が著しく低下する。
本稿では,グラフ構造やノードラベルに伝搬するノイズ依存性の連鎖をノードの特徴として生み出す,より現実的なノイズシナリオ,依存性を意識したグラフ上のノイズ(DANG)を紹介する。
本稿では,DANGのデータ生成プロセス(DGP)における変数間の因果関係を変動推論を用いてキャプチャする,新しいロバストなGNN,DA-GNNを提案する。
論文 参考訳(メタデータ) (2025-02-27T01:30:13Z) - NoisyGL: A Comprehensive Benchmark for Graph Neural Networks under Label Noise [21.65452861777135]
グラフニューラルネットワーク(GNN)は、メッセージパッシング機構を通じてノード分類タスクにおいて強力なポテンシャルを示す。
ラベルノイズは実世界のグラフデータによく見られ、トレーニング中に誤った情報を伝播することでGNNに悪影響を及ぼす。
ラベルノイズ下でのグラフニューラルネットワークの総合ベンチマークであるNoisyGLを紹介する。
論文 参考訳(メタデータ) (2024-06-06T17:45:00Z) - ROG$_{PL}$: Robust Open-Set Graph Learning via Region-Based Prototype
Learning [52.60434474638983]
本稿では,複雑な雑音グラフデータに対する堅牢なオープンセット学習を実現するために,ROG$_PL$という統一フレームワークを提案する。
このフレームワークは2つのモジュール、すなわちラベルの伝搬による認知と、リージョンによるオープンセットのプロトタイプ学習で構成されている。
我々の知る限り、ROG$_PL$は複雑なノイズを持つグラフデータに対して、最初の堅牢なオープンセットノード分類法である。
論文 参考訳(メタデータ) (2024-02-28T17:25:06Z) - ERASE: Error-Resilient Representation Learning on Graphs for Label Noise
Tolerance [53.73316938815873]
本稿では, ERASE (Error-Resilient representation learning on graphs for lAbel noiSe tolerancE) という手法を提案する。
ERASEは、プロトタイプの擬似ラベルとプロパゲーションされた識別ラベルを組み合わせて、表現をエラーレジリエンスで更新する。
提案手法は, 広い雑音レベルにおいて, 複数のベースラインをクリアマージンで上回り, 高いスケーラビリティを享受できる。
論文 参考訳(メタデータ) (2023-12-13T17:59:07Z) - Combating Bilateral Edge Noise for Robust Link Prediction [56.43882298843564]
本稿では,RGIB(Robust Graph Information Bottleneck)という情報理論の原則を提案し,信頼性の高い監視信号を抽出し,表現の崩壊を回避する。
RGIB-SSLとRGIB-REPの2つのインスタンス化は、異なる手法の利点を活用するために検討されている。
6つのデータセットと3つのGNNの様々なノイズシナリオによる実験は、我々のRGIBインスタンスの有効性を検証する。
論文 参考訳(メタデータ) (2023-11-02T12:47:49Z) - Feature Noise Boosts DNN Generalization under Label Noise [65.36889005555669]
トレーニングデータにおけるラベルノイズの存在は、ディープニューラルネットワーク(DNN)の一般化に大きな影響を与える
本研究では,学習データの特徴に直接ノイズを付加する単純な特徴雑音法を,理論的に導入し,理論的に実証する。
論文 参考訳(メタデータ) (2023-08-03T08:31:31Z) - Robust Training of Graph Neural Networks via Noise Governance [27.767913371777247]
グラフニューラルネットワーク(GNN)は、半教師付き学習のモデルとして広く使われている。
本稿では,グラフノード上のラベルがうるさいだけでなく,難易度も低い重要なシナリオについて考察する。
本稿では,ラベルノイズを明示的に制御する学習により,ロバスト性を向上する新しいRTGNNフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-12T09:25:32Z) - NRGNN: Learning a Label Noise-Resistant Graph Neural Network on Sparsely
and Noisily Labeled Graphs [20.470934944907608]
グラフニューラルネットワーク(GNN)は,ノード分類などのグラフ上の半教師付き学習タスクに対して,有望な結果を得た。
多くの実世界のグラフはスパースでノイズの多いラベルが付けられており、GNNの性能を著しく低下させる可能性がある。
半教師付きノード分類のためのラベルノイズ耐性GNNを提案する。
論文 参考訳(メタデータ) (2021-06-08T22:12:44Z) - Tackling Instance-Dependent Label Noise via a Universal Probabilistic
Model [80.91927573604438]
本稿では,ノイズラベルをインスタンスに明示的に関連付ける,単純かつ普遍的な確率モデルを提案する。
合成および実世界のラベルノイズを用いたデータセット実験により,提案手法がロバスト性に大きな改善をもたらすことを確認した。
論文 参考訳(メタデータ) (2021-01-14T05:43:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。