論文の概要: The Impact of Data Characteristics on GNN Evaluation for Detecting Fake News
- arxiv url: http://arxiv.org/abs/2512.06638v1
- Date: Sun, 07 Dec 2025 03:00:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.440839
- Title: The Impact of Data Characteristics on GNN Evaluation for Detecting Fake News
- Title(参考訳): フェイクニュースの検出におけるデータ特性がGNN評価に及ぼす影響
- Authors: Isha Karn, David Jensen,
- Abstract要約: グラフニューラルネットワーク(GNN)は、ソーシャルメディア上のニュース記事の内容と伝播構造をモデル化することにより、偽ニュースの検出に広く利用されている。
GossipCop と PolitiFact の2つの最もよく使われているベンチマークデータセットは、伝播構造を使用するモデルの実用性を評価するのにはあまり適していない。
- 参考スコア(独自算出の注目度): 0.04774522315161165
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graph neural networks (GNNs) are widely used for the detection of fake news by modeling the content and propagation structure of news articles on social media. We show that two of the most commonly used benchmark data sets - GossipCop and PolitiFact - are poorly suited to evaluating the utility of models that use propagation structure. Specifically, these data sets exhibit shallow, ego-like graph topologies that provide little or no ability to differentiate among modeling methods. We systematically benchmark five GNN architectures against a structure-agnostic multilayer perceptron (MLP) that uses the same node features. We show that MLPs match or closely trail the performance of GNNs, with performance gaps often within 1-2% and overlapping confidence intervals. To isolate the contribution of structure in these datasets, we conduct controlled experiments where node features are shuffled or edge structures randomized. We find that performance collapses under feature shuffling but remains stable under edge randomization. This suggests that structure plays a negligible role in these benchmarks. Structural analysis further reveals that over 75% of nodes are only one hop from the root, exhibiting minimal structural diversity. In contrast, on synthetic datasets where node features are noisy and structure is informative, GNNs significantly outperform MLPs. These findings provide strong evidence that widely used benchmarks do not meaningfully test the utility of modeling structural features, and they motivate the development of datasets with richer, more diverse graph topologies.
- Abstract(参考訳): グラフニューラルネットワーク(GNN)は、ソーシャルメディア上のニュース記事の内容と伝播構造をモデル化し、偽ニュースを検出するために広く利用されている。
GossipCop と PolitiFact の2つの最もよく使われているベンチマークデータセットは、伝播構造を使用するモデルの実用性を評価するのにはあまり適していない。
具体的には、これらのデータセットは浅いエゴに似たグラフトポロジーを示しており、モデリング手法間で区別する能力はほとんど、あるいは全くない。
我々は、5つのGNNアーキテクチャを、同じノード機能を使用する構造に依存しない多層パーセプトロン(MLP)に対して体系的にベンチマークする。
MLP は GNN のパフォーマンスによくマッチし,性能差が 1-2% 以内であり,信頼区間が重なる場合が多い。
これらのデータセットの構造の寄与を分離するために、ノードの特徴をシャッフルしたり、エッジ構造をランダム化したりする制御実験を行う。
特徴シャッフルでは性能が低下するが,エッジランダム化では安定であることがわかった。
このことは、これらのベンチマークでは構造が無視できる役割を担っていることを示唆している。
構造解析により、75%以上のノードが根からの1つのホップのみであり、最小限の構造多様性を示すことが明らかになった。
対照的に、ノードの特徴が騒々しく、構造が情報的である合成データセットでは、GNNはMPPを著しく上回る。
これらの結果は、広く使用されているベンチマークが構造的特徴をモデル化する有用性を有意義にテストしていないことを示し、よりリッチで多様なグラフトポロジを持つデータセットの開発を動機付けている。
関連論文リスト
- Adapting to Heterophilic Graph Data with Structure-Guided Neighbor Discovery [31.368672838207022]
グラフニューラルネットワーク(GNN)は、接続ノードが異種ラベルを持つ場合、異種データとしばしば競合する。
我々は、類似した構造特性を持つノードをリンクすることで、代替グラフ構造を作成することを提案する。
本稿では,新たに作成された構造グラフとともに元のグラフを処理するアーキテクチャであるStructure-Guided GNN(SG-GNN)を紹介する。
論文 参考訳(メタデータ) (2025-06-10T15:03:23Z) - Structure-Guided Input Graph for GNNs facing Heterophily [31.368672838207022]
ノードが構造的特性を共有している場合、ノードが接続される新しいグラフを作成します。
実験の結果,新たに定義されたグラフではラベルのスムーズさが示され,GNNアーキテクチャの性能も向上した。
論文 参考訳(メタデータ) (2024-12-02T17:52:33Z) - Noise-Resilient Unsupervised Graph Representation Learning via Multi-Hop Feature Quality Estimation [53.91958614666386]
グラフニューラルネットワーク(GNN)に基づく教師なしグラフ表現学習(UGRL)
マルチホップ特徴量推定(MQE)に基づく新しいUGRL法を提案する。
論文 参考訳(メタデータ) (2024-07-29T12:24:28Z) - Hyperbolic Benchmarking Unveils Network Topology-Feature Relationship in GNN Performance [0.5416466085090772]
グラフ機械学習のための総合的なベンチマークフレームワークを導入する。
我々は,現実的なトポロジ特性とノード特徴ベクトルを持つ合成ネットワークを生成する。
その結果,ネットワーク構造とノード特徴間の相互作用にモデル性能が依存していることが明らかになった。
論文 参考訳(メタデータ) (2024-06-04T20:40:06Z) - Global Minima, Recoverability Thresholds, and Higher-Order Structure in
GNNS [0.0]
ランダムグラフ理論の観点から,グラフニューラルネットワーク(GNN)アーキテクチャの性能を解析する。
合成データにおける特定の高次構造と実データにおける経験的構造の混合が、GNNの性能に劇的な影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2023-10-11T17:16:33Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - Deep Graph Neural Networks via Posteriori-Sampling-based Node-Adaptive Residual Module [65.81781176362848]
グラフニューラルネットワーク(GNN)は、近隣情報収集を通じてグラフ構造化データから学習することができる。
レイヤーの数が増えるにつれて、ノード表現は区別不能になり、オーバー・スムーシング(over-smoothing)と呼ばれる。
我々は,textbfPosterior-Sampling-based, Node-distinguish Residual Module (PSNR)を提案する。
論文 参考訳(メタデータ) (2023-05-09T12:03:42Z) - Simplifying approach to Node Classification in Graph Neural Networks [7.057970273958933]
グラフニューラルネットワークのノード特徴集約ステップと深さを分離し、異なる集約特徴が予測性能にどのように寄与するかを経験的に分析する。
集約ステップによって生成された全ての機能が有用であるとは限らないことを示し、これらの少ない情報的特徴を用いることは、GNNモデルの性能に有害であることを示す。
提案モデルでは,提案モデルが最先端のGNNモデルと同等あるいはそれ以上の精度を達成可能であることを実証的に示す。
論文 参考訳(メタデータ) (2021-11-12T14:53:22Z) - Local Augmentation for Graph Neural Networks [78.48812244668017]
本稿では,局所的な部分グラフ構造によりノード特性を向上する局所拡張を提案する。
局所的な拡張に基づいて、プラグイン・アンド・プレイ方式で任意のGNNモデルに適用可能な、LA-GNNという新しいフレームワークをさらに設計する。
論文 参考訳(メタデータ) (2021-09-08T18:10:08Z) - Node Similarity Preserving Graph Convolutional Networks [51.520749924844054]
グラフニューラルネットワーク(GNN)は、ノード近傍の情報を集約し変換することで、グラフ構造とノードの特徴を探索する。
グラフ構造を利用してノード類似性を効果的かつ効率的に保存できるSimP-GCNを提案する。
本研究は,SimP-GCNが3つの分類グラフと4つの非補助グラフを含む7つのベンチマークデータセットに対して有効であることを示す。
論文 参考訳(メタデータ) (2020-11-19T04:18:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。