論文の概要: Towards Fair Graph Anomaly Detection: Problem, Benchmark Datasets, and Evaluation
- arxiv url: http://arxiv.org/abs/2402.15988v2
- Date: Sun, 28 Jul 2024 10:17:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-30 23:57:25.850528
- Title: Towards Fair Graph Anomaly Detection: Problem, Benchmark Datasets, and Evaluation
- Title(参考訳): 公正なグラフ異常検出に向けて:問題,ベンチマークデータセット,評価
- Authors: Neng Kai Nigel Neo, Yeon-Chang Lee, Yiqiao Jin, Sang-Wook Kim, Srijan Kumar,
- Abstract要約: ソーシャルメディアプラットフォームであるRedditとTwitterから構築した2つの新しいデータセットを提示する。
これらのデータセットは、それぞれ9,000ノードと47,000ノードに関連付けられた120万エッジと40万エッジで構成されている。
本研究では,9つの既存GAD法および非グラフAD法における5つの最先端公正法の性能・公正トレードオフについて検討する。
- 参考スコア(独自算出の注目度): 35.94179416767176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Fair Graph Anomaly Detection (FairGAD) problem aims to accurately detect anomalous nodes in an input graph while avoiding biased predictions against individuals from sensitive subgroups. However, the current literature does not comprehensively discuss this problem, nor does it provide realistic datasets that encompass actual graph structures, anomaly labels, and sensitive attributes. To bridge this gap, we introduce a formal definition of the FairGAD problem and present two novel datasets constructed from the social media platforms Reddit and Twitter. These datasets comprise 1.2 million and 400,000 edges associated with 9,000 and 47,000 nodes, respectively, and leverage political leanings as sensitive attributes and misinformation spreaders as anomaly labels. We demonstrate that our FairGAD datasets significantly differ from the synthetic datasets used by the research community. Using our datasets, we investigate the performance-fairness trade-off in nine existing GAD and non-graph AD methods on five state-of-the-art fairness methods. Our code and datasets are available at https://github.com/nigelnnk/FairGAD
- Abstract(参考訳): Fair Graph Anomaly Detection (FairGAD) 問題は、センシティブなサブグループからの個人に対するバイアス予測を避けながら、入力グラフ内の異常ノードを正確に検出することを目的としている。
しかし、現在の文献ではこの問題を包括的に論じておらず、実際のグラフ構造、異常ラベル、センシティブな属性を含む現実的なデータセットも提供していない。
このギャップを埋めるために、FairGAD問題の公式定義を導入し、RedditとTwitterのソーシャルメディアプラットフォームから構築された2つの新しいデータセットを提示する。
これらのデータセットは、それぞれ9,000ノードと47,000ノードに関連付けられた120万と40万のエッジで構成され、政治的傾きを機密属性として、誤情報拡散器を異常ラベルとして活用する。
その結果,FairGADデータセットは,研究コミュニティが使用する合成データセットと大きく異なることがわかった。
そこで本研究では,既存の9つのGAD法および非グラフAD法の性能・公平性のトレードオフについて検討した。
私たちのコードとデータセットはhttps://github.com/nigelnnk/FairGADで公開されています。
関連論文リスト
- Disentangled Structural and Featural Representation for Task-Agnostic Graph Valuation [9.633110326799992]
我々は、共有ノード置換を用いて売り手と買い手のグラフを整列させる、ブラインドメッセージパッシングと呼ばれる新しいフレームワークを導入する。
次に、データ評価のための買い手と売り手のグラフの偉業的な側面を検討し、それらの統計的類似点と相違点を捉える。
当社のアプローチは、買い手と売り手がお互いのデータセットに気付かないことを保証するものです。
論文 参考訳(メタデータ) (2024-08-22T18:05:41Z) - Enhancing Fairness in Unsupervised Graph Anomaly Detection through Disentanglement [33.565252991113766]
グラフ異常検出(GAD)は、金融詐欺検出から偽ニュース検出まで、さまざまなアプリケーションにおいてますます重要になっている。
現在のGAD法は主に公平性の問題を見落としており、特定の人口集団に対して差別的な決定が下される可能性がある。
DeFENDという属性グラフ上に,DisEntangle-based FairnEss-aware aNomaly Detectionフレームワークを考案した。
実世界のデータセットに対する実証的な評価から、DEFENDはGADにおいて効果的に機能し、最先端のベースラインと比較して公正性を著しく向上することが明らかとなった。
論文 参考訳(メタデータ) (2024-06-03T04:48:45Z) - DPGAN: A Dual-Path Generative Adversarial Network for Missing Data Imputation in Graphs [17.847551850315895]
本稿では,DPGAN(Dual-Pathrative Adversarial Network)と呼ばれる新しいフレームワークを提案する。
DPGANは、欠落したデータと同時に処理し、過度にスムースな問題を回避することができる。
さまざまなベンチマークデータセットにわたる総合的な実験は、DPGANが既存の最先端の計算アルゴリズムよりも優れていなくても、一貫して競合していることを裏付けている。
論文 参考訳(メタデータ) (2024-04-26T05:26:10Z) - GraphPub: Generation of Differential Privacy Graph with High
Availability [21.829551460549936]
差分プライバシー(DP)は、グラフデータのプライバシーを保護する一般的な方法である。
グラフデータの複雑なトポロジ構造のため、グラフにDPを適用すると、GNNモデルのメッセージパッシングや集約に影響を及ぼすことが多い。
グラフトポロジを保護しつつ,データの可用性が基本的に変化しないことを保証するグラフパブリッシャ(GraphPub)を提案する。
論文 参考訳(メタデータ) (2024-02-28T20:02:55Z) - Deep Manifold Graph Auto-Encoder for Attributed Graph Embedding [51.75091298017941]
本稿では,属性付きグラフデータに対する新しいDeep Manifold (Variational) Graph Auto-Encoder (DMVGAE/DMGAE)を提案する。
提案手法は,最先端のベースラインアルゴリズムを,一般的なデータセット間でのダウンストリームタスクの差を大きく越える。
論文 参考訳(メタデータ) (2024-01-12T17:57:07Z) - BOURNE: Bootstrapped Self-supervised Learning Framework for Unified
Graph Anomaly Detection [50.26074811655596]
自己指導型自己学習(BOURNE)に基づく新しい統合グラフ異常検出フレームワークを提案する。
ノードとエッジ間のコンテキスト埋め込みを交換することで、ノードとエッジの異常を相互に検出できる。
BOURNEは、負のサンプリングを必要としないため、大きなグラフを扱う際の効率を高めることができる。
論文 参考訳(メタデータ) (2023-07-28T00:44:57Z) - DGraph: A Large-Scale Financial Dataset for Graph Anomaly Detection [23.88646583483315]
グラフ異常検出(GAD)はその実用性と理論的価値から最近ホットな研究スポットとなっている。
本稿では,金融分野における実世界の動的グラフであるDGraphについて述べる。
約3Mノード、4Mダイナミックエッジ、1Mグランドトゥルースノードを含む。
論文 参考訳(メタデータ) (2022-06-30T07:16:03Z) - Deep Graph-level Anomaly Detection by Glocal Knowledge Distillation [61.39364567221311]
グラフレベルの異常検出(GAD)は、その構造やノードの特徴に異常なグラフを検出する問題を記述している。
GADの課題の1つは、局所的および大域的非正則グラフの検出を可能にするグラフ表現を考案することである。
本稿では,グラフとノード表現の連成ランダム蒸留により,グローバルおよびローカルな正規パターン情報を豊富に学習するGADのための新しい深部異常検出手法を提案する。
論文 参考訳(メタデータ) (2021-12-19T05:04:53Z) - Source Free Unsupervised Graph Domain Adaptation [60.901775859601685]
Unsupervised Graph Domain Adaptation (UGDA) はノード分類のラベル付けコストを削減するための実用的価値を示している。
既存のUGDAメソッドの多くは、ソースドメインのラベル付きグラフに大きく依存している。
現実のシナリオでは、ソースグラフはプライバシーの問題のためにアクセスできない。
我々は、Source Free Unsupervised Graph Domain Adaptation (SFUGDA) という新しいシナリオを提案する。
論文 参考訳(メタデータ) (2021-12-02T03:18:18Z) - Alleviating the Inconsistency Problem of Applying Graph Neural Network
to Fraud Detection [78.88163190021798]
不整合問題に対処するために、新しいGNNフレームワークである$mathsfGraphConsis$を導入します。
4つのデータセットの実証分析は、不正検出タスクにおいて不整合の問題が不可欠であることを示唆している。
我々はまた、SOTAモデルを実装したGNNベースの不正検出ツールボックスもリリースした。
論文 参考訳(メタデータ) (2020-05-01T21:43:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。