論文の概要: Towards Fair Graph Anomaly Detection: Problem, New Datasets, and
Evaluation
- arxiv url: http://arxiv.org/abs/2402.15988v1
- Date: Sun, 25 Feb 2024 05:00:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-27 16:03:35.934380
- Title: Towards Fair Graph Anomaly Detection: Problem, New Datasets, and
Evaluation
- Title(参考訳): 公正なグラフ異常検出に向けて:問題,新しいデータセット,評価
- Authors: Neng Kai Nigel Neo, Yeon-Chang Lee, Yiqiao Jin, Sang-Wook Kim, Srijan
Kumar
- Abstract要約: 本稿では、FairGAD問題の公式定義と、世界的に有名なソーシャルメディアプラットフォームであるRedditとTwitterから構築された2つの新しいグラフデータセットについて紹介する。
研究コミュニティが現在使用している合成データセットと,FairGADデータセットとは大きく異なることを示す。
本データセットを用いて,既存のGAD11手法と非グラフAD法を用いて,5つの最先端フェアネス法の性能・公正トレードオフについて検討した。
- 参考スコア(独自算出の注目度): 38.56000845636737
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Fair Graph Anomaly Detection (FairGAD) problem aims to accurately detect
anomalous nodes in an input graph while ensuring fairness and avoiding biased
predictions against individuals from sensitive subgroups such as gender or
political leanings. Fairness in graphs is particularly crucial in anomaly
detection areas such as misinformation detection in search/ranking systems,
where decision outcomes can significantly affect individuals. However, the
current literature does not comprehensively discuss this problem, nor does it
provide realistic datasets that encompass actual graph structures, anomaly
labels, and sensitive attributes for research in FairGAD. To bridge this gap,
we introduce a formal definition of the FairGAD problem and present two novel
graph datasets constructed from the globally prominent social media platforms
Reddit and Twitter. These datasets comprise 1.2 million and 400,000 edges
associated with 9,000 and 47,000 nodes, respectively, and leverage political
leanings as sensitive attributes and misinformation spreaders as anomaly
labels. We demonstrate that our FairGAD datasets significantly differ from the
synthetic datasets used currently by the research community. These new datasets
offer significant values for FairGAD by providing realistic data that captures
the intricacies of social networks. Using our datasets, we investigate the
performance-fairness trade-off in eleven existing GAD and non-graph AD methods
on five state-of-the-art fairness methods, which sheds light on their
effectiveness and limitations in addressing the FairGAD problem.
- Abstract(参考訳): Fair Graph Anomaly Detection (FairGAD) 問題は、公正性を確保しつつ、性別や政治的傾きなどの敏感なサブグループからの個人に対するバイアス予測を避けながら、入力グラフ内の異常ノードを正確に検出することを目的としている。
グラフの公正性は検索・ランク付けシステムにおける誤情報検出などの異常検出領域において特に重要である。
しかし、現在の文献ではこの問題を包括的に論じておらず、FairGADの研究のための実際のグラフ構造、異常ラベル、センシティブな属性を含む現実的なデータセットも提供していない。
このギャップを埋めるために,fairgad問題の形式的定義を導入し,世界規模のソーシャルメディアプラットフォームであるredditとtwitterから構築した2つの新しいグラフデータセットを提案する。
これらのデータセットはそれぞれ9,000ノードと47,000ノードの120万エッジと40万エッジで構成され、政治的傾向を機密属性として、誤った情報スプレッダーを異常ラベルとして活用している。
研究コミュニティが現在使用している合成データセットとFairGADデータセットとは大きく異なることを示す。
これらの新しいデータセットは、ソーシャルネットワークの複雑さを捉える現実的なデータを提供することによって、FairGADにとって重要な価値を提供する。
そこで本研究では,既存gadおよび非graphの5つのフェアネス法におけるパフォーマンス・フェアネストレードオフについて検討し,fairgad問題に対する効果と限界について考察した。
関連論文リスト
- Disentangled Structural and Featural Representation for Task-Agnostic Graph Valuation [9.633110326799992]
我々は、共有ノード置換を用いて売り手と買い手のグラフを整列させる、ブラインドメッセージパッシングと呼ばれる新しいフレームワークを導入する。
次に、データ評価のための買い手と売り手のグラフの偉業的な側面を検討し、それらの統計的類似点と相違点を捉える。
当社のアプローチは、買い手と売り手がお互いのデータセットに気付かないことを保証するものです。
論文 参考訳(メタデータ) (2024-08-22T18:05:41Z) - Enhancing Fairness in Unsupervised Graph Anomaly Detection through Disentanglement [33.565252991113766]
グラフ異常検出(GAD)は、金融詐欺検出から偽ニュース検出まで、さまざまなアプリケーションにおいてますます重要になっている。
現在のGAD法は主に公平性の問題を見落としており、特定の人口集団に対して差別的な決定が下される可能性がある。
DeFENDという属性グラフ上に,DisEntangle-based FairnEss-aware aNomaly Detectionフレームワークを考案した。
実世界のデータセットに対する実証的な評価から、DEFENDはGADにおいて効果的に機能し、最先端のベースラインと比較して公正性を著しく向上することが明らかとなった。
論文 参考訳(メタデータ) (2024-06-03T04:48:45Z) - DPGAN: A Dual-Path Generative Adversarial Network for Missing Data Imputation in Graphs [17.847551850315895]
本稿では,DPGAN(Dual-Pathrative Adversarial Network)と呼ばれる新しいフレームワークを提案する。
DPGANは、欠落したデータと同時に処理し、過度にスムースな問題を回避することができる。
さまざまなベンチマークデータセットにわたる総合的な実験は、DPGANが既存の最先端の計算アルゴリズムよりも優れていなくても、一貫して競合していることを裏付けている。
論文 参考訳(メタデータ) (2024-04-26T05:26:10Z) - GraphPub: Generation of Differential Privacy Graph with High
Availability [21.829551460549936]
差分プライバシー(DP)は、グラフデータのプライバシーを保護する一般的な方法である。
グラフデータの複雑なトポロジ構造のため、グラフにDPを適用すると、GNNモデルのメッセージパッシングや集約に影響を及ぼすことが多い。
グラフトポロジを保護しつつ,データの可用性が基本的に変化しないことを保証するグラフパブリッシャ(GraphPub)を提案する。
論文 参考訳(メタデータ) (2024-02-28T20:02:55Z) - Deep Manifold Graph Auto-Encoder for Attributed Graph Embedding [51.75091298017941]
本稿では,属性付きグラフデータに対する新しいDeep Manifold (Variational) Graph Auto-Encoder (DMVGAE/DMGAE)を提案する。
提案手法は,最先端のベースラインアルゴリズムを,一般的なデータセット間でのダウンストリームタスクの差を大きく越える。
論文 参考訳(メタデータ) (2024-01-12T17:57:07Z) - BOURNE: Bootstrapped Self-supervised Learning Framework for Unified
Graph Anomaly Detection [50.26074811655596]
自己指導型自己学習(BOURNE)に基づく新しい統合グラフ異常検出フレームワークを提案する。
ノードとエッジ間のコンテキスト埋め込みを交換することで、ノードとエッジの異常を相互に検出できる。
BOURNEは、負のサンプリングを必要としないため、大きなグラフを扱う際の効率を高めることができる。
論文 参考訳(メタデータ) (2023-07-28T00:44:57Z) - DGraph: A Large-Scale Financial Dataset for Graph Anomaly Detection [23.88646583483315]
グラフ異常検出(GAD)はその実用性と理論的価値から最近ホットな研究スポットとなっている。
本稿では,金融分野における実世界の動的グラフであるDGraphについて述べる。
約3Mノード、4Mダイナミックエッジ、1Mグランドトゥルースノードを含む。
論文 参考訳(メタデータ) (2022-06-30T07:16:03Z) - Deep Graph-level Anomaly Detection by Glocal Knowledge Distillation [61.39364567221311]
グラフレベルの異常検出(GAD)は、その構造やノードの特徴に異常なグラフを検出する問題を記述している。
GADの課題の1つは、局所的および大域的非正則グラフの検出を可能にするグラフ表現を考案することである。
本稿では,グラフとノード表現の連成ランダム蒸留により,グローバルおよびローカルな正規パターン情報を豊富に学習するGADのための新しい深部異常検出手法を提案する。
論文 参考訳(メタデータ) (2021-12-19T05:04:53Z) - Source Free Unsupervised Graph Domain Adaptation [60.901775859601685]
Unsupervised Graph Domain Adaptation (UGDA) はノード分類のラベル付けコストを削減するための実用的価値を示している。
既存のUGDAメソッドの多くは、ソースドメインのラベル付きグラフに大きく依存している。
現実のシナリオでは、ソースグラフはプライバシーの問題のためにアクセスできない。
我々は、Source Free Unsupervised Graph Domain Adaptation (SFUGDA) という新しいシナリオを提案する。
論文 参考訳(メタデータ) (2021-12-02T03:18:18Z) - Alleviating the Inconsistency Problem of Applying Graph Neural Network
to Fraud Detection [78.88163190021798]
不整合問題に対処するために、新しいGNNフレームワークである$mathsfGraphConsis$を導入します。
4つのデータセットの実証分析は、不正検出タスクにおいて不整合の問題が不可欠であることを示唆している。
我々はまた、SOTAモデルを実装したGNNベースの不正検出ツールボックスもリリースした。
論文 参考訳(メタデータ) (2020-05-01T21:43:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。