論文の概要: Towards Fair Graph Anomaly Detection: Problem, New Datasets, and
Evaluation
- arxiv url: http://arxiv.org/abs/2402.15988v1
- Date: Sun, 25 Feb 2024 05:00:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-27 16:03:35.934380
- Title: Towards Fair Graph Anomaly Detection: Problem, New Datasets, and
Evaluation
- Title(参考訳): 公正なグラフ異常検出に向けて:問題,新しいデータセット,評価
- Authors: Neng Kai Nigel Neo, Yeon-Chang Lee, Yiqiao Jin, Sang-Wook Kim, Srijan
Kumar
- Abstract要約: 本稿では、FairGAD問題の公式定義と、世界的に有名なソーシャルメディアプラットフォームであるRedditとTwitterから構築された2つの新しいグラフデータセットについて紹介する。
研究コミュニティが現在使用している合成データセットと,FairGADデータセットとは大きく異なることを示す。
本データセットを用いて,既存のGAD11手法と非グラフAD法を用いて,5つの最先端フェアネス法の性能・公正トレードオフについて検討した。
- 参考スコア(独自算出の注目度): 38.56000845636737
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Fair Graph Anomaly Detection (FairGAD) problem aims to accurately detect
anomalous nodes in an input graph while ensuring fairness and avoiding biased
predictions against individuals from sensitive subgroups such as gender or
political leanings. Fairness in graphs is particularly crucial in anomaly
detection areas such as misinformation detection in search/ranking systems,
where decision outcomes can significantly affect individuals. However, the
current literature does not comprehensively discuss this problem, nor does it
provide realistic datasets that encompass actual graph structures, anomaly
labels, and sensitive attributes for research in FairGAD. To bridge this gap,
we introduce a formal definition of the FairGAD problem and present two novel
graph datasets constructed from the globally prominent social media platforms
Reddit and Twitter. These datasets comprise 1.2 million and 400,000 edges
associated with 9,000 and 47,000 nodes, respectively, and leverage political
leanings as sensitive attributes and misinformation spreaders as anomaly
labels. We demonstrate that our FairGAD datasets significantly differ from the
synthetic datasets used currently by the research community. These new datasets
offer significant values for FairGAD by providing realistic data that captures
the intricacies of social networks. Using our datasets, we investigate the
performance-fairness trade-off in eleven existing GAD and non-graph AD methods
on five state-of-the-art fairness methods, which sheds light on their
effectiveness and limitations in addressing the FairGAD problem.
- Abstract(参考訳): Fair Graph Anomaly Detection (FairGAD) 問題は、公正性を確保しつつ、性別や政治的傾きなどの敏感なサブグループからの個人に対するバイアス予測を避けながら、入力グラフ内の異常ノードを正確に検出することを目的としている。
グラフの公正性は検索・ランク付けシステムにおける誤情報検出などの異常検出領域において特に重要である。
しかし、現在の文献ではこの問題を包括的に論じておらず、FairGADの研究のための実際のグラフ構造、異常ラベル、センシティブな属性を含む現実的なデータセットも提供していない。
このギャップを埋めるために,fairgad問題の形式的定義を導入し,世界規模のソーシャルメディアプラットフォームであるredditとtwitterから構築した2つの新しいグラフデータセットを提案する。
これらのデータセットはそれぞれ9,000ノードと47,000ノードの120万エッジと40万エッジで構成され、政治的傾向を機密属性として、誤った情報スプレッダーを異常ラベルとして活用している。
研究コミュニティが現在使用している合成データセットとFairGADデータセットとは大きく異なることを示す。
これらの新しいデータセットは、ソーシャルネットワークの複雑さを捉える現実的なデータを提供することによって、FairGADにとって重要な価値を提供する。
そこで本研究では,既存gadおよび非graphの5つのフェアネス法におけるパフォーマンス・フェアネストレードオフについて検討し,fairgad問題に対する効果と限界について考察した。
関連論文リスト
- FGAD: Self-boosted Knowledge Distillation for An Effective Federated
Graph Anomaly Detection Framework [33.62637380192881]
グラフ異常検出(GAD)は、他のグラフと大きく異なる異常グラフを特定することを目的としている。
既存のGADメソッドは通常、集中的なトレーニングで実行される。
本稿では,これらの課題に対処する効果的なフェデレーショングラフ異常検出フレームワーク(FGAD)を提案する。
論文 参考訳(メタデータ) (2024-02-20T07:03:59Z) - MAPPING: Debiasing Graph Neural Networks for Fair Node Classification
with Limited Sensitive Information Leakage [1.8238848494579714]
公正ノード分類のためのモデルに依存しない新しい脱バイアスフレームワーク MAPPing を提案する。
以上の結果から,MAPPingは実用性と公正性,および機密情報漏洩のプライバシーリスクとのトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2024-01-23T14:59:46Z) - The Impact of Differential Feature Under-reporting on Algorithmic Fairness [86.275300739926]
解析的に抽出可能な差分特徴のアンダーレポーティングモデルを提案する。
そして、この種のデータバイアスがアルゴリズムの公正性に与える影響を特徴づける。
我々の結果は、実世界のデータ設定では、アンダーレポートが典型的に格差を増大させることを示している。
論文 参考訳(メタデータ) (2024-01-16T19:16:22Z) - GraphGuard: Detecting and Counteracting Training Data Misuse in Graph
Neural Networks [69.97213941893351]
グラフデータ分析におけるグラフニューラルネットワーク(GNN)の出現は、モデルトレーニング中のデータ誤用に関する重要な懸念を引き起こしている。
既存の手法は、データ誤用検出または緩和のいずれかに対応しており、主にローカルGNNモデル用に設計されている。
本稿では,これらの課題に対処するため,GraphGuardという先駆的なアプローチを導入する。
論文 参考訳(メタデータ) (2023-12-13T02:59:37Z) - Few-shot Message-Enhanced Contrastive Learning for Graph Anomaly
Detection [15.757864894708364]
グラフ異常検出は、多数派から大きく逸脱するグラフデータの例外的なインスタンスを特定する上で重要な役割を果たす。
我々はFMGADと呼ばれる新しい数ショットグラフ異常検出モデルを提案する。
FMGADは, 人工的に注入された異常やドメイン・有機異常によらず, 他の最先端手法よりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2023-11-17T07:49:20Z) - BOURNE: Bootstrapped Self-supervised Learning Framework for Unified
Graph Anomaly Detection [50.26074811655596]
自己指導型自己学習(BOURNE)に基づく新しい統合グラフ異常検出フレームワークを提案する。
ノードとエッジ間のコンテキスト埋め込みを交換することで、ノードとエッジの異常を相互に検出できる。
BOURNEは、負のサンプリングを必要としないため、大きなグラフを扱う際の効率を高めることができる。
論文 参考訳(メタデータ) (2023-07-28T00:44:57Z) - Impact Of Missing Data Imputation On The Fairness And Accuracy Of Graph
Node Classifiers [0.19573380763700707]
グラフデータ(ノード属性)インプットの文脈における公平性への影響を,埋め込みとニューラルネットワークの異なる手法を用いて解析する。
この結果から,グラフデータの公平性や,グラフの欠落を効率的に処理する方法について,貴重な知見が得られる。
論文 参考訳(メタデータ) (2022-11-01T23:16:36Z) - D-BIAS: A Causality-Based Human-in-the-Loop System for Tackling
Algorithmic Bias [57.87117733071416]
D-BIASは、人間のループ内AIアプローチを具現化し、社会的バイアスを監査し軽減する視覚対話型ツールである。
ユーザは、因果ネットワークにおける不公平な因果関係を識別することにより、グループに対する偏見の存在を検出することができる。
それぞれのインタラクション、例えばバイアスのある因果縁の弱体化/削除は、新しい(偏りのある)データセットをシミュレートするために、新しい方法を用いている。
論文 参考訳(メタデータ) (2022-08-10T03:41:48Z) - From Unsupervised to Few-shot Graph Anomaly Detection: A Multi-scale
Contrastive Learning Approach [49.439021563395976]
グラフデータからの異常検出は、ソーシャルネットワーク、金融、eコマースなど、多くのアプリケーションにおいて重要なデータマイニングタスクである。
マルチスケールcONtrastive lEarning(略してANEMONE)を用いた新しいフレームワーク, graph Anomaly dEtection フレームワークを提案する。
グラフニューラルネットワークをバックボーンとして、複数のグラフスケール(ビュー)から情報をエンコードすることで、グラフ内のノードのより良い表現を学習する。
論文 参考訳(メタデータ) (2022-02-11T09:45:11Z) - A Comprehensive Survey on Graph Anomaly Detection with Deep Learning [37.83120827837028]
異常は稀な観測(例えば、データ記録や出来事)であり、他のものとは大きく異なる。
本研究では,グラフ異常検出のための現代のディープラーニング技術について,体系的かつ包括的にレビューすることを目的とする。
論文 参考訳(メタデータ) (2021-06-14T06:04:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。