論文の概要: You too Brutus! Trapping Hateful Users in Social Media: Challenges,
Solutions & Insights
- arxiv url: http://arxiv.org/abs/2108.00524v1
- Date: Sun, 1 Aug 2021 19:13:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:31:40.176188
- Title: You too Brutus! Trapping Hateful Users in Social Media: Challenges,
Solutions & Insights
- Title(参考訳): あなたもブルータス!
ソーシャルメディアにおける有害ユーザ追跡 - 課題、解決策、洞察
- Authors: Mithun Das, Punyajoy Saha, Ritam Dutt, Pawan Goyal, Animesh Mukherjee
and Binny Mathew
- Abstract要約: ヘイトスピーチは、オンラインソーシャルメディアを悩ませる重要な問題の1つだ。
問題空間の詳細な探索を行い、グラフニューラルネットワーク(GNN)を用いたモデルの配列を調査した。
テキストおよびグラフベースモデル上でのエラー解析を行い、憎しみのあるユーザが独自のネットワーク近傍シグネチャを持っていることを観察する。
- 参考スコア(独自算出の注目度): 11.266863752167678
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hate speech is regarded as one of the crucial issues plaguing the online
social media. The current literature on hate speech detection leverages
primarily the textual content to find hateful posts and subsequently identify
hateful users. However, this methodology disregards the social connections
between users. In this paper, we run a detailed exploration of the problem
space and investigate an array of models ranging from purely textual to graph
based to finally semi-supervised techniques using Graph Neural Networks (GNN)
that utilize both textual and graph-based features. We run exhaustive
experiments on two datasets -- Gab, which is loosely moderated and Twitter,
which is strictly moderated. Overall the AGNN model achieves 0.791 macro
F1-score on the Gab dataset and 0.780 macro F1-score on the Twitter dataset
using only 5% of the labeled instances, considerably outperforming all the
other models including the fully supervised ones. We perform detailed error
analysis on the best performing text and graph based models and observe that
hateful users have unique network neighborhood signatures and the AGNN model
benefits by paying attention to these signatures. This property, as we observe,
also allows the model to generalize well across platforms in a zero-shot
setting. Lastly, we utilize the best performing GNN model to analyze the
evolution of hateful users and their targets over time in Gab.
- Abstract(参考訳): ヘイトスピーチは、オンラインソーシャルメディアを悩ませる重要な問題の1つと見なされている。
ヘイトスピーチ検出に関する現在の文献は、主にテキストコンテンツを利用してヘイトな投稿を見つけ、その後にヘイトなユーザーを特定する。
しかし,この手法はユーザ間の社会的つながりを無視している。
本稿では,問題空間の詳細な探索を行い,テキスト的特徴とグラフ的特徴を両立したグラフニューラルネットワーク(gnn)を用いた,純粋にテキスト的からグラフ的なモデルから,最終的に半教師付き手法まで多岐にわたるモデルについて検討する。
Gabは緩やかに中和され、Twitterは厳格に中和されています。
全体としてagnnモデルはgabデータセット上では0.791マクロf1-score、twitterデータセット上では0.780マクロf1-scoreを達成している。
本稿では,テキストとグラフをベースとした最良のモデルに対して詳細なエラー解析を行い,憎しみのあるユーザが独自のネットワーク近傍シグネチャとAGNNモデルを持つことを観察する。
この性質は、観測したように、ゼロショット設定でプラットフォーム間でモデルをうまく一般化することを可能にする。
最後に,ベストパフォーマンスGNNモデルを用いて,ガブにおけるヘイトフルユーザとそのターゲットの進化を時間とともに分析する。
関連論文リスト
- Two-Stage Stance Labeling: User-Hashtag Heuristics with Graph Neural Networks [2.474908349649168]
ユーザ・ハッシュタグ二部グラフとユーザ・ユーザ・インタラクショングラフを利用する2段階のスタンスラベリング手法を開発した。
第1段階では、スタンスラベルの簡易かつ効率的な方法は、ユーザとハッシュタグノードのスタンス関連を更新するために、ユーザハッシュタグ二部グラフを使用する。
このソフトラベルのセットは、ユーザとユーザのインタラクショングラフに統合され、グラフニューラルネットワーク(GNN)モデルをトレーニングする。
論文 参考訳(メタデータ) (2024-04-16T02:18:30Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - Revisiting Hate Speech Benchmarks: From Data Curation to System
Deployment [26.504056750529124]
GOTHateは、Twitterからヘイトスピーチを検出するために約51万の投稿をクラウドソースした大規模クラウドソースデータセットである。
最近の10のベースラインでベンチマークを行い、内因性信号の追加がヘイトスピーチ検出タスクをどのように強化するかを検討する。
我々のHEN-mBERTは多言語混合実験モデルであり、潜在内因性信号で言語的部分空間を豊かにする。
論文 参考訳(メタデータ) (2023-06-01T19:36:52Z) - DoubleH: Twitter User Stance Detection via Bipartite Graph Neural
Networks [9.350629400940493]
2020年の米国大統領選挙の大規模なデータセットをクロールし、手動でタグ付けされたハッシュタグによって、すべてのユーザーを自動的にラベル付けします。
本稿では,二部グラフニューラルネットワークモデルであるDoubleHを提案する。
論文 参考訳(メタデータ) (2023-01-20T19:20:10Z) - Model Inversion Attacks against Graph Neural Networks [65.35955643325038]
グラフニューラルネットワーク(GNN)に対するモデル反転攻撃について検討する。
本稿では,プライベートトレーニンググラフデータを推測するためにGraphMIを提案する。
実験の結果,このような防御効果は十分ではないことが示され,プライバシー攻撃に対するより高度な防御が求められている。
論文 参考訳(メタデータ) (2022-09-16T09:13:43Z) - Graph Generative Model for Benchmarking Graph Neural Networks [73.11514658000547]
本稿では,プライバシ制御により実世界のグラフの分布を学習し,再現する新しいグラフ生成モデルを提案する。
我々のモデルは、GNNモデルのベンチマークに効果的に使用できる大規模な実世界のグラフの、プライバシ制御された合成代用をうまく生成することができる。
論文 参考訳(メタデータ) (2022-07-10T06:42:02Z) - Evidential Temporal-aware Graph-based Social Event Detection via
Dempster-Shafer Theory [76.4580340399321]
ETGNN(Evidential Temporal-aware Graph Neural Network)を提案する。
ノードがテキストであり、エッジがそれぞれ複数の共有要素によって決定されるビュー固有グラフを構築する。
ビュー固有の不確実性を考慮すると、すべてのビューの表現は、明らかなディープラーニング(EDL)ニューラルネットワークを介してマス関数に変換される。
論文 参考訳(メタデータ) (2022-05-24T16:22:40Z) - Detecting Online Hate Speech: Approaches Using Weak Supervision and
Network Embedding Models [2.3322477552758234]
本研究では,ヘイトフルユーザを定量的に発見する弱監督型深層学習モデルを提案する。
我々は、19.2Mの投稿において、我々のモデルを評価し、我々の弱い監督モデルは、間接的に憎悪的な相互作用を識別するベースラインモデルよりも優れていることを示す。
また,Gabにおける2種類のユーザインタラクション(引用と応答)と,弱監督モデルからのインタラクションスコアをエッジウェイトとして分析し,ヘイトフルユーザを予測する。
論文 参考訳(メタデータ) (2020-07-24T18:13:52Z) - Stealing Links from Graph Neural Networks [72.85344230133248]
最近、ニューラルネットワークはグラフニューラルネットワーク(GNN)として知られるグラフデータに拡張された。
優れたパフォーマンスのため、GNNは医療分析、レコメンダシステム、不正検出など多くのアプリケーションを持っている。
グラフ上でトレーニングされたGNNモデルの出力からグラフを盗む最初の攻撃を提案する。
論文 参考訳(メタデータ) (2020-05-05T13:22:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。