論文の概要: Countering hate on social media: Large scale classification of hate and
counter speech
- arxiv url: http://arxiv.org/abs/2006.01974v3
- Date: Fri, 5 Jun 2020 20:38:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 01:22:50.369310
- Title: Countering hate on social media: Large scale classification of hate and
counter speech
- Title(参考訳): ソーシャルメディアにおけるヘイト対策 : ヘイトとカウンタースピーチの大規模分類
- Authors: Joshua Garland and Keyan Ghazi-Zahedi and Jean-Gabriel Young and
Laurent H\'ebert-Dufresne and Mirta Galesic
- Abstract要約: 憎しみに満ちたレトリックは、オンラインの議論をかき立て、極端な社会運動を育み、現実世界の暴力を引き起こす可能性がある。
潜在的な解決策は、市民が憎悪に満ちた会話を積極的に行い、市民の非分極的な言論を復活させようとする市民生成の対決演説である。
ここではドイツのユニークな状況を利用して、オンラインヘイトとカウンタースピーチの組織化に従事した。
我々は,様々な段落埋め込みと正規化ロジスティック回帰関数を組み合わさったアンサンブル学習アルゴリズムを用いて,これらの2つのグループから集めた何百万もの関連ツイートのコーパスにおいて,ヘイトとカウンタースピーチの両方を分類した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hateful rhetoric is plaguing online discourse, fostering extreme societal
movements and possibly giving rise to real-world violence. A potential solution
to this growing global problem is citizen-generated counter speech where
citizens actively engage in hate-filled conversations to attempt to restore
civil non-polarized discourse. However, its actual effectiveness in curbing the
spread of hatred is unknown and hard to quantify. One major obstacle to
researching this question is a lack of large labeled data sets for training
automated classifiers to identify counter speech. Here we made use of a unique
situation in Germany where self-labeling groups engaged in organized online
hate and counter speech. We used an ensemble learning algorithm which pairs a
variety of paragraph embeddings with regularized logistic regression functions
to classify both hate and counter speech in a corpus of millions of relevant
tweets from these two groups. Our pipeline achieved macro F1 scores on out of
sample balanced test sets ranging from 0.76 to 0.97---accuracy in line and even
exceeding the state of the art. On thousands of tweets, we used crowdsourcing
to verify that the judgments made by the classifier are in close alignment with
human judgment. We then used the classifier to discover hate and counter speech
in more than 135,000 fully-resolved Twitter conversations occurring from 2013
to 2018 and study their frequency and interaction. Altogether, our results
highlight the potential of automated methods to evaluate the impact of
coordinated counter speech in stabilizing conversations on social media.
- Abstract(参考訳): 憎しみに満ちたレトリックは、オンラインの議論をかき立て、極端な社会運動を促進し、現実世界の暴力を引き起こす可能性がある。
この世界的な問題に対する潜在的な解決策は、市民が憎しみに満ちた会話を積極的に行い、市民の非分極的言論を復活させようとする、市民生成のカウンタースピーチである。
しかし、憎悪の拡散を抑制する実際の効果は不明であり、定量化が難しい。
この問題を研究する上での大きな障害は、カウンター音声を識別するための自動分類器を訓練するための大きなラベル付きデータセットがないことである。
ここではドイツのユニークな状況を利用して、オンラインヘイトとカウンタースピーチの組織化に従事した。
我々は,複数の段落埋め込みと正規化ロジスティック回帰関数を組み合わさったアンサンブル学習アルゴリズムを用いて,これらのグループから何百万もの関連ツイートを抽出した。
サンプルバランステストセットのうち0.76から0.97--の範囲でマクロf1得点を達成し,その精度は最先端にさえ達した。
何千ものツイートで、私たちはクラウドソーシングを使用して、分類者による判断が人間の判断と密接に一致していることを確認する。
そして、この分類器を使って、2013年から2018年にかけて発生した135,000件以上の完全に解決されたTwitterの会話を分析し、それらの頻度と対話を研究しました。
また,ソーシャルメディア上での会話の安定化におけるコーディネート音声の効果を評価するための自動手法の可能性も明らかにした。
関連論文リスト
- When the Majority is Wrong: Modeling Annotator Disagreement for Subjective Tasks [45.14664901245331]
ヘイトスピーチの検出における重要な問題は、ある声明が人口集団に対して攻撃的であるかどうかを決定することである。
我々は、潜在的に攻撃的なテキストに基づいて、個々のアノテータ評価を予測するモデルを構築した。
その結果、アノテータの評価は、その人口統計情報とオンラインコンテンツに関する意見を用いて予測できることがわかった。
論文 参考訳(メタデータ) (2023-05-11T07:55:20Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - Collective moderation of hate, toxicity, and extremity in online
discussions [1.114199733551736]
われわれはTwitter上で4年間に13万件以上の議論を交わした大規模なコーパスを分析した。
我々は、後続のつぶやきにおけるヘイトスピーチの確率に関係している可能性のある、さまざまな談話の次元を識別する。
事実によって必ずしも支持されない単純な意見を表現することは、その後の議論において最も憎悪に関係している。
論文 参考訳(メタデータ) (2023-03-01T09:35:26Z) - Parsimonious Argument Annotations for Hate Speech Counter-narratives [4.825848785596437]
本稿では、ヘイトスピーチツイートのHatevalコーパス(Basile et al.)を充実させ、自動対ナラティブ生成を容易にする。
我々はまた、Wagemannsに基づく議論的な情報付きツイートを注釈付けし、特定のグループに対するヘイトスピーチに対して、説得力があり効果的な反ナラティブを構築するのに役立つと信じている。
予備的な結果は、自動アノテータが人間のアノテータに近づき、議論のいくつかの側面を検知する一方で、他のアノテータは低レベルまたは中程度のアノテータ間合意にしか到達しないことを示している。
論文 参考訳(メタデータ) (2022-08-01T18:58:32Z) - AlexU-AIC at Arabic Hate Speech 2022: Contrast to Classify [2.9220076568786326]
アラビア・ヘイトスピーチ2022共有タスクワークショップ(OSACT52022)に、関連するアラビア・Twitterデータセットを用いて提出する。
攻撃的なツイートに関しては、サブタスクBは、ツイートがヘイトスピーチであるか否かを検出することに焦点を当てている。
ヘイトスピーチのつぶやきに対して、サブタスクCは6つの異なるクラス間のきめ細かいタイプのヘイトスピーチを検出することに重点を置いている。
論文 参考訳(メタデータ) (2022-07-18T12:33:51Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Leveraging Transformers for Hate Speech Detection in Conversational
Code-Mixed Tweets [36.29939722039909]
本稿では,HASOC 2021サブタスク2のためのMIDAS-IIITDチームによって提案されたシステムについて述べる。
これは、Hindi- Englishのコードミキシングされた会話からヘイトスピーチを検出することに焦点を当てた最初の共有タスクの1つである。
Indic-BERT,XLM-RoBERTa,Multilingual BERTのハード投票アンサンブルがマクロF1スコア0.7253を達成した。
論文 参考訳(メタデータ) (2021-12-18T19:27:33Z) - Unsupervised Domain Adaptation for Hate Speech Detection Using a Data
Augmentation Approach [6.497816402045099]
ヘイトスピーチ検出のためのラベル付きデータを拡張するための教師なし領域適応手法を提案する。
精度/リコール曲線の領域を最大42%改善し,278%改善した。
論文 参考訳(メタデータ) (2021-07-27T15:01:22Z) - Impact and dynamics of hate and counter speech online [0.0]
市民によるカウンタースピーチは、ヘイトスピーチと戦い、平和的で非分極的な言論を促進するための有望な方法だ。
われわれはドイツのTwitterで4年間に起きた180,000件の政治的会話を分析した。
論文 参考訳(メタデータ) (2020-09-16T01:43:28Z) - Racism is a Virus: Anti-Asian Hate and Counterspeech in Social Media
during the COVID-19 Crisis [51.39895377836919]
新型コロナウイルスは、アジアのコミュニティをターゲットにしたソーシャルメディア上で人種差別や憎悪を引き起こしている。
我々は、Twitterのレンズを通して、反アジアヘイトスピーチの進化と普及について研究する。
私たちは、14ヶ月にわたる反アジア的憎悪と反音声のデータセットとして最大となるCOVID-HATEを作成します。
論文 参考訳(メタデータ) (2020-05-25T21:58:09Z) - Echo Chambers on Social Media: A comparative analysis [64.2256216637683]
本研究では,4つのソーシャルメディアプラットフォーム上で100万ユーザが生成した100万個のコンテンツに対して,エコーチャンバーの操作的定義を導入し,大規模な比較分析を行う。
議論の的になっているトピックについてユーザの傾きを推測し、異なる特徴を分析してインタラクションネットワークを再構築する。
我々は、Facebookのようなニュースフィードアルゴリズムを実装するプラットフォームが、エコーチャンバの出現を招きかねないという仮説を支持する。
論文 参考訳(メタデータ) (2020-04-20T20:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。