論文の概要: A Community-Centric Perspective for Characterizing and Detecting Anti-Asian Violence-Provoking Speech
- arxiv url: http://arxiv.org/abs/2407.15227v1
- Date: Sun, 21 Jul 2024 17:27:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-23 18:49:14.239052
- Title: A Community-Centric Perspective for Characterizing and Detecting Anti-Asian Violence-Provoking Speech
- Title(参考訳): 反アジア暴力発声音声の認識と検出のためのコミュニティ中心的視点
- Authors: Gaurav Verma, Rynaa Grover, Jiawei Zhou, Binny Mathew, Jordan Kraemer, Munmun De Choudhury, Srijan Kumar,
- Abstract要約: 暴力を誘発する演説は、パンデミック中の反アジア犯罪の急増に寄与した。
我々は、反アジア暴力を誘発する音声を特徴付けるコードブックを開発し、コミュニティソースのデータセットを収集する。
暴力を誘発する音声の正確かつ確実な検出が課題であることを示す。
- 参考スコア(独自算出の注目度): 31.98433210638392
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Violence-provoking speech -- speech that implicitly or explicitly promotes violence against the members of the targeted community, contributed to a massive surge in anti-Asian crimes during the pandemic. While previous works have characterized and built tools for detecting other forms of harmful speech, like fear speech and hate speech, our work takes a community-centric approach to studying anti-Asian violence-provoking speech. Using data from ~420k Twitter posts spanning a 3-year duration (January 1, 2020 to February 1, 2023), we develop a codebook to characterize anti-Asian violence-provoking speech and collect a community-crowdsourced dataset to facilitate its large-scale detection using state-of-the-art classifiers. We contrast the capabilities of natural language processing classifiers, ranging from BERT-based to LLM-based classifiers, in detecting violence-provoking speech with their capabilities to detect anti-Asian hateful speech. In contrast to prior work that has demonstrated the effectiveness of such classifiers in detecting hateful speech ($F_1 = 0.89$), our work shows that accurate and reliable detection of violence-provoking speech is a challenging task ($F_1 = 0.69$). We discuss the implications of our findings, particularly the need for proactive interventions to support Asian communities during public health crises. The resources related to the study are available at https://claws-lab.github.io/violence-provoking-speech/.
- Abstract(参考訳): 暴力を誘発する演説は、標的とするコミュニティのメンバーに対する暴力を暗黙的または明示的に推進する演説であり、パンデミックの間、反アジア犯罪の急増に寄与した。
これまでの研究は、恐怖スピーチやヘイトスピーチなどの有害なスピーチを検知するツールを特徴付け、構築してきたが、我々の研究は、反アジア的暴力を誘発するスピーチの研究にコミュニティ中心のアプローチを採用している。
我々は、2020年1月1日から2023年2月1日までの3年間にわたる約420万件のTwitter投稿のデータを用いて、反アジア暴力を誘発するスピーチを特徴付けるコードブックを開発し、コミュニティが蓄積したデータセットを収集し、最先端の分類器を使った大規模な検出を容易にする。
我々は、BERTベースからLLMベースまで、自然言語処理分類器の暴力誘発音声検出能力と反アジアヘイトフル音声検出能力の対比を行った。
ヘイトフルスピーチ(F_1 = 0.89$)の検出におけるそのような分類器の有効性を実証した先行研究とは対照的に,暴力誘発音声の正確かつ確実な検出は難しい課題(F_1 = 0.69$)であることを示す。
本研究の意義,特に公衆衛生危機時にアジアのコミュニティを支援するための積極的な介入の必要性について論じる。
この研究に関連するリソースはhttps://claws-lab.github.io/violence-provoking-speech/で公開されている。
関連論文リスト
- STATE ToxiCN: A Benchmark for Span-level Target-Aware Toxicity Extraction in Chinese Hate Speech Detection [14.863778285778897]
中国語ヘイトスピーチのきめ細かい検出方法を提案する。
まず,ターゲット・Argument-Hateful-Group Quaruples(STATE ToxiCN)を含むデータセットを構築する。
次に,既存モデルのヘイトスピーチ検出性能について検討した。
最後に,中国のヘイトフルスラングに関する最初の研究を行い,LLMがそのような表現を検出する能力を評価する。
論文 参考訳(メタデータ) (2025-01-26T08:45:37Z) - SWE2: SubWord Enriched and Significant Word Emphasized Framework for Hate Speech Detection [3.0460060805145517]
本稿では,メッセージの内容のみに依存し,ヘイトスピーチを自動的に識別するSWE2という新しいヘイトスピーチ検出フレームワークを提案する。
実験結果から,提案モデルでは0.975の精度と0.953のマクロF1が達成され,最先端の7つのベースラインを上回った。
論文 参考訳(メタデータ) (2024-09-25T07:05:44Z) - Demarked: A Strategy for Enhanced Abusive Speech Moderation through Counterspeech, Detoxification, and Message Management [71.99446449877038]
本研究では, 重度尺度, (ii) ターゲットの存在, (iii) 文脈尺度, (iv) 法的尺度の4つの側面を基礎として, より包括的手法であるDemarcation scoreing abusive speechを提案する。
本研究は,ネット上での虐待的スピーチを効果的に解決するための今後の戦略を明らかにすることを目的としている。
論文 参考訳(メタデータ) (2024-06-27T21:45:33Z) - A Group-Specific Approach to NLP for Hate Speech Detection [2.538209532048867]
オンラインヘイトスピーチ検出のためのグループ固有のNLPアプローチを提案する。
我々は、保護されたグループに対する差別に関する歴史的データを分析し、そのグループに対するヘイトスピーチのスパイクを予測する。
我々は,NLPによる反ユダヤ的ヘイトスピーチの検出を事例として,この手法を実証する。
論文 参考訳(メタデータ) (2023-04-21T19:08:49Z) - Assessing the impact of contextual information in hate speech detection [0.48369513656026514]
我々は,Twitter上のメディアからのニュース投稿に対するユーザの反応に基づいた,文脈的ヘイトスピーチ検出のための新しいコーパスを提供する。
このコーパスはリオプラテンセ方言のスペイン語で収集され、新型コロナウイルスのパンデミックに関連するヘイトスピーチに焦点を当てている。
論文 参考訳(メタデータ) (2022-10-02T09:04:47Z) - Speaker Identity Preservation in Dysarthric Speech Reconstruction by
Adversarial Speaker Adaptation [59.41186714127256]
変形性音声再建(DSR)は,変形性音声の品質向上を目的としている。
話者識別に最適化された話者エンコーダ (SE) について検討した。
我々は,新しいマルチタスク学習戦略,すなわち対人話者適応(ASA)を提案する。
論文 参考訳(メタデータ) (2022-02-18T08:59:36Z) - COLD: A Benchmark for Chinese Offensive Language Detection [54.60909500459201]
COLDatasetは、37kの注釈付き文を持つ中国の攻撃的言語データセットである。
また、人気のある中国語モデルの出力攻撃性を研究するために、textscCOLDetectorを提案する。
我々の資源と分析は、中国のオンラインコミュニティを解毒し、生成言語モデルの安全性を評価することを目的としている。
論文 参考訳(メタデータ) (2022-01-16T11:47:23Z) - "Stop Asian Hate!" : Refining Detection of Anti-Asian Hate Speech During
the COVID-19 Pandemic [2.5227595609842206]
新型コロナウイルス(COVID-19)のパンデミックは、アジアでのキセノフォビアと偏見の急増を加速させた。
我々は2つの実験的なアプローチを用いてTwitterのツイートのコーパスを作成して注釈付けし、反アジア人虐待とヘイトスピーチを探索する。
論文 参考訳(メタデータ) (2021-12-04T06:55:19Z) - Racism is a Virus: Anti-Asian Hate and Counterspeech in Social Media
during the COVID-19 Crisis [51.39895377836919]
新型コロナウイルスは、アジアのコミュニティをターゲットにしたソーシャルメディア上で人種差別や憎悪を引き起こしている。
我々は、Twitterのレンズを通して、反アジアヘイトスピーチの進化と普及について研究する。
私たちは、14ヶ月にわたる反アジア的憎悪と反音声のデータセットとして最大となるCOVID-HATEを作成します。
論文 参考訳(メタデータ) (2020-05-25T21:58:09Z) - Kungfupanda at SemEval-2020 Task 12: BERT-Based Multi-Task Learning for
Offensive Language Detection [55.445023584632175]
我々は,マルチタスク学習とBERTモデルを組み合わせた攻撃的言語検出システムを構築した。
我々のモデルは、英語のサブタスクAで91.51%のF1スコアを獲得し、これは第1位に匹敵する。
論文 参考訳(メタデータ) (2020-04-28T11:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。