論文の概要: "Stop Asian Hate!" : Refining Detection of Anti-Asian Hate Speech During
the COVID-19 Pandemic
- arxiv url: http://arxiv.org/abs/2112.02265v1
- Date: Sat, 4 Dec 2021 06:55:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-07 17:08:43.129298
- Title: "Stop Asian Hate!" : Refining Detection of Anti-Asian Hate Speech During
the COVID-19 Pandemic
- Title(参考訳): Stop Asian Hate!」 : 新型コロナウイルスパンデミック時の反アジアヘイトスピーチの精製検出
- Authors: Huy Nghiem, Fred Morstatter
- Abstract要約: 新型コロナウイルス(COVID-19)のパンデミックは、アジアでのキセノフォビアと偏見の急増を加速させた。
我々は2つの実験的なアプローチを用いてTwitterのツイートのコーパスを作成して注釈付けし、反アジア人虐待とヘイトスピーチを探索する。
- 参考スコア(独自算出の注目度): 2.5227595609842206
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: *Content warning: This work displays examples of explicit and strongly
offensive language. The COVID-19 pandemic has fueled a surge in anti-Asian
xenophobia and prejudice. Many have taken to social media to express these
negative sentiments, necessitating the development of reliable systems to
detect hate speech against this often under-represented demographic. In this
paper, we create and annotate a corpus of Twitter tweets using 2 experimental
approaches to explore anti-Asian abusive and hate speech at finer granularity.
Using the dataset with less biased annotation, we deploy multiple models and
also examine the applicability of other relevant corpora to accomplish these
multi-task classifications. In addition to demonstrating promising results, our
experiments offer insights into the nuances of cultural and logistical factors
in annotating hate speech for different demographics. Our analyses together aim
to contribute to the understanding of the area of hate speech detection,
particularly towards low-resource groups.
- Abstract(参考訳): ※内容警告:明示的で強烈に攻撃的な言語の例を示す。
新型コロナウイルス(COVID-19)のパンデミックにより、アジア諸国のキセノフォビアや偏見が急増している。
多くの人は、こうした否定的な感情をソーシャルメディアで表現し、この過小評価された人口層に対するヘイトスピーチを検出するための信頼できるシステムの開発を必要としている。
本稿では,2つの実験的なアプローチを用いて,Twitterツイートのコーパスを作成し,より細かい粒度で反アジア人虐待とヘイトスピーチを探索する。
バイアスの少ないアノテーションを持つデータセットを用いて、複数のモデルをデプロイし、これらのマルチタスク分類を達成するために他の関連するコーパスの適用性を検討する。
有望な結果を示すことに加えて、異なる人口層に対するヘイトスピーチの注釈付けにおける文化的・論理的要因のニュアンスに関する知見を提供する。
分析の目的は,ヘイトスピーチ検出の分野,特に低リソースグループに対する理解を深めることである。
関連論文リスト
- ProvocationProbe: Instigating Hate Speech Dataset from Twitter [0.39052860539161904]
textitProvocationProbeは、ヘイトスピーチを一般的なヘイトスピーチと区別するためのデータセットである。
本研究では、Twitterから約2万件のツイートを収集し、全世界で9件の論争を巻き起こした。
論文 参考訳(メタデータ) (2024-10-25T16:57:59Z) - Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models [50.40276881893513]
本研究では,音声大言語モデル(SLLM)における社会的バイアスの評価を目的としたデータセットであるSpken Stereosetを紹介する。
多様な人口集団の発話に対して異なるモデルがどのように反応するかを調べることで、これらのバイアスを特定することを目指している。
これらの結果から,ほとんどのモデルではバイアスが最小であるが,ステレオタイプや反ステレオタイプ傾向がわずかにみられた。
論文 参考訳(メタデータ) (2024-08-14T16:55:06Z) - A Community-Centric Perspective for Characterizing and Detecting Anti-Asian Violence-Provoking Speech [31.98433210638392]
暴力を誘発する演説は、パンデミック中の反アジア犯罪の急増に寄与した。
我々は、反アジア暴力を誘発する音声を特徴付けるコードブックを開発し、コミュニティソースのデータセットを収集する。
暴力を誘発する音声の正確かつ確実な検出が課題であることを示す。
論文 参考訳(メタデータ) (2024-07-21T17:27:17Z) - HCDIR: End-to-end Hate Context Detection, and Intensity Reduction model
for online comments [2.162419921663162]
ソーシャルメディア投稿において,Hate Context Detection と Hate Intensity Reduction のための新しいエンドツーエンドモデル HCDIR を提案する。
我々は、ヘイトフルコメントを検出するために、いくつかの事前訓練された言語モデルを微調整し、最も優れたヘイトフルコメント検出モデルを確認した。
論文 参考訳(メタデータ) (2023-12-20T17:05:46Z) - Exploring Cross-Cultural Differences in English Hate Speech Annotations: From Dataset Construction to Analysis [44.17106903728264]
ほとんどのヘイトスピーチデータセットは、単一の言語における文化的多様性を無視している。
そこで本研究では,CRoss文化の英語Hate音声データセットであるCREHateを紹介する。
CREHateのポストの56.2%のみが全国でコンセンサスを達成しており、ペアのラベル差が最も高いのは26%である。
論文 参考訳(メタデータ) (2023-08-31T13:14:47Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - Assessing the impact of contextual information in hate speech detection [0.48369513656026514]
我々は,Twitter上のメディアからのニュース投稿に対するユーザの反応に基づいた,文脈的ヘイトスピーチ検出のための新しいコーパスを提供する。
このコーパスはリオプラテンセ方言のスペイン語で収集され、新型コロナウイルスのパンデミックに関連するヘイトスピーチに焦点を当てている。
論文 参考訳(メタデータ) (2022-10-02T09:04:47Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Annotators with Attitudes: How Annotator Beliefs And Identities Bias
Toxic Language Detection [75.54119209776894]
本研究では,アノテータのアイデンティティ(誰)と信念(なぜ)が有害な言語アノテーションに与える影響について検討する。
我々は、アンチブラック言語、アフリカ系アメリカ人の英語方言、俗語という3つの特徴を持つポストを考察する。
以上の結果から,アノテータのアイデンティティと信念と毒性評価の相関が強く示唆された。
論文 参考訳(メタデータ) (2021-11-15T18:58:20Z) - Racism is a Virus: Anti-Asian Hate and Counterspeech in Social Media
during the COVID-19 Crisis [51.39895377836919]
新型コロナウイルスは、アジアのコミュニティをターゲットにしたソーシャルメディア上で人種差別や憎悪を引き起こしている。
我々は、Twitterのレンズを通して、反アジアヘイトスピーチの進化と普及について研究する。
私たちは、14ヶ月にわたる反アジア的憎悪と反音声のデータセットとして最大となるCOVID-HATEを作成します。
論文 参考訳(メタデータ) (2020-05-25T21:58:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。