論文の概要: Are Chess Discussions Racist? An Adversarial Hate Speech Data Set
- arxiv url: http://arxiv.org/abs/2011.10280v1
- Date: Fri, 20 Nov 2020 08:50:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 05:48:45.934718
- Title: Are Chess Discussions Racist? An Adversarial Hate Speech Data Set
- Title(参考訳): Chessの議論はラシストか?
敵対的なヘイトスピーチデータセット
- Authors: Rupak Sarkar, Ashiqur R. KhudaBukhsh
- Abstract要約: アントニオ・ラディックのYouTubeハンドルには「有害で危険な」コンテンツが含まれていたため、ブロックされた。
我々は、既存のヘイトスピーチ分類器がヘイトスピーチとして良質なチェスの議論を誤って分類した1000の注釈付きコメントのデータセットをリリースする。
人種的偏見に興味深いアナロジーの結果が得られ,カラーポリセミズムの課題が指摘された。
- 参考スコア(独自算出の注目度): 17.665938343060112
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: On June 28, 2020, while presenting a chess podcast on Grandmaster Hikaru
Nakamura, Antonio Radi\'c's YouTube handle got blocked because it contained
"harmful and dangerous" content. YouTube did not give further specific reason,
and the channel got reinstated within 24 hours. However, Radi\'c speculated
that given the current political situation, a referral to "black against
white", albeit in the context of chess, earned him this temporary ban. In this
paper, via a substantial corpus of 681,995 comments, on 8,818 YouTube videos
hosted by five highly popular chess-focused YouTube channels, we ask the
following research question: \emph{how robust are off-the-shelf hate-speech
classifiers to out-of-domain adversarial examples?} We release a data set of
1,000 annotated comments where existing hate speech classifiers misclassified
benign chess discussions as hate speech. We conclude with an intriguing analogy
result on racial bias with our findings pointing out to the broader challenge
of color polysemy.
- Abstract(参考訳): 2020年6月28日、グランドマスターの中村光にチェスのポッドキャストを披露する中、アントニオ・ラディユックのyoutubeハンドルが「ハームフルで危険な」コンテンツを含んでいたためにブロックされた。
YouTubeは具体的な理由を明かさず、チャンネルは24時間以内に復活した。
しかしRadi\'cは、現在の政治状況を考えると、チェスの文脈では「白人に対する黒人」の言及は、この一時的な禁止となったと推測した。
本稿では,チェスに焦点を絞った5つのyoutubeチャンネルがホストする8,818のyoutubeビデオに対して,681,995件のコメントの膨大なコーパスを通じて,次のような研究質問を行う。
既存のヘイトスピーチ分類器がヘイトスピーチとして、良質なチェスに関する議論を誤って分類している。
人種的偏見に関する興味深いアナロジーの結果を結論として,カラーポリセミズムのより広範な課題を指摘した。
関連論文リスト
- ProvocationProbe: Instigating Hate Speech Dataset from Twitter [0.39052860539161904]
textitProvocationProbeは、ヘイトスピーチを一般的なヘイトスピーチと区別するためのデータセットである。
本研究では、Twitterから約2万件のツイートを収集し、全世界で9件の論争を巻き起こした。
論文 参考訳(メタデータ) (2024-10-25T16:57:59Z) - Analyzing Norm Violations in Live-Stream Chat [49.120561596550395]
本研究は,ライブストリーミングプラットフォーム上での会話における規範違反を検出することを目的とした,最初のNLP研究である。
ライブストリームチャットにおける標準違反カテゴリを定義し、Twitchから4,583のコメントを注釈付けします。
以上の結果から,適切なコンテキスト情報がモデレーション性能を35%向上させる可能性が示唆された。
論文 参考訳(メタデータ) (2023-05-18T05:58:27Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - Comparing the Language of QAnon-related content on Parler, Gab, and
Twitter [68.8204255655161]
保守派の間で人気の「言論の自由」プラットフォームであるParlerは、2021年1月に、憎悪やQAnonなどの陰謀に関するコンテンツのモデレーションの欠如により、オフラインになった。
われわれは投稿をParlerの#QAnonというハッシュタグと比較する。
Gabはヘイト条件の#QAnon投稿が最も多く、ParlerとTwitterも同様である。
これら3つのプラットフォームにおいて、女性政治家、民主党員、ドナルド・トランプに言及する投稿は、男性政治家、共和党員、あるいは共和党員に言及する投稿よりも、より反社会的な言葉を持っている。
論文 参考訳(メタデータ) (2021-11-22T11:19:15Z) - Annotators with Attitudes: How Annotator Beliefs And Identities Bias
Toxic Language Detection [75.54119209776894]
本研究では,アノテータのアイデンティティ(誰)と信念(なぜ)が有害な言語アノテーションに与える影響について検討する。
我々は、アンチブラック言語、アフリカ系アメリカ人の英語方言、俗語という3つの特徴を持つポストを考察する。
以上の結果から,アノテータのアイデンティティと信念と毒性評価の相関が強く示唆された。
論文 参考訳(メタデータ) (2021-11-15T18:58:20Z) - TweetBLM: A Hate Speech Dataset and Analysis of Black Lives
Matter-related Microblogs on Twitter [2.741266294612776]
我々は,Black Lives Matter に関連するツイートヘイトスピーチデータセット TweetBLM を提案する。
私たちのデータセットは、Black Lives Matter運動をターゲットとする、手動で注釈付けされたツイート9165です。
論文 参考訳(メタデータ) (2021-08-27T22:47:02Z) - "Nice Try, Kiddo": Investigating Ad Hominems in Dialogue Responses [87.89632038677912]
アドホミン攻撃(Ad hominem attack)とは、ある人物が保持している位置ではなく、ある人物の特徴を狙う攻撃である。
本稿では,アノテートされたデータセットを作成し,英語のTwitter投稿に対する人文・対話応答を解析するシステムを構築する。
以上の結果から,1)ヒトとダイアロGPTの両方からの反応は,辺縁化コミュニティに関する議論においてより多くのアドホミンを含むこと,2)訓練データ中の異なる量のアドホミンがアドホミンの生成に影響を及ぼしうること,3)アドホミン化を減らすためのデコード技術に制約があることが示唆された。
論文 参考訳(メタデータ) (2020-10-24T07:37:49Z) - Detecting White Supremacist Hate Speech using Domain Specific Word
Embedding with Deep Learning and BERT [0.0]
白人至上主義のヘイトスピーチは、ソーシャルメディア上で最も最近観察された有害なコンテンツの一つである。
本研究では,ディープラーニングと自然言語処理技術を用いて,Twitter上での白人至上主義者のヘイトスピーチを自動的に検出する可能性について検討した。
論文 参考訳(メタデータ) (2020-10-01T12:44:24Z) - Reading In-Between the Lines: An Analysis of Dissenter [2.2881898195409884]
我々は、あらゆるWebページに対して会話オーバーレイを提供するブラウザおよびWebアプリケーションであるDissenterについて研究する。
本研究では,議論中のDissenterコメントやユーザ,ウェブサイトの履歴を取得する。
私たちのコーパスは、101kユーザーが588kの異なるURLでコメントした約1.68万のコメントで構成されています。
論文 参考訳(メタデータ) (2020-09-03T16:25:28Z) - Racism is a Virus: Anti-Asian Hate and Counterspeech in Social Media
during the COVID-19 Crisis [51.39895377836919]
新型コロナウイルスは、アジアのコミュニティをターゲットにしたソーシャルメディア上で人種差別や憎悪を引き起こしている。
我々は、Twitterのレンズを通して、反アジアヘイトスピーチの進化と普及について研究する。
私たちは、14ヶ月にわたる反アジア的憎悪と反音声のデータセットとして最大となるCOVID-HATEを作成します。
論文 参考訳(メタデータ) (2020-05-25T21:58:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。