論文の概要: K-HATERS: A Hate Speech Detection Corpus in Korean with Target-Specific
Ratings
- arxiv url: http://arxiv.org/abs/2310.15439v1
- Date: Tue, 24 Oct 2023 01:20:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 21:02:27.328797
- Title: K-HATERS: A Hate Speech Detection Corpus in Korean with Target-Specific
Ratings
- Title(参考訳): k-haters:ターゲット別評価を用いた韓国におけるヘイトスピーチ検出コーパス
- Authors: Chaewon Park, Soohwan Kim, Kyubyong Park, Kunwoo Park
- Abstract要約: K-HATERSは韓国のヘイトスピーチ検出のための新しいコーパスで、ターゲット固有の攻撃性評価を持つ約192Kのニュースコメントを含んでいる。
本研究は,ヘイトスピーチの検出と資源構築に関するNLP研究に寄与する。
- 参考スコア(独自算出の注目度): 6.902524826065157
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Numerous datasets have been proposed to combat the spread of online hate.
Despite these efforts, a majority of these resources are English-centric,
primarily focusing on overt forms of hate. This research gap calls for
developing high-quality corpora in diverse languages that also encapsulate more
subtle hate expressions. This study introduces K-HATERS, a new corpus for hate
speech detection in Korean, comprising approximately 192K news comments with
target-specific offensiveness ratings. This resource is the largest offensive
language corpus in Korean and is the first to offer target-specific ratings on
a three-point Likert scale, enabling the detection of hate expressions in
Korean across varying degrees of offensiveness. We conduct experiments showing
the effectiveness of the proposed corpus, including a comparison with existing
datasets. Additionally, to address potential noise and bias in human
annotations, we explore a novel idea of adopting the Cognitive Reflection Test,
which is widely used in social science for assessing an individual's cognitive
ability, as a proxy of labeling quality. Findings indicate that annotations
from individuals with the lowest test scores tend to yield detection models
that make biased predictions toward specific target groups and are less
accurate. This study contributes to the NLP research on hate speech detection
and resource construction. The code and dataset can be accessed at
https://github.com/ssu-humane/K-HATERS.
- Abstract(参考訳): オンライン憎しみの拡散に対抗するために、多くのデータセットが提案されている。
これらの努力にもかかわらず、これらの資源の大半は英語中心であり、主に過度な憎しみの形式に焦点を当てている。
この研究ギャップは、より微妙な憎悪表現をカプセル化した多様な言語で高品質なコーパスを開発することを要求する。
本研究では,韓国におけるヘイトスピーチ検出のための新しいコーパスであるK-HATERSを紹介する。
このリソースは韓国で最大の攻撃的言語コーパスであり、ターゲット固有の評価を3ポイントのlikertスケールで提供し、さまざまな攻撃性を通じて韓国における憎悪表現の検出を可能にした。
提案コーパスの有効性を示す実験を行い,既存のデータセットとの比較を行った。
さらに,人間の注釈における潜在的なノイズやバイアスに対処するために,個人の認知能力を評価するための社会科学において広く用いられている認知的リフレクションテスト(cognitive reflection test)を,ラベル付け品質の指標として採用するという新しい考え方を探求する。
その結果、テストスコアが最も低い個人からのアノテーションは、特定のターゲットグループに対して偏りのある予測を行い、精度が低い検出モデルをもたらす傾向がある。
本研究は,ヘイトスピーチの検出と資源構築に関するNLP研究に寄与する。
コードとデータセットはhttps://github.com/ssu-humane/K-HATERSでアクセスできる。
関連論文リスト
- HCDIR: End-to-end Hate Context Detection, and Intensity Reduction model
for online comments [2.162419921663162]
ソーシャルメディア投稿において,Hate Context Detection と Hate Intensity Reduction のための新しいエンドツーエンドモデル HCDIR を提案する。
我々は、ヘイトフルコメントを検出するために、いくつかの事前訓練された言語モデルを微調整し、最も優れたヘイトフルコメント検出モデルを確認した。
論文 参考訳(メタデータ) (2023-12-20T17:05:46Z) - SOUL: Towards Sentiment and Opinion Understanding of Language [96.74878032417054]
我々は、言語感覚とオピニオン理解(SOUL)と呼ばれる新しいタスクを提案する。
SOULは2つのサブタスクを通して感情理解を評価することを目的としている:レビュー(RC)と正当化生成(JG)。
論文 参考訳(メタデータ) (2023-10-27T06:48:48Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - K-MHaS: A Multi-label Hate Speech Detection Dataset in Korean Online
News Comment [3.428320237347854]
我々は韓国語パターンを効果的に処理するヘイトスピーチ検出のための新しいマルチラベルデータセットであるK-MHaSを紹介する。
データセットは、ニュースコメントから109kの発話で構成され、1から4つのラベルから複数のラベルの分類を提供する。
KR-BERTはサブキャラクタ・トークンーザより優れ、各ヘイトスピーチクラスで分解された文字を認識する。
論文 参考訳(メタデータ) (2022-08-23T02:10:53Z) - KOLD: Korean Offensive Language Dataset [11.699797031874233]
韓国の攻撃言語データセット(KOLD)と40kのコメントに,攻撃性,目標,対象とするグループ情報をラベル付けしたコメントを提示する。
タイトル情報は文脈として役立ち、特にコメントで省略された場合、憎悪の対象を識別するのに役立ちます。
論文 参考訳(メタデータ) (2022-05-23T13:58:45Z) - APEACH: Attacking Pejorative Expressions with Analysis on
Crowd-Generated Hate Speech Evaluation Datasets [4.034948808542701]
APEACHは、特定されていないユーザによって生成されるヘイトスピーチの収集を可能にする方法である。
ヘイトスピーチの群集生成を制御し,最小限のポストラベルのみを追加することにより,ヘイトスピーチ検出の一般化と公平な評価を可能にするコーパスを作成する。
論文 参考訳(メタデータ) (2022-02-25T02:04:38Z) - Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。
私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。
そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文 参考訳(メタデータ) (2022-02-19T03:48:20Z) - COLD: A Benchmark for Chinese Offensive Language Detection [54.60909500459201]
COLDatasetは、37kの注釈付き文を持つ中国の攻撃的言語データセットである。
また、人気のある中国語モデルの出力攻撃性を研究するために、textscCOLDetectorを提案する。
我々の資源と分析は、中国のオンラインコミュニティを解毒し、生成言語モデルの安全性を評価することを目的としている。
論文 参考訳(メタデータ) (2022-01-16T11:47:23Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z) - BEEP! Korean Corpus of Online News Comments for Toxic Speech Detection [3.90603670603335]
われわれはまず、韓国の有毒なスピーチを識別するために、手動でエンターテイメントニュースコメントをラベル付けした9.4Kを提示する。
どちらの側面も相関しているため、社会的偏見とヘイトスピーチについて注釈が付されている。
CharCNN, BiLSTM, BERT を用いてベンチマークを行い, BERT が全てのタスクにおいて最高スコアを達成している。
論文 参考訳(メタデータ) (2020-05-26T03:34:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。