論文の概要: Annotating for Hate Speech: The MaNeCo Corpus and Some Input from
Critical Discourse Analysis
- arxiv url: http://arxiv.org/abs/2008.06222v1
- Date: Fri, 14 Aug 2020 07:39:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 17:38:00.111424
- Title: Annotating for Hate Speech: The MaNeCo Corpus and Some Input from
Critical Discourse Analysis
- Title(参考訳): ヘイトスピーチの注釈:MaNeCoコーパスと批判的談話分析からの入力
- Authors: Stavros Assimakopoulos, Rebecca Vella Muskat, Lonneke van der Plas,
Albert Gatt
- Abstract要約: 本稿では,Web 2.0コメンタリーのコーパスにおいて,ヘイトスピーチのアノテーションのための新しいスキームを提案する。
地中海の移民危機やマルタのLGBTIQ+問題に関するニュースに反応した投稿の批判的な分析に動機づけられている。
本稿では,二分詞+/-ヘイト音声分類に対してパイロットテストを行い,より高いアノテータ間合意が得られる多層アノテーション方式を提案する。
- 参考スコア(独自算出の注目度): 3.3008315224941978
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a novel scheme for the annotation of hate speech in
corpora of Web 2.0 commentary. The proposed scheme is motivated by the critical
analysis of posts made in reaction to news reports on the Mediterranean
migration crisis and LGBTIQ+ matters in Malta, which was conducted under the
auspices of the EU-funded C.O.N.T.A.C.T. project. Based on the realization that
hate speech is not a clear-cut category to begin with, appears to belong to a
continuum of discriminatory discourse and is often realized through the use of
indirect linguistic means, it is argued that annotation schemes for its
detection should refrain from directly including the label 'hate speech,' as
different annotators might have different thresholds as to what constitutes
hate speech and what not. In view of this, we suggest a multi-layer annotation
scheme, which is pilot-tested against a binary +/- hate speech classification
and appears to yield higher inter-annotator agreement. Motivating the
postulation of our scheme, we then present the MaNeCo corpus on which it will
eventually be used; a substantial corpus of on-line newspaper comments spanning
10 years.
- Abstract(参考訳): 本稿では,Web 2.0コメンタリーのコーパスにおけるヘイトスピーチアノテーションの新しい手法を提案する。
提案手法は、地中海の移民危機やマルタのLGBTIQ+問題に関するニュース報道に反応して行われたポストの批判的分析に動機づけられ、EUが出資したC.O.N.T.A.C.T.プロジェクトの後援のもとに実施された。
ヘイトスピーチはそもそも明確なカテゴリーではなく、差別的な言説の連続体に属しており、間接的な言語的手段を用いることでしばしば実現されるという認識に基づいて、その検出のためのアノテーションスキームは「ヘイトスピーチ」というラベルを直接含まないべきであると論じられている。
そこで本研究では,二分詞+/-ヘイト音声分類に対してパイロットテストを行い,より高いアノテータ間合意を導出する多層アノテーション方式を提案する。
提案手法の仮定を動機づけて,最終的に使用される予定のmanecoコーパス,すなわち10年間にわたるオンライン新聞コメントの実質的なコーパスを提示する。
関連論文リスト
- Hate Speech Detection via Dual Contrastive Learning [25.878271501274245]
本稿では,ヘイトスピーチ検出のための新しい双方向コントラスト学習フレームワークを提案する。
本フレームワークは,自己教師型学習と教師型学習の損失を協調的に最適化し,スパンレベルの情報を取得する。
公開可能な2つの英語データセットの実験を行い、実験結果から、提案モデルが最先端のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2023-07-10T13:23:36Z) - DisfluencyFixer: A tool to enhance Language Learning through Speech To
Speech Disfluency Correction [50.51901599433536]
DisfluencyFixerは、英語とヒンディー語で音声から音声への拡散補正を行うツールである。
提案システムでは,入力音声からの拡散を除去し,出力として流速音声を返却する。
論文 参考訳(メタデータ) (2023-05-26T14:13:38Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - Assessing the impact of contextual information in hate speech detection [0.48369513656026514]
我々は,Twitter上のメディアからのニュース投稿に対するユーザの反応に基づいた,文脈的ヘイトスピーチ検出のための新しいコーパスを提供する。
このコーパスはリオプラテンセ方言のスペイン語で収集され、新型コロナウイルスのパンデミックに関連するヘイトスピーチに焦点を当てている。
論文 参考訳(メタデータ) (2022-10-02T09:04:47Z) - Improved two-stage hate speech classification for twitter based on Deep
Neural Networks [0.0]
ヘイトスピーチ(Hate speech)は、虐待的な言葉の使用を含む、オンラインハラスメントの一種である。
この研究で提案するモデルは、LSTMニューラルネットワークアーキテクチャに基づく既存のアプローチの拡張である。
本研究は,16kツイートの公開コーパスで評価された2段階目の提案手法の性能比較を含む。
論文 参考訳(メタデータ) (2022-06-08T20:57:41Z) - Placing M-Phasis on the Plurality of Hate: A Feature-Based Corpus of
Hate Online [18.973398187389083]
我々は、移民関連のニュース記事から収集した9万のドイツ語とフランス語のユーザーコメントのコーパスであるM-Phasis corpusを提示する。
これは "hate"-"neutral" の二分法を超越し、代わりに23の特徴で注釈付けされ、様々な種類の音声の記述子となる。
論文 参考訳(メタデータ) (2022-04-28T10:36:49Z) - Speaker Identity Preservation in Dysarthric Speech Reconstruction by
Adversarial Speaker Adaptation [59.41186714127256]
変形性音声再建(DSR)は,変形性音声の品質向上を目的としている。
話者識別に最適化された話者エンコーダ (SE) について検討した。
我々は,新しいマルチタスク学習戦略,すなわち対人話者適応(ASA)を提案する。
論文 参考訳(メタデータ) (2022-02-18T08:59:36Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Textless Speech Emotion Conversion using Decomposed and Discrete
Representations [49.55101900501656]
我々は、音声を、コンテンツ単位、F0、話者、感情からなる離散的、非絡み合いの学習表現に分解する。
まず、内容単位を対象の感情に翻訳し、その単位に基づいて韻律的特徴を予測することによって、音声内容を変更する。
最後に、予測された表現をニューラルボコーダに入力して音声波形を生成する。
論文 参考訳(メタデータ) (2021-11-14T18:16:42Z) - Latent Hatred: A Benchmark for Understanding Implicit Hate Speech [22.420275418616242]
この研究は、暗黙のヘイトスピーチの理論的に正当化された分類法と、各メッセージにきめ細かいラベルを付けたベンチマークコーパスを導入している。
本稿では、同時代のベースラインを用いて、暗黙のヘイトスピーチを検出し、説明するためにデータセットを体系的に分析する。
論文 参考訳(メタデータ) (2021-09-11T16:52:56Z) - VQMIVC: Vector Quantization and Mutual Information-Based Unsupervised
Speech Representation Disentanglement for One-shot Voice Conversion [54.29557210925752]
ワンショット音声変換は、音声表現のアンタングルメントによって効果的に実現できる。
コンテンツエンコーディングにはベクトル量子化(VQ)を使用し、トレーニング中に相互情報(MI)を相関指標として導入する。
実験結果は,提案手法が効果的に非絡み合った音声表現を学習する際の優位性を反映している。
論文 参考訳(メタデータ) (2021-06-18T13:50:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。