論文の概要: Factoring Hate Speech: A New Annotation Framework to Study Hate Speech
in Social Media
- arxiv url: http://arxiv.org/abs/2311.03969v1
- Date: Tue, 7 Nov 2023 13:08:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-08 15:37:00.171420
- Title: Factoring Hate Speech: A New Annotation Framework to Study Hate Speech
in Social Media
- Title(参考訳): ファクタリング・ヘイトスピーチ:ソーシャルメディアにおけるヘイトスピーチ研究のための新しいアノテーションフレームワーク
- Authors: Gal Ron, Effi Levi, Odelia Oshri and Shaul R. Shenhav
- Abstract要約: 我々は、ユダヤ人に向けられた憎悪表現を含む290万以上のTwitter投稿のコーパスを構築し、1,050ツイートのサンプルデータセットに注釈を付ける。
本稿では,注釈付きデータセットの統計的解析とアノテーション例の議論を行い,将来的な研究の方向性について論じる。
- 参考スコア(独自算出の注目度): 1.6385815610837167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work we propose a novel annotation scheme which factors hate speech
into five separate discursive categories. To evaluate our scheme, we construct
a corpus of over 2.9M Twitter posts containing hateful expressions directed at
Jews, and annotate a sample dataset of 1,050 tweets. We present a statistical
analysis of the annotated dataset as well as discuss annotation examples, and
conclude by discussing promising directions for future work.
- Abstract(参考訳): 本研究では,ヘイトスピーチを5つのカテゴリーに分けた新しいアノテーション手法を提案する。
提案手法を評価するために,ユダヤ人に対する憎悪表現を含む290万以上のtwitter投稿のコーパスを構築し,1,050ツイートのサンプルデータセットをアノテートする。
本稿では,注釈付きデータセットの統計的解析とアノテーション例の議論を行い,将来的な研究の方向性について論じる。
関連論文リスト
- Automatic Translation of Hate Speech to Non-hate Speech in Social Media
Texts [0.0]
本稿では,ヘイトスピーチを非ヘイトスピーチテキストに翻訳し,その意味を保ちながら新たなタスクを提案する。
さらなる研究の出発点として、データセットといくつかのベースラインを提供します。
本研究の目的は、オンラインコミュニティにおけるヘイトスピーチの拡散を減らすための、より効果的な方法の開発に寄与することである。
論文 参考訳(メタデータ) (2023-06-02T04:03:14Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - Explanation Selection Using Unlabeled Data for Chain-of-Thought
Prompting [80.9896041501715]
非専門家によって書かれたオフ・ザ・シェルフの説明のように、タスクのために"チューニング"されていない説明は、中途半端なパフォーマンスをもたらす可能性がある。
本稿では,ブラックボックス方式で説明拡散プロンプトを最適化する方法の課題に対処する。
論文 参考訳(メタデータ) (2023-02-09T18:02:34Z) - Parsimonious Argument Annotations for Hate Speech Counter-narratives [4.825848785596437]
本稿では、ヘイトスピーチツイートのHatevalコーパス(Basile et al.)を充実させ、自動対ナラティブ生成を容易にする。
我々はまた、Wagemannsに基づく議論的な情報付きツイートを注釈付けし、特定のグループに対するヘイトスピーチに対して、説得力があり効果的な反ナラティブを構築するのに役立つと信じている。
予備的な結果は、自動アノテータが人間のアノテータに近づき、議論のいくつかの側面を検知する一方で、他のアノテータは低レベルまたは中程度のアノテータ間合意にしか到達しないことを示している。
論文 参考訳(メタデータ) (2022-08-01T18:58:32Z) - Anti-Asian Hate Speech Detection via Data Augmented Semantic Relation
Inference [4.885207279350052]
本稿では,自然言語推論フレームワークにおけるヘイトスピーチ検出を強化するために,感情ハッシュタグを活用する新しい手法を提案する。
我々は,(1)オンライン投稿と感情ハッシュタグ間の意味的関係推論,(2)これらの投稿に対する感情分類の2つのタスクを同時に実行する新しいフレームワークSRICを設計する。
論文 参考訳(メタデータ) (2022-04-14T15:03:35Z) - Discourse Analysis for Evaluating Coherence in Video Paragraph Captions [99.37090317971312]
ビデオ段落のコヒーレンスを評価するための,新しい談話に基づく枠組みを検討中である。
ビデオのコヒーレンスに条件付き段落のコヒーレンスをモデル化する上で,ビデオの談話表現が中心となる。
実験の結果,提案手法は,ビデオ段落のコヒーレンスをベースライン法よりも有意に向上させることがわかった。
論文 参考訳(メタデータ) (2022-01-17T04:23:08Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - An Information Retrieval Approach to Building Datasets for Hate Speech
Detection [3.587367153279349]
「一般的な慣行は、既知の憎しみの言葉を含むツイートを注釈するだけである。」
第二の課題は、ヘイトスピーチの定義が高度に変動し、主観的である傾向があることである。
我々の重要な洞察は、ヘイトスピーチの希少性と主観性が情報検索(IR)の関連性に類似していることである。
論文 参考訳(メタデータ) (2021-06-17T19:25:39Z) - Annotation Curricula to Implicitly Train Non-Expert Annotators [56.67768938052715]
自発的な研究は、しばしば、アノテータがタスク、そのアノテーションスキーム、およびデータドメインに精通することを要求する。
これは最初は圧倒的であり、精神的に課税され、結果として生じるアノテーションにエラーを誘導する。
暗黙的にアノテータを訓練する新しい手法であるアノテーションキュリキュラを提案する。
論文 参考訳(メタデータ) (2021-06-04T09:48:28Z) - You Are What You Tweet: Profiling Users by Past Tweets to Improve Hate
Speech Detection [5.203329540700176]
我々は,新しい発話がヘイトスピーチを構成するか否かをより正確に予測するために,過去の発話によるユーザを情報として調査する。
これを評価するために、Twitterのヘイトスピーチデータセットを3つ追加のタイムラインデータで拡張し、この追加コンテキストを強力なベースラインモデルに組み込む。
有望な結果はさらなる調査のメリットを示唆するが、分析はアノテーションのスキームやプロセスの違いやtwitter apiの制限、データ共有ポリシーによって複雑である。
論文 参考訳(メタデータ) (2020-12-16T17:17:47Z) - Constructing interval variables via faceted Rasch measurement and
multitask deep learning: a hate speech application [63.10266319378212]
本稿では,教師付き深層学習と多面的ラッシュアイテム応答理論(IRT)構築手法を組み合わせることで,連続区間スペクトル上の複素変数を測定する手法を提案する。
われわれは、YouTube、Twitter、Redditから5万件のソーシャルメディアコメントを収集し、1万1000人の米国拠点のAmazon Mechanical Turkの労働者によってラベル付けされたデータセット上で、この新しい手法を実証した。
論文 参考訳(メタデータ) (2020-09-22T02:15:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。