論文の概要: Transfer Learning for Hate Speech Detection in Social Media
- arxiv url: http://arxiv.org/abs/1906.03829v3
- Date: Sun, 29 Oct 2023 16:22:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 05:29:45.077378
- Title: Transfer Learning for Hate Speech Detection in Social Media
- Title(参考訳): ソーシャルメディアにおけるヘイトスピーチ検出のための伝達学習
- Authors: Lanqin Yuan and Tianyu Wang and Gabriela Ferraro and Hanna Suominen
and Marian-Andrei Rizoiu
- Abstract要約: 本稿では、2つの独立したデータセットを協調的に活用するために転送学習手法を用いる。
我々は、構築されたヘイトスピーチ表現の解釈可能な2次元可視化ツールを構築します。
この共同表現は,限られた監督範囲の場合にのみ予測性能が向上することを示す。
- 参考スコア(独自算出の注目度): 14.759208309842178
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Today, the internet is an integral part of our daily lives, enabling people
to be more connected than ever before. However, this greater connectivity and
access to information increase exposure to harmful content such as
cyber-bullying and cyber-hatred. Models based on machine learning and natural
language offer a way to make online platforms safer by identifying hate speech
in web text autonomously. However, the main difficulty is annotating a
sufficiently large number of examples to train these models. This paper uses a
transfer learning technique to leverage two independent datasets jointly and
builds a single representation of hate speech. We build an interpretable
two-dimensional visualization tool of the constructed hate speech
representation -- dubbed the Map of Hate -- in which multiple datasets can be
projected and comparatively analyzed. The hateful content is annotated
differently across the two datasets (racist and sexist in one dataset, hateful
and offensive in another). However, the common representation successfully
projects the harmless class of both datasets into the same space and can be
used to uncover labeling errors (false positives). We also show that the joint
representation boosts prediction performances when only a limited amount of
supervision is available. These methods and insights hold the potential for
safer social media and reduce the need to expose human moderators and
annotators to distressing online messaging.
- Abstract(参考訳): 今日では、インターネットは私たちの日常生活の不可欠な部分であり、人々がこれまで以上に繋がることができます。
しかし、この接続性の向上と情報へのアクセスにより、サイバーいじめやサイバー攻撃のような有害なコンテンツへの露出が増大する。
機械学習と自然言語に基づくモデルは、ウェブテキストでヘイトスピーチを自律的に識別することで、オンラインプラットフォームをより安全にする方法を提供する。
しかし、主な困難は、これらのモデルをトレーニングする十分な数のサンプルを注釈付けすることである。
本稿では,2つの独立したデータセットを共同で活用し,ヘイトスピーチの単一表現を構築するためのトランスファー学習手法を提案する。
我々は、構築されたヘイト表現(ヘイトマップと呼ばれる)の解釈可能な二次元可視化ツールを構築し、複数のデータセットを投影し、比較分析する。
憎しみのあるコンテンツは、2つのデータセット(あるデータセットでは人種差別と性差別、別のデータセットでは憎しみと嫌悪)で異なる注釈が付けられる。
しかし、共通表現は両方のデータセットの無害なクラスを同じ空間に投影することに成功し、ラベル付けエラー(偽陽性)を発見できる。
また,共同表現は,限られた監督範囲の場合にのみ予測性能を向上させることを示す。
これらの方法と洞察は、ソーシャルメディアをより安全なものにし、人間のモデレーターやアノテーターをオンラインメッセージングの苦痛に晒す必要性を減らす。
関連論文リスト
- Towards Interpretable Hate Speech Detection using Large Language Model-extracted Rationales [15.458557611029518]
ソーシャルメディアプラットフォームは、ユーザーが対人的な議論を行い、意見を述べるための重要な場である。
ヘイトスピーチのインスタンスを自動的に識別し、フラグを付ける必要がある。
本稿では,現在最先端の大規模言語モデル (LLM) を用いて,入力テキストから有理形の特徴を抽出することを提案する。
論文 参考訳(メタデータ) (2024-03-19T03:22:35Z) - MetaHate: A Dataset for Unifying Efforts on Hate Speech Detection [2.433983268807517]
ヘイトスピーチは、標的となる個人やコミュニティに対して、社会的、心理的、時には身体的脅威を生じさせる。
この現象に対処するための現在の計算言語学的アプローチは、トレーニングのためのラベル付きソーシャルメディアデータセットに依存している。
我々は60以上のデータセットを精査し、その関連するものをMetaHateに選択的に統合しました。
我々の発見は、既存のデータセットのより深い理解に寄与し、より堅牢で適応可能なモデルをトレーニングするための道を開いた。
論文 参考訳(メタデータ) (2024-01-12T11:54:53Z) - Into the LAIONs Den: Investigating Hate in Multimodal Datasets [67.21783778038645]
本稿では、LAION-400MとLAION-2Bの2つのデータセットの比較監査を通して、ヘイトフルコンテンツに対するデータセットのスケーリングの効果について検討する。
その結果、データセットのスケールによってヘイトコンテンツは12%近く増加し、質的にも定量的にも測定された。
また、画像のみに基づいて算出されたNot Safe For Work(NSFW)値に基づくデータセットの内容のフィルタリングは、アルトテキストにおける有害なコンテンツをすべて排除するものではないことがわかった。
論文 参考訳(メタデータ) (2023-11-06T19:00:05Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - Harnessing the Power of Text-image Contrastive Models for Automatic
Detection of Online Misinformation [50.46219766161111]
誤情報識別の領域における構成的学習を探求する自己学習モデルを構築した。
本モデルでは、トレーニングデータが不十分な場合、非マッチング画像-テキストペア検出の優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-19T02:53:59Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - Hate Speech and Offensive Language Detection using an Emotion-aware
Shared Encoder [1.8734449181723825]
ヘイトスピーチと攻撃的言語検出に関する既存の研究は、事前学習されたトランスフォーマーモデルに基づいて有望な結果をもたらす。
本稿では,他コーパスから抽出した外的感情特徴を組み合わせたマルチタスク共同学習手法を提案する。
以上の結果から,感情的な知識が,データセット間のヘイトスピーチや攻撃的言語をより確実に識別する上で有効であることが示唆された。
論文 参考訳(メタデータ) (2023-02-17T09:31:06Z) - Anti-Asian Hate Speech Detection via Data Augmented Semantic Relation
Inference [4.885207279350052]
本稿では,自然言語推論フレームワークにおけるヘイトスピーチ検出を強化するために,感情ハッシュタグを活用する新しい手法を提案する。
我々は,(1)オンライン投稿と感情ハッシュタグ間の意味的関係推論,(2)これらの投稿に対する感情分類の2つのタスクを同時に実行する新しいフレームワークSRICを設計する。
論文 参考訳(メタデータ) (2022-04-14T15:03:35Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Trawling for Trolling: A Dataset [56.1778095945542]
攻撃的コンテンツのサブカテゴリとしてトロリングをモデル化するデータセットを提案する。
データセットには12,490のサンプルがあり、5つのクラスに分かれている。
論文 参考訳(メタデータ) (2020-08-02T17:23:55Z) - Investigating Deep Learning Approaches for Hate Speech Detection in
Social Media [20.974715256618754]
表現の自由の誤用は、様々なサイバー犯罪や反社会的活動の増加につながった。
ヘイトスピーチ(Hate speech)は、社会的ファブリックの完全性に脅威をもたらす可能性があるため、他の問題と同様に真剣に対処する必要がある。
本稿では,ソーシャルメディアにおける様々なヘイトスピーチの検出に様々な埋め込みを応用したディープラーニングアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-29T17:28:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。