論文の概要: Hate Speech Detection in Clubhouse
- arxiv url: http://arxiv.org/abs/2106.13238v2
- Date: Mon, 28 Jun 2021 00:39:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 11:09:25.515332
- Title: Hate Speech Detection in Clubhouse
- Title(参考訳): クラブハウスにおけるヘイトスピーチ検出
- Authors: Hadi Mansourifar, Dana Alsagheer, Reza Fathi, Weidong Shi, Lan Ni, Yan
Huang
- Abstract要約: Google Perspective Scoresを用いて,収集したインスタンスを統計的視点から分析する。
我々の実験では、パースペクティブスコアは、高レベルのテキスト機能として、WordsとWord2Vecのバグよりも優れています。
- 参考スコア(独自算出の注目度): 6.942237543984334
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rise of voice chat rooms, a gigantic resource of data can be exposed
to the research community for natural language processing tasks. Moderators in
voice chat rooms actively monitor the discussions and remove the participants
with offensive language. However, it makes the hate speech detection even more
difficult since some participants try to find creative ways to articulate hate
speech. This makes the hate speech detection challenging in new social media
like Clubhouse. To the best of our knowledge all the hate speech datasets have
been collected from text resources like Twitter. In this paper, we take the
first step to collect a significant dataset from Clubhouse as the rising star
in social media industry. We analyze the collected instances from statistical
point of view using the Google Perspective Scores. Our experiments show that,
the Perspective Scores can outperform Bag of Words and Word2Vec as high level
text features.
- Abstract(参考訳): 音声チャットルームの出現により、自然言語処理タスクのための研究コミュニティに膨大な量のデータを公開することができる。
音声チャットルームのモデレーターは、議論を積極的に監視し、不快な言葉で参加者を排除します。
しかし、一部の参加者は、ヘイトスピーチを明瞭化するための創造的な方法を見つけようとするため、ヘイトスピーチ検出がさらに困難になる。
これにより、clubhouseのような新しいソーシャルメディアではヘイトスピーチ検出が困難になる。
私たちの知る限り、ヘイトスピーチデータセットはすべて、twitterのようなテキストリソースから収集されています。
本稿では,ソーシャルメディア業界のスターとして,Clubhouseから重要なデータセットを収集する第一歩を踏み出した。
Google Perspective Scoresを用いて,収集したインスタンスを統計的視点から分析する。
私たちの実験では、視点スコアが高レベルのテキスト機能として単語とword2vecの袋を上回ることを示しています。
関連論文リスト
- An Investigation of Large Language Models for Real-World Hate Speech
Detection [46.15140831710683]
既存の手法の大きな制限は、ヘイトスピーチ検出がコンテキストの問題である点である。
近年,大規模言語モデル (LLM) はいくつかの自然言語処理において最先端の性能を示した。
本研究は, ヘイトスピーチの文脈を効果的に把握する上で, 巧妙な推論プロンプトが有効であることを明らかにする。
論文 参考訳(メタデータ) (2024-01-07T00:39:33Z) - Hate Speech Detection via Dual Contrastive Learning [25.878271501274245]
本稿では,ヘイトスピーチ検出のための新しい双方向コントラスト学習フレームワークを提案する。
本フレームワークは,自己教師型学習と教師型学習の損失を協調的に最適化し,スパンレベルの情報を取得する。
公開可能な2つの英語データセットの実験を行い、実験結果から、提案モデルが最先端のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2023-07-10T13:23:36Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - Assessing the impact of contextual information in hate speech detection [0.48369513656026514]
我々は,Twitter上のメディアからのニュース投稿に対するユーザの反応に基づいた,文脈的ヘイトスピーチ検出のための新しいコーパスを提供する。
このコーパスはリオプラテンセ方言のスペイン語で収集され、新型コロナウイルスのパンデミックに関連するヘイトスピーチに焦点を当てている。
論文 参考訳(メタデータ) (2022-10-02T09:04:47Z) - A Review of Challenges in Machine Learning based Automated Hate Speech
Detection [0.966840768820136]
我々は、ヘイトスピーチ識別のための機械学習やディープラーニングベースのソリューションが直面する課題に焦点を当てている。
トップレベルでは、データレベル、モデルレベル、人間レベルの課題を区別します。
この調査は、ヘイトスピーチ検出の分野で、研究者がより効率的にソリューションを設計するのに役立つだろう。
論文 参考訳(メタデータ) (2022-09-12T14:56:14Z) - Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。
私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。
そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文 参考訳(メタデータ) (2022-02-19T03:48:20Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Detection of Hate Speech using BERT and Hate Speech Word Embedding with
Deep Model [0.5801044612920815]
本稿では,双方向LSTMに基づくディープモデルにドメイン固有の単語を埋め込み,ヘイトスピーチを自動的に検出・分類する可能性について検討する。
実験の結果、Bidirectional LSTMベースのディープモデルによるドメイン固有単語の埋め込みは93%のf1スコアを獲得し、BERTは96%のf1スコアを達成した。
論文 参考訳(メタデータ) (2021-11-02T11:42:54Z) - DeepHate: Hate Speech Detection via Multi-Faceted Text Representations [8.192671048046687]
DeepHateは、単語埋め込み、感情、トピック情報などの多面的なテキスト表現を組み合わせた、新しいディープラーニングモデルです。
大規模な実験を行い、3つの大規模公開現実世界のデータセットでDeepHateを評価します。
論文 参考訳(メタデータ) (2021-03-14T16:11:30Z) - Speaker De-identification System using Autoencoders and Adversarial
Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文 参考訳(メタデータ) (2020-11-09T19:22:05Z) - Racism is a Virus: Anti-Asian Hate and Counterspeech in Social Media
during the COVID-19 Crisis [51.39895377836919]
新型コロナウイルスは、アジアのコミュニティをターゲットにしたソーシャルメディア上で人種差別や憎悪を引き起こしている。
我々は、Twitterのレンズを通して、反アジアヘイトスピーチの進化と普及について研究する。
私たちは、14ヶ月にわたる反アジア的憎悪と反音声のデータセットとして最大となるCOVID-HATEを作成します。
論文 参考訳(メタデータ) (2020-05-25T21:58:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。