論文の概要: Hope Speech Detection on Social Media Platforms
- arxiv url: http://arxiv.org/abs/2212.07424v1
- Date: Mon, 14 Nov 2022 10:58:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 19:03:18.179805
- Title: Hope Speech Detection on Social Media Platforms
- Title(参考訳): ソーシャルメディアプラットフォーム上での希望音声検出
- Authors: Pranjal Aggarwal, Pasupuleti Chandana, Jagrut Nemade, Shubham Sharma,
Sunil Saumya, Shankar Biradar
- Abstract要約: 本稿では,文章をホープ音声,ノンホップ音声,ニュートラル文と識別するための機械学習アプローチについて論じる。
この研究で使用されたデータセットには、英語のYouTubeコメントが含まれている。
- 参考スコア(独自算出の注目度): 1.2561455657923906
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since personal computers became widely available in the consumer market, the
amount of harmful content on the internet has significantly expanded. In simple
terms, harmful content is anything online which causes a person distress or
harm. It may include hate speech, violent content, threats, non-hope speech,
etc. The online content must be positive, uplifting and supportive. Over the
past few years, many studies have focused on solving this problem through hate
speech detection, but very few focused on identifying hope speech. This paper
discusses various machine learning approaches to identify a sentence as Hope
Speech, Non-Hope Speech, or a Neutral sentence. The dataset used in the study
contains English YouTube comments and is released as a part of the shared task
"EACL-2021: Hope Speech Detection for Equality, Diversity, and Inclusion".
Initially, the dataset obtained from the shared task had three classes: Hope
Speech, non-Hope speech, and not in English; however, upon deeper inspection,
we discovered that dataset relabeling is required. A group of undergraduates
was hired to help perform the entire dataset's relabeling task. We experimented
with conventional machine learning models (such as Na\"ive Bayes, logistic
regression and support vector machine) and pre-trained models (such as BERT) on
relabeled data. According to the experimental results, the relabeled data has
achieved a better accuracy for Hope speech identification than the original
data set.
- Abstract(参考訳): パーソナルコンピュータが消費者市場で広く普及したため、インターネット上の有害コンテンツの量は大幅に増加した。
簡単に言えば、有害なコンテンツはネット上のあらゆるものであり、人の苦痛や危害を引き起こす。
ヘイトスピーチ、暴力的なコンテンツ、脅威、ノンホップスピーチなどが含まれる。
オンラインコンテンツは肯定的、高揚的、支持的でなければならない。
過去数年間、多くの研究はヘイトスピーチの検出を通してこの問題に焦点を合わせてきたが、ホープスピーチを特定することに焦点を絞った研究はほとんどない。
本稿では,文章をホープ音声,ノンホップ音声,ニュートラル文と識別するための機械学習手法について述べる。
この研究で使用されたデータセットには、英語のYouTubeコメントが含まれており、共有タスク「EACL-2021: Hope Speech Detection for Equality, Diversity, and Inclusion」の一部としてリリースされている。
当初、共有タスクから得られたデータセットは3つのクラス(hope speech、non-hope speech、not in english)を持っていたが、より深い検査の結果、データセットのrelabelingが必要であることが判明した。
大学生のグループが、データセット全体のrelabelingタスクを実行するために雇われました。
我々は,従来の機械学習モデル(Na\"ive Bayes,ロジスティック回帰,サポートベクタマシンなど)と,ラベル付きデータに対する事前学習モデル(BERTなど)を実験した。
実験結果によると、relabeledデータは、元のデータセットよりもホープ音声識別の精度が向上した。
関連論文リスト
- Explain Thyself Bully: Sentiment Aided Cyberbullying Detection with
Explanation [52.3781496277104]
さまざまなソーシャルメディアネットワークやオンラインコミュニケーションアプリの人気により、サイバーいじめが大きな問題になっている。
一般データ保護規則の「説明の権利」のような近年の法律は、解釈可能なモデルの開発に拍車をかけた。
我々は,コード混在言語からの自動サイバーバブル検出のための,mExCBと呼ばれる最初の解釈可能なマルチタスクモデルを開発した。
論文 参考訳(メタデータ) (2024-01-17T07:36:22Z) - PolyHope: Two-Level Hope Speech Detection from Tweets [68.8204255655161]
その重要性にもかかわらず、希望はソーシャルメディア分析タスクとして研究されることはめったにない。
本稿では、まず各ツイートを「ホップ」と「ノーホープ」に分類するホープ音声データセットを提案する。
2022年前半の英語のつぶやきは、このデータセットを構築するために集められた。
論文 参考訳(メタデータ) (2022-10-25T16:34:03Z) - Assessing the impact of contextual information in hate speech detection [0.48369513656026514]
我々は,Twitter上のメディアからのニュース投稿に対するユーザの反応に基づいた,文脈的ヘイトスピーチ検出のための新しいコーパスを提供する。
このコーパスはリオプラテンセ方言のスペイン語で収集され、新型コロナウイルスのパンデミックに関連するヘイトスピーチに焦点を当てている。
論文 参考訳(メタデータ) (2022-10-02T09:04:47Z) - SpeechLM: Enhanced Speech Pre-Training with Unpaired Textual Data [100.46303484627045]
本稿では,事前定義した統一表現と音声とテキストの事前学習を協調させるクロスモーダル音声言語モデル(SpeechLM)を提案する。
具体的には、音声とテキストのモダリティをブリッジするために、2つの別の離散トークン化器を導入する。
音声認識, 音声翻訳, ユニバーサル表現評価フレームワーク SUPERB など, 様々な音声言語処理タスクにおける音声LM の評価を行った。
論文 参考訳(メタデータ) (2022-09-30T09:12:10Z) - Emotion Based Hate Speech Detection using Multimodal Learning [0.0]
本稿では,感情を表す聴覚特徴と,ヘイトフルなコンテンツを検出する意味的特徴を組み合わせた,最初のマルチモーダル深層学習フレームワークを提案する。
以上の結果から,感情的属性を取り入れることで,ヘイトフルなマルチメディアコンテンツの検出におけるテキストベースモデルよりも顕著な改善がもたらされることが示唆された。
論文 参考訳(メタデータ) (2022-02-13T05:39:47Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Hate Speech detection in the Bengali language: A dataset and its
baseline evaluation [0.8793721044482612]
本稿では,クラウドソーシングによってタグ付けされ,専門家によって検証された3万のユーザコメントのデータセットを提案する。
コメントはすべてYouTubeとFacebookのコメントセクションから収集され、7つのカテゴリに分類される。
合計50人の注釈家が各コメントに3回注釈を付け、多数決が最終注釈として採決された。
論文 参考訳(メタデータ) (2020-12-17T15:53:54Z) - Trawling for Trolling: A Dataset [56.1778095945542]
攻撃的コンテンツのサブカテゴリとしてトロリングをモデル化するデータセットを提案する。
データセットには12,490のサンプルがあり、5つのクラスに分かれている。
論文 参考訳(メタデータ) (2020-08-02T17:23:55Z) - "Notic My Speech" -- Blending Speech Patterns With Multimedia [65.91370924641862]
音声認識と理解における視点依存と視覚的重要性の両方をモデル化するための視点時間的注意機構を提案する。
提案手法は, ビセム誤差率において, 既存の作業よりも4.99%優れていた。
モデルでは,多視点音声に対する理解と人間の知覚との間に強い相関関係があることが示されている。
論文 参考訳(メタデータ) (2020-06-12T06:51:55Z) - Transfer Learning for Hate Speech Detection in Social Media [14.759208309842178]
本稿では、2つの独立したデータセットを協調的に活用するために転送学習手法を用いる。
我々は、構築されたヘイトスピーチ表現の解釈可能な2次元可視化ツールを構築します。
この共同表現は,限られた監督範囲の場合にのみ予測性能が向上することを示す。
論文 参考訳(メタデータ) (2019-06-10T08:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。