論文の概要: Meta AI at Arabic Hate Speech 2022: MultiTask Learning with
Self-Correction for Hate Speech Classification
- arxiv url: http://arxiv.org/abs/2205.07960v1
- Date: Mon, 16 May 2022 19:53:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-18 13:26:44.418311
- Title: Meta AI at Arabic Hate Speech 2022: MultiTask Learning with
Self-Correction for Hate Speech Classification
- Title(参考訳): アラビア語 Hate Speech 2022: MultiTask Learning with Self-Correction for Hate Speech Classification (英語)
- Authors: Badr AlKhamissi, Mona Diab
- Abstract要約: アラビア・ファイングレード・ヘイト音声検出共有タスクに取り組む。
課題は,(1)攻撃的言語を含むか否か,(2)ヘイトスピーチとみなすか否かを予測し,(3)ファイングレード・ヘイトスピーチラベルを6つのカテゴリのうちの1つから予測することである。
最後の解決策は,マルチタスク学習と,ヘイトスピーチのサブタスクに対して82.7%の自己整合性補正手法を用いたモデルのアンサンブルである。
- 参考スコア(独自算出の注目度): 20.632017481940075
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we tackle the Arabic Fine-Grained Hate Speech Detection shared
task and demonstrate significant improvements over reported baselines for its
three subtasks. The tasks are to predict if a tweet contains (1) Offensive
language; and whether it is considered (2) Hate Speech or not and if so, then
predict the (3) Fine-Grained Hate Speech label from one of six categories. Our
final solution is an ensemble of models that employs multitask learning and a
self-consistency correction method yielding 82.7% on the hate speech subtask --
reflecting a 3.4% relative improvement compared to previous work.
- Abstract(参考訳): 本稿では,アラビア・ファイングレード・ヘイト音声検出共有タスクに取り組み,その3つのサブタスクに対して報告されたベースラインよりも大幅に改善したことを示す。
タスクは、ツイートが(1)攻撃的言語を含むか、(2)ヘイトスピーチを含むか、(2)ヘイトスピーチであるか否かを予測し、(3)きめ細かいヘイトスピーチラベルを6つのカテゴリのうちの1つから予測することである。
最後の解決策は、マルチタスク学習と、ヘイトスピーチのサブタスクで82.7%の自己整合性補正手法を用いたモデルのアンサンブルである。
関連論文リスト
- Voxtlm: unified decoder-only models for consolidating speech
recognition/synthesis and speech/text continuation tasks [61.3055230762097]
音声認識,音声合成,テキスト生成,音声継続の4つのタスクを実行できるデコーダのみの言語モデルであるVoxtLMを提案する。
VoxtLMは、テキスト語彙を自己教師付き音声特徴から独立した音声トークンと統合し、マルチタスク学習を可能にするために特別なトークンを使用する。
論文 参考訳(メタデータ) (2023-09-14T03:13:18Z) - Automatic Translation of Hate Speech to Non-hate Speech in Social Media
Texts [0.0]
本稿では,ヘイトスピーチを非ヘイトスピーチテキストに翻訳し,その意味を保ちながら新たなタスクを提案する。
さらなる研究の出発点として、データセットといくつかのベースラインを提供します。
本研究の目的は、オンラインコミュニティにおけるヘイトスピーチの拡散を減らすための、より効果的な方法の開発に寄与することである。
論文 参考訳(メタデータ) (2023-06-02T04:03:14Z) - DisfluencyFixer: A tool to enhance Language Learning through Speech To
Speech Disfluency Correction [50.51901599433536]
DisfluencyFixerは、英語とヒンディー語で音声から音声への拡散補正を行うツールである。
提案システムでは,入力音声からの拡散を除去し,出力として流速音声を返却する。
論文 参考訳(メタデータ) (2023-05-26T14:13:38Z) - AlexU-AIC at Arabic Hate Speech 2022: Contrast to Classify [2.9220076568786326]
アラビア・ヘイトスピーチ2022共有タスクワークショップ(OSACT52022)に、関連するアラビア・Twitterデータセットを用いて提出する。
攻撃的なツイートに関しては、サブタスクBは、ツイートがヘイトスピーチであるか否かを検出することに焦点を当てている。
ヘイトスピーチのつぶやきに対して、サブタスクCは6つの異なるクラス間のきめ細かいタイプのヘイトスピーチを検出することに重点を置いている。
論文 参考訳(メタデータ) (2022-07-18T12:33:51Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - Unified Speech-Text Pre-training for Speech Translation and Recognition [113.31415771943162]
音声認識のためのエンコーダ・デコーダ・モデリング・フレームワークにおいて,音声とテキストを協調的に事前学習する手法について述べる。
提案手法は,4つの自己教師付きサブタスクを組み込んだクロスモーダル学習手法である。
MuST-C音声翻訳データセットの最先端よりも1.7から2.3BLEUの改善が達成されている。
論文 参考訳(メタデータ) (2022-04-11T20:59:51Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - One to rule them all: Towards Joint Indic Language Hate Speech Detection [7.296361860015606]
本稿では、最先端のトランスフォーマー言語モデルを用いて、ヘイトや攻撃的な音声検出を共同で学習する多言語アーキテクチャを提案する。
提案したテストコーパスでは,サブタスク1AのマクロF1スコアが0.7996,0.7748,0.8651,サブタスク1Bのきめ細かい分類において0.6268,0.5603となる。
論文 参考訳(メタデータ) (2021-09-28T13:30:00Z) - Overview of the HASOC track at FIRE 2020: Hate Speech and Offensive
Content Identification in Indo-European Languages [2.927129789938848]
HASOCトラックはヒンディー語、ドイツ語、英語向けのHate Speech Detectionアルゴリズムの開発と最適化を目的としている。
データセットはTwitterアーカイブから収集され、機械学習システムによって事前に分類される。
全体では40チーム252本が提出された。タスクAの最良の分類アルゴリズムは、それぞれ英語、ヒンディー語、ドイツ語で0.51本、0.53本、ドイツ語で0.52本である。
論文 参考訳(メタデータ) (2021-08-12T19:02:53Z) - Leveraging Multilingual Transformers for Hate Speech Detection [11.306581296760864]
我々は,アートトランスフォーマー言語モデルを用いて,多言語環境でヘイトスピーチを識別する。
学習済みの多言語トランスフォーマーベースのテキストエンコーダをベースとして,複数の言語からヘイトスピーチを識別し,分類することができる。
論文 参考訳(メタデータ) (2021-01-08T20:23:50Z) - Bridging the Modality Gap for Speech-to-Text Translation [57.47099674461832]
エンド・ツー・エンドの音声翻訳は、ある言語における音声を、エンド・ツー・エンドの方法で他の言語におけるテキストに変換することを目的としている。
既存のほとんどの手法では、音響表現と意味情報を同時に学習するために、単一のエンコーダを持つエンコーダ・デコーダ構造を用いる。
本稿では,音声とテキスト間のモダリティギャップを埋めることで,エンドツーエンドのモデル性能を向上させることを目的とした音声翻訳モデルのための音声テキスト適応手法を提案する。
論文 参考訳(メタデータ) (2020-10-28T12:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。