論文の概要: HSD Shared Task in VLSP Campaign 2019:Hate Speech Detection for Social
Good
- arxiv url: http://arxiv.org/abs/2007.06493v1
- Date: Mon, 13 Jul 2020 16:43:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 23:59:53.684758
- Title: HSD Shared Task in VLSP Campaign 2019:Hate Speech Detection for Social
Good
- Title(参考訳): VLSPキャンペーン2019におけるHSD共有タスク:ソーシャルグッズに対するヘイトスピーチ検出
- Authors: Xuan-Son Vu, Thanh Vu, Mai-Vu Tran, Thanh Le-Cong, Huyen T M. Nguyen
- Abstract要約: この記事では、2019年のVLSPワークショップにおいて、"HateSpeech Detection"(HSD)タスクの組織について説明する。
このタスクは、マルチクラス分類タスクとして編成され、Facebookから25,431のベトナムのテキストアイテムを含む大規模なデータセットに基づいている。
- 参考スコア(独自算出の注目度): 6.413512495984789
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The paper describes the organisation of the "HateSpeech Detection" (HSD) task
at the VLSP workshop 2019 on detecting the fine-grained presence of hate speech
in Vietnamese textual items (i.e., messages) extracted from Facebook, which is
the most popular social network site (SNS) in Vietnam. The task is organised as
a multi-class classification task and based on a large-scale dataset containing
25,431 Vietnamese textual items from Facebook. The task participants were
challenged to build a classification model that is capable of classifying an
item to one of 3 classes, i.e., "HATE", "OFFENSIVE" and "CLEAN". HSD attracted
a large number of participants and was a popular task at VLSP 2019. In
particular, there were 71 teams signed up for the task, 14 of them submitted
results with 380 valid submissions from 20th September 2019 to 4th October
2019.
- Abstract(参考訳): ベトナムで最も人気のあるsns(sns)であるfacebookから抽出されたベトナム語テクストアイテム(すなわちメッセージ)におけるヘイトスピーチのきめ細かい存在を検出することを目的とした、vlsp workshop 2019におけるhatespeech detection(hsd)タスクの組織化について述べる。
このタスクは、マルチクラス分類タスクとして編成され、facebookから25,431のベトナム語のテキストアイテムを含む大規模データセットに基づいている。
課題参加者は、項目を「HATE」「OFFENSIVE」「CLEAN」という3つのクラスのいずれかに分類できる分類モデルを構築するよう求められた。
HSDは多くの参加者を集め、VLSP 2019で人気のタスクとなった。
特にこのタスクには71チームが参加し、そのうち14チームが2019年9月20日から2019年10月4日までの380回の有効応募の結果を提出した。
関連論文リスト
- ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - SemEval-2024 Task 8: Multidomain, Multimodel and Multilingual Machine-Generated Text Detection [68.858931667807]
Subtask Aは、テキストが人間によって書かれたか、機械によって生成されたかを決定するバイナリ分類タスクである。
サブタスクBは、テキストの正確なソースを検出し、それが人間によって書かれたか、特定のLCMによって生成されたかを認識する。
Subtask Cは、著者が人間から機械へ遷移するテキスト内の変化点を特定することを目的としている。
論文 参考訳(メタデータ) (2024-04-22T13:56:07Z) - SemEval-2024 Shared Task 6: SHROOM, a Shared-task on Hallucinations and Related Observable Overgeneration Mistakes [48.83290963506378]
本稿では,幻覚検出に焦点をあてた共有タスクであるSHROOMの結果について述べる。
このアプローチをどのように取り組んだかについて、いくつかの重要なトレンドを観察します。
チームの大多数が提案したベースラインシステムより優れていますが、トップスコアシステムのパフォーマンスは依然として、より困難なアイテムのランダムなハンドリングと一致しています。
論文 参考訳(メタデータ) (2024-03-12T15:06:22Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - UrduFake@FIRE2021: Shared Track on Fake News Identification in Urdu [55.41644538483948]
本研究は、ウルドゥー語で偽ニュースを検出するために、UrduFake@FIRE2021と名付けられた2番目の共有タスクを報告した。
提案システムは、様々なカウントベースの特徴に基づいており、異なる分類器とニューラルネットワークアーキテクチャを使用していた。
勾配降下(SGD)アルゴリズムは他の分類器よりも優れ、0.679Fスコアを達成した。
論文 参考訳(メタデータ) (2022-07-11T19:15:04Z) - Overview of the HASOC Subtrack at FIRE 2021: Hate Speech and Offensive
Content Identification in English and Indo-Aryan Languages [4.267837363677351]
本稿では,英語,ヒンディー語,マラタイ語のHASOCサブトラックについて述べる。
データセットはTwitterから集められた。
タスクAの最良の分類アルゴリズムのパフォーマンスは、マラタイ、ヒンディー語、英語でそれぞれ0.91、0.78、0.83である。
論文 参考訳(メタデータ) (2021-12-17T03:28:54Z) - Overview of the HASOC track at FIRE 2020: Hate Speech and Offensive
Content Identification in Indo-European Languages [2.927129789938848]
HASOCトラックはヒンディー語、ドイツ語、英語向けのHate Speech Detectionアルゴリズムの開発と最適化を目的としている。
データセットはTwitterアーカイブから収集され、機械学習システムによって事前に分類される。
全体では40チーム252本が提出された。タスクAの最良の分類アルゴリズムは、それぞれ英語、ヒンディー語、ドイツ語で0.51本、0.53本、ドイツ語で0.52本である。
論文 参考訳(メタデータ) (2021-08-12T19:02:53Z) - WOLI at SemEval-2020 Task 12: Arabic Offensive Language Identification
on Different Twitter Datasets [0.0]
ソーシャルメディア上で攻撃的言語と戦うための鍵は、自動攻撃的言語検出システムの存在である。
本稿では,Macro-F1 86.9%の52人中10位にランクインした共有タスクに対して,WideBot AI Labが提出したシステムについて述べる。
また、CNN、ハイウェイネットワーク、Bi-LSTM、アテンション層を含むシステムの予測能力を向上するニューラルネットワークアプローチも導入しました。
論文 参考訳(メタデータ) (2020-09-11T14:10:03Z) - Garain at SemEval-2020 Task 12: Sequence based Deep Learning for
Categorizing Offensive Language in Social Media [3.236217153362305]
SemEval-2020 Task 12: OffenseEval: Multilingual Offensive Language Identification in Social Media (英語)
データセットマクロ全体の25%のトレーニングシステムでは,f1スコアが47.763%であった。
論文 参考訳(メタデータ) (2020-09-02T17:09:29Z) - SemEval-2020 Task 10: Emphasis Selection for Written Text in Visual
Media [50.29389719723529]
本稿では,SemEval-2020 Task 10, Emphasis Selection for Written Text in Visual Media の主な成果とその結果を比較した。
この共有タスクの目的は、強調選択のための自動メソッドを設計することである。
タスクに送信されたシステムの解析は、BERTとRoBERTaが、トレーニング済みモデルの最も一般的な選択であることを示している。
論文 参考訳(メタデータ) (2020-08-07T17:24:53Z) - SemEval-2020 Task 12: Multilingual Offensive Language Identification in
Social Media (OffensEval 2020) [33.66689662526814]
ソーシャルメディアにおける多言語攻撃言語識別に関するSemEval-2020 Task 12の結果と主な成果を報告する(OffensEval 2020)。
OffensEval 2020は、SemEval-2020で最も人気のあるタスクの1つで、すべてのサブタスク、およびすべての言語で多くの参加者を集めている。
528チームが参加し、145チームが評価期間中にシステムを提出し、70チームがシステム説明書を提出した。
論文 参考訳(メタデータ) (2020-06-12T14:39:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。