論文の概要: WOLI at SemEval-2020 Task 12: Arabic Offensive Language Identification
on Different Twitter Datasets
- arxiv url: http://arxiv.org/abs/2009.05456v1
- Date: Fri, 11 Sep 2020 14:10:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 21:53:10.929270
- Title: WOLI at SemEval-2020 Task 12: Arabic Offensive Language Identification
on Different Twitter Datasets
- Title(参考訳): WOLI at SemEval-2020 Task 12: Arabic Offensive Language Identification on different Twitter datasets (英語)
- Authors: Yasser Otiefy (WideBot), Ahmed Abdelmalek (WideBot), Islam El Hosary
(WideBot)
- Abstract要約: ソーシャルメディア上で攻撃的言語と戦うための鍵は、自動攻撃的言語検出システムの存在である。
本稿では,Macro-F1 86.9%の52人中10位にランクインした共有タスクに対して,WideBot AI Labが提出したシステムについて述べる。
また、CNN、ハイウェイネットワーク、Bi-LSTM、アテンション層を含むシステムの予測能力を向上するニューラルネットワークアプローチも導入しました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Communicating through social platforms has become one of the principal means
of personal communications and interactions. Unfortunately, healthy
communication is often interfered by offensive language that can have damaging
effects on the users. A key to fight offensive language on social media is the
existence of an automatic offensive language detection system. This paper
presents the results and the main findings of SemEval-2020, Task 12 OffensEval
Sub-task A Zampieri et al. (2020), on Identifying and categorising Offensive
Language in Social Media. The task was based on the Arabic OffensEval dataset
Mubarak et al. (2020). In this paper, we describe the system submitted by
WideBot AI Lab for the shared task which ranked 10th out of 52 participants
with Macro-F1 86.9% on the golden dataset under CodaLab username
"yasserotiefy". We experimented with various models and the best model is a
linear SVM in which we use a combination of both character and word n-grams. We
also introduced a neural network approach that enhanced the predictive ability
of our system that includes CNN, highway network, Bi-LSTM, and attention
layers.
- Abstract(参考訳): ソーシャルプラットフォームを通じたコミュニケーションは、パーソナルコミュニケーションと対話の主要な手段の1つになっている。
残念なことに、健全なコミュニケーションは、しばしば攻撃的な言語によって妨害される。
ソーシャルメディア上で攻撃的言語と戦うための鍵は、自動攻撃的言語検出システムの存在である。
本稿では,SemEval-2020, Task 12 OffensEval Sub-task A Zampieri et al. (2020)の結果と,ソーシャルメディアにおけるOffensive Languageの同定と分類について述べる。
このタスクはアラビア語のオフエンセバルデータセットであるmubarak et al.(2020年)に基づいている。
本稿では,CidaLab ユーザ名 "yasserotiefy" に基づくゴールデンデータセットにおいて,マクロF1 86.9% の52人中10位にランクインした共有タスクに対して WideBot AI Lab が提出したシステムについて述べる。
我々は様々なモデルで実験を行い、最良のモデルは線形SVMであり、文字と単語n-gramの組み合わせを用いる。
また、CNN、ハイウェイネットワーク、Bi-LSTM、アテンション層を含むシステムの予測能力を向上するニューラルネットワークアプローチも導入しました。
関連論文リスト
- Social Support Detection from Social Media Texts [44.096359084699]
ソーシャルメディアのような様々な相互作用やプラットフォームを通じて伝えられる社会支援は、所有意識を育む上で重要な役割を担っている。
本稿では,自然言語処理(NLP)タスクとしてのソーシャルサポート検出(SSD)について紹介する。
我々は1万のYouTubeコメントからなるデータセットで実験を行った。
論文 参考訳(メタデータ) (2024-11-04T20:23:03Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - You Don't Know My Favorite Color: Preventing Dialogue Representations
from Revealing Speakers' Private Personas [44.82330540456883]
簡単なニューラルネットワークを用いて話者のペルソナを高精度に推定可能であることを示す。
提案する防衛目標が,攻撃精度を37.6%から0.5%に大幅に低減できることを示すため,広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-04-26T09:36:18Z) - Training Conversational Agents with Generative Conversational Networks [74.9941330874663]
我々は、生成会話ネットワークを使用して、自動的にデータを生成し、社会的会話エージェントを訓練する。
自動メトリクスと人的評価器を用いてTopicalChatのアプローチを評価し、10%のシードデータで100%のデータを使用するベースラインに近いパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-10-15T21:46:39Z) - Identifying and Categorizing Offensive Language in Social Media [0.0]
本研究は,SemEval 2019 Task 6: OffensEval用に構築された分類システムについて述べる。
私たちは、最良の結果を得るために、機械学習とディープラーニングモデルとデータ前処理とサンプリングテクニックをトレーニングしました。
論文 参考訳(メタデータ) (2021-04-10T22:53:43Z) - UPB at SemEval-2020 Task 12: Multilingual Offensive Language Detection
on Social Media by Fine-tuning a Variety of BERT-based Models [0.0]
本稿では,Twitter上の攻撃的言語を5言語で識別するTransformerベースのソリューションについて述べる。
これは、Offenseval 2020のSubtask Aの共有タスクで使用された。
論文 参考訳(メタデータ) (2020-10-26T14:28:29Z) - BRUMS at SemEval-2020 Task 12 : Transformer based Multilingual Offensive
Language Identification in Social Media [9.710464466895521]
ソーシャルメディアにおける攻撃的言語を特定するための多言語深層学習モデルを提案する。
このアプローチは、言語間の柔軟性を維持しながら、許容できる評価スコアを達成する。
論文 参考訳(メタデータ) (2020-10-13T10:39:14Z) - Garain at SemEval-2020 Task 12: Sequence based Deep Learning for
Categorizing Offensive Language in Social Media [3.236217153362305]
SemEval-2020 Task 12: OffenseEval: Multilingual Offensive Language Identification in Social Media (英語)
データセットマクロ全体の25%のトレーニングシステムでは,f1スコアが47.763%であった。
論文 参考訳(メタデータ) (2020-09-02T17:09:29Z) - Kungfupanda at SemEval-2020 Task 12: BERT-Based Multi-Task Learning for
Offensive Language Detection [55.445023584632175]
我々は,マルチタスク学習とBERTモデルを組み合わせた攻撃的言語検出システムを構築した。
我々のモデルは、英語のサブタスクAで91.51%のF1スコアを獲得し、これは第1位に匹敵する。
論文 参考訳(メタデータ) (2020-04-28T11:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。