論文の概要: NAYEL at SemEval-2020 Task 12: TF/IDF-Based Approach for Automatic
Offensive Language Detection in Arabic Tweets
- arxiv url: http://arxiv.org/abs/2007.13339v1
- Date: Mon, 27 Jul 2020 07:44:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 09:05:46.786469
- Title: NAYEL at SemEval-2020 Task 12: TF/IDF-Based Approach for Automatic
Offensive Language Detection in Arabic Tweets
- Title(参考訳): NAYEL at SemEval-2020 Task 12: TF/IDF-based Approach for Automatic Offensive Language Detection in Arabic Tweets (英語)
- Authors: Hamada A. Nayel
- Abstract要約: 提案システムは,アラビア語のつぶやきにおける攻撃的言語を自動的に識別することを目的としている。
機械学習に基づくアプローチがシステムの設計に使われてきた。
最上位のシステムと最終ランクのシステムは、それぞれテストセットで90.17%と44.51%のf1スコアを報告した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present the system submitted to "SemEval-2020 Task 12". The
proposed system aims at automatically identify the Offensive Language in Arabic
Tweets. A machine learning based approach has been used to design our system.
We implemented a linear classifier with Stochastic Gradient Descent (SGD) as
optimization algorithm. Our model reported 84.20%, 81.82% f1-score on
development set and test set respectively. The best performed system and the
system in the last rank reported 90.17% and 44.51% f1-score on test set
respectively.
- Abstract(参考訳): 本稿では,SemEval-2020 Task 12に提出されたシステムについて述べる。
提案システムは,アラビア語のつぶやきにおける攻撃言語を自動的に識別することを目的としている。
機械学習に基づくアプローチがシステムの設計に使われてきた。
最適化アルゴリズムとしてSGD(Stochastic Gradient Descent)を用いた線形分類器を実装した。
我々のモデルは開発セットとテストセットでそれぞれ84.20%、f1-scoreが81.82%であった。
最上位のシステムと最下位のシステムはそれぞれテストセット上で90.17%と44.51%のf1-scoreであった。
関連論文リスト
- Exploiting prompt learning with pre-trained language models for
Alzheimer's Disease detection [70.86672569101536]
アルツハイマー病(AD)の早期診断は予防ケアの促進とさらなる進行の遅らせに不可欠である。
本稿では,AD分類誤差をトレーニング対象関数として一貫して用いたPLMの高速微調整法について検討する。
論文 参考訳(メタデータ) (2022-10-29T09:18:41Z) - Using Sampling to Estimate and Improve Performance of Automated Scoring
Systems with Guarantees [63.62448343531963]
本稿では,既存のパラダイムを組み合わせることで,人間が知能的に収集する応答をサンプリングする手法を提案する。
比較的少ない予算で精度(平均19.80%)と二次重み付きカッパ(平均25.60%)の顕著な増加を観察した。
論文 参考訳(メタデータ) (2021-11-17T05:00:51Z) - The USYD-JD Speech Translation System for IWSLT 2021 [85.64797317290349]
本稿では,シドニー大学とJDが共同でIWSLT 2021低リソース音声翻訳タスクを提出したことを述べる。
私たちは、公式に提供されたASRとMTデータセットでモデルをトレーニングしました。
翻訳性能の向上を目的として, バック翻訳, 知識蒸留, 多機能再構成, トランスダクティブファインタニングなど, 最新の効果的な手法について検討した。
論文 参考訳(メタデータ) (2021-07-24T09:53:34Z) - Get It Scored Using AutoSAS -- An Automated System for Scoring Short
Answers [63.835172924290326]
SAS(Automatic Short Answer Scoring)への高速でスケーラブルで正確なアプローチを提示します。
SASのためのシステム、すなわちAutoSASの設計と開発を提案し、説明します。
AutoSASは最先端のパフォーマンスを示し、いくつかの質問のプロンプトで8%以上良い結果が得られる。
論文 参考訳(メタデータ) (2020-12-21T10:47:30Z) - Phonemer at WNUT-2020 Task 2: Sequence Classification Using COVID
Twitter BERT and Bagging Ensemble Technique based on Plurality Voting [0.0]
新型コロナウイルス(COVID-19)に関連する英語のつぶやきを自動的に識別するシステムを開発した。
最終アプローチでは0.9037のF1スコアを達成し,F1スコアを評価基準として総合6位にランク付けした。
論文 参考訳(メタデータ) (2020-10-01T10:54:54Z) - LynyrdSkynyrd at WNUT-2020 Task 2: Semi-Supervised Learning for
Identification of Informative COVID-19 English Tweets [4.361526134899725]
本稿では,WNUT-2020における情報発信型英語ツイートの識別に関する共有タスクについて述べる。
本システムは,従来の特徴量に基づく分類と,事前学習型言語モデルの最近の進歩を活かした,さまざまな機械学習手法のアンサンブルである。
我々の最高の性能モデルは、提供された検証セットのF1スコア0.9179、ブラインドテストセットの0.8805を達成する。
論文 参考訳(メタデータ) (2020-09-08T16:29:25Z) - Garain at SemEval-2020 Task 12: Sequence based Deep Learning for
Categorizing Offensive Language in Social Media [3.236217153362305]
SemEval-2020 Task 12: OffenseEval: Multilingual Offensive Language Identification in Social Media (英語)
データセットマクロ全体の25%のトレーニングシステムでは,f1スコアが47.763%であった。
論文 参考訳(メタデータ) (2020-09-02T17:09:29Z) - Decision Tree J48 at SemEval-2020 Task 9: Sentiment Analysis for
Code-Mixed Social Media Text (Hinglish) [3.007778295477907]
このシステムは、ツイートの分類のための分類器を提供するツールとして、Wekaを使用している。
pythonは提供されたファイルからデータをロードし、クリーニングするために使われる。
システム性能は,公式競技評価基準F1スコアを用いて評価した。
論文 参考訳(メタデータ) (2020-08-26T06:30:43Z) - Evaluation Toolkit For Robustness Testing Of Automatic Essay Scoring
Systems [64.4896118325552]
モデル逆算評価スキームと関連するメトリクスを用いて、現状のAESモデルを評価する。
AESモデルは非常に過大評価されていることがわかった。質問の話題に関係のない内容の重い修正(25%まで)でさえ、モデルが生み出すスコアを低下させることはない。
論文 参考訳(メタデータ) (2020-07-14T03:49:43Z) - Hitachi at SemEval-2020 Task 12: Offensive Language Identification with
Noisy Labels using Statistical Sampling and Post-Processing [13.638230797979917]
本稿では,雑音ラベルからの攻撃的言語識別に焦点を当てたSemEval-2020 Task-12 Subtask-A(英語)に参加する。
我々は,統計的サンプリングアルゴリズム (SA) とポストプロシーズド (PP) を用いて,攻撃的な単語リストを用いてツイートを訓練したBERT分類器を用いたハイブリッドシステムを開発した。
本システムでは攻撃性および非攻撃性の両方に対して, 0.90913のマクロ平均F1スコア (Macro-F1) で34位に到達した。
論文 参考訳(メタデータ) (2020-05-01T10:16:40Z) - Kungfupanda at SemEval-2020 Task 12: BERT-Based Multi-Task Learning for
Offensive Language Detection [55.445023584632175]
我々は,マルチタスク学習とBERTモデルを組み合わせた攻撃的言語検出システムを構築した。
我々のモデルは、英語のサブタスクAで91.51%のF1スコアを獲得し、これは第1位に匹敵する。
論文 参考訳(メタデータ) (2020-04-28T11:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。