論文の概要: WESSA at SemEval-2020 Task 9: Code-Mixed Sentiment Analysis using
Transformers
- arxiv url: http://arxiv.org/abs/2009.09879v1
- Date: Mon, 21 Sep 2020 13:59:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 04:07:47.364788
- Title: WESSA at SemEval-2020 Task 9: Code-Mixed Sentiment Analysis using
Transformers
- Title(参考訳): SemEval-2020 Task 9 における WESSA: トランスフォーマーを用いたコード混合感性解析
- Authors: Ahmed Sultan (WideBot), Mahmoud Salim (WideBot), Amina Gaber
(WideBot), Islam El Hosary (WideBot)
- Abstract要約: 本稿では,SemEval 2020 Task 9, Code-Mixed Social Media Text の感性分析を行う。
我々の最高の演奏システムは「XLM-RoBERTa」を微調整したトランスファーラーニングベースモデルである
その後の提出では、CodaLabのユーザネーム"ahmed0sultan"を使ってテストセットの平均F1スコアを75.9%達成することに成功した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we describe our system submitted for SemEval 2020 Task 9,
Sentiment Analysis for Code-Mixed Social Media Text alongside other
experiments. Our best performing system is a Transfer Learning-based model that
fine-tunes "XLM-RoBERTa", a transformer-based multilingual masked language
model, on monolingual English and Spanish data and Spanish-English code-mixed
data. Our system outperforms the official task baseline by achieving a 70.1%
average F1-Score on the official leaderboard using the test set. For later
submissions, our system manages to achieve a 75.9% average F1-Score on the test
set using CodaLab username "ahmed0sultan".
- Abstract(参考訳): 本稿では,SemEval 2020 Task 9, Code-Mixed Social Media Text の感性分析を他の実験とともに提案するシステムについて述べる。
我々の最高のパフォーマンスシステムは、モノリンガルな英語とスペイン語のデータとスペイン語のコードミキシングデータに基づいて、トランスファーラーニングベースモデル「XLM-RoBERTa」を微調整するトランスファーラーニングベースモデルである。
我々のシステムは、テストセットを使用して、公式のリーダーボード上で、70.1%の平均F1スコアを達成することで、公式タスクベースラインを上回ります。
その後の提出では、テストセットの75.9%の平均F1スコアを、CodaLabのユーザ名"ahmed0sultan"を使って達成する。
関連論文リスト
- Strategies for improving low resource speech to text translation relying
on pre-trained ASR models [59.90106959717875]
本稿では,テキスト翻訳(ST)における低音源音声の性能向上のための技術と知見について述べる。
本研究は,英語とポルトガル語,タマシェク語とフランス語の2つの言語対について,シミュレーションおよび実低資源設定について実験を行った。
論文 参考訳(メタデータ) (2023-05-31T21:58:07Z) - BJTU-WeChat's Systems for the WMT22 Chat Translation Task [66.81525961469494]
本稿では,WMT'22チャット翻訳タスクに対して,北京地東大学とWeChat AIを共同で提案する。
Transformerに基づいて、いくつかの有効な変種を適用します。
本システムでは,0.810と0.946のCOMETスコアを達成している。
論文 参考訳(メタデータ) (2022-11-28T02:35:04Z) - Transformer-based Model for Word Level Language Identification in
Code-mixed Kannada-English Texts [55.41644538483948]
コードミキシングしたカンナダ英語テキストにおける単語レベル言語識別のためのトランスフォーマーベースモデルを提案する。
The proposed model on the CoLI-Kenglish dataset achieves a weighted F1-score of 0.84 and a macro F1-score of 0.61。
論文 参考訳(メタデータ) (2022-11-26T02:39:19Z) - Tencent AI Lab - Shanghai Jiao Tong University Low-Resource Translation
System for the WMT22 Translation Task [49.916963624249355]
本稿では, Tencent AI Lab - Shanghai Jiao Tong University (TAL-SJTU) Low-Resource Translation system for the WMT22 shared taskについて述べる。
我々は、英語$Leftrightarrow$Livonianの一般的な翻訳作業に参加する。
本システムは,M2M100を対象言語に適応させる新しい手法を用いて構築した。
論文 参考訳(メタデータ) (2022-10-17T04:34:09Z) - Palomino-Ochoa at SemEval-2020 Task 9: Robust System based on
Transformer for Code-Mixed Sentiment Classification [1.6244541005112747]
本稿では、スペイン語と英語の混合感情分類タスクを実行するための移動学習システムを提案する。
提案手法では,最先端の言語モデルBERTを使用し,UMMFiT転送学習パイプラインに組み込む。
論文 参考訳(メタデータ) (2020-11-18T18:25:58Z) - NLP-CIC at SemEval-2020 Task 9: Analysing sentiment in code-switching
language using a simple deep-learning classifier [63.137661897716555]
コードスイッチングは、2つ以上の言語が同じメッセージで使用される現象である。
標準的な畳み込みニューラルネットワークモデルを用いて、スペイン語と英語の混在するツイートの感情を予測する。
論文 参考訳(メタデータ) (2020-09-07T19:57:09Z) - UPB at SemEval-2020 Task 9: Identifying Sentiment in Code-Mixed Social
Media Texts using Transformers and Multi-Task Learning [1.7196613099537055]
本研究チームは,SemEval-2020 Task 9のために開発したシステムについて述べる。
私たちは、ヒンディー語とスペイン語の2つのよく知られた混成言語をカバーすることを目指しています。
提案手法は, 平均F1スコアが0.6850であるヒンディー語タスクにおいて, 有望な性能を達成する。
スペイン語と英語のタスクでは、29人中17人として、平均で0.7064のF1スコアを獲得しました。
論文 参考訳(メタデータ) (2020-09-06T17:19:18Z) - LIMSI_UPV at SemEval-2020 Task 9: Recurrent Convolutional Neural Network
for Code-mixed Sentiment Analysis [8.8561720398658]
本稿では,SemEval-2020 Task 9: Sentiment Analysis for Code-Mixed Social Media TextにおけるLIMSI UPVチームの参加について述べる。
提案手法はSentiMix Hindi- English subtaskで競合し、Hindi- English code-mixedTweetの感情を予測する問題に対処した。
本稿では,リカレントニューラルネットワークと畳み込みニューラルネットワークを併用して,テキストのセマンティクスをよりよく捉えたリカレント畳み込みニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-30T13:52:24Z) - Decision Tree J48 at SemEval-2020 Task 9: Sentiment Analysis for
Code-Mixed Social Media Text (Hinglish) [3.007778295477907]
このシステムは、ツイートの分類のための分類器を提供するツールとして、Wekaを使用している。
pythonは提供されたファイルからデータをロードし、クリーニングするために使われる。
システム性能は,公式競技評価基準F1スコアを用いて評価した。
論文 参考訳(メタデータ) (2020-08-26T06:30:43Z) - Voice@SRIB at SemEval-2020 Task 9 and 12: Stacked Ensembling method for
Sentiment and Offensiveness detection in Social Media [2.9008108937701333]
埋め込み、Sentimixのアンサンブルメソッド、OffensEvalタスクをトレーニングします。
我々は、マクロF1スコア、精度、精度、およびデータセットのリコールについて、我々のモデルを評価する。
論文 参考訳(メタデータ) (2020-07-20T11:54:43Z) - Enhanced Universal Dependency Parsing with Second-Order Inference and
Mixture of Training Data [48.8386313914471]
本稿では,テキストIWPT 2020共有タスクに使用するシステムについて述べる。
低リソースのタミルコーパスでは、タミルの訓練データを他の言語と特別に混合し、タミルの性能を大幅に改善する。
論文 参考訳(メタデータ) (2020-06-02T06:42:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。