論文の概要: SemEval-2020 Task 9: Overview of Sentiment Analysis of Code-Mixed Tweets
- arxiv url: http://arxiv.org/abs/2008.04277v1
- Date: Mon, 10 Aug 2020 17:17:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 22:57:09.237963
- Title: SemEval-2020 Task 9: Overview of Sentiment Analysis of Code-Mixed Tweets
- Title(参考訳): SemEval-2020 Task 9: Code-Mixed Tweets の知覚分析の概要
- Authors: Parth Patwa and Gustavo Aguilar and Sudipta Kar and Suraj Pandey and
Srinivas PYKL and Bj\"orn Gamb\"ack and Tanmoy Chakraborty and Thamar Solorio
and Amitava Das
- Abstract要約: SemEval-2020 Task 9 on Sentiment Analysis of Code-Mixed Tweets (SentiMix 2020) の結果について述べる。
我々は、単語レベルの言語識別と文レベルの感情ラベルを付加したHinglish(ヒンディー語)とSpanglish(スペイン語)のコーパスをリリースし、記述する。
- 参考スコア(独自算出の注目度): 29.74702868712367
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present the results of the SemEval-2020 Task 9 on Sentiment
Analysis of Code-Mixed Tweets (SentiMix 2020). We also release and describe our
Hinglish (Hindi-English) and Spanglish (Spanish-English) corpora annotated with
word-level language identification and sentence-level sentiment labels. These
corpora are comprised of 20K and 19K examples, respectively. The sentiment
labels are - Positive, Negative, and Neutral. SentiMix attracted 89 submissions
in total including 61 teams that participated in the Hinglish contest and 28
submitted systems to the Spanglish competition. The best performance achieved
was 75.0% F1 score for Hinglish and 80.6% F1 for Spanglish. We observe that
BERT-like models and ensemble methods are the most common and successful
approaches among the participants.
- Abstract(参考訳): 本稿では,SemEval-2020 Task 9 on Sentiment Analysis of Code-Mixed Tweets (SentiMix 2020)について述べる。
我々はまた、単語レベルの言語識別と文レベルの感情ラベルを付加したHinglish(ヒンディー語)とSpanglish(スペイン語)のコーパスをリリースし、記述する。
これらのコーパスはそれぞれ20Kと19Kの例からなる。
感情ラベルは、ポジティブ、ネガティブ、中立である。
sentimixは合計89の応募を受け、61のチームがヒングリッシュ・コンテストに参加し、28のシステムがスパングリッシュ・コンペティションに参加した。
最高成績はヒングリッシュのf1スコア75.0%、スパングリッシュのf180.6%であった。
BERTライクなモデルとアンサンブル手法が参加者の間で最も一般的で成功したアプローチである。
関連論文リスト
- SemEval 2024 -- Task 10: Emotion Discovery and Reasoning its Flip in
Conversation (EDiReF) [61.49972925493912]
SemEval-2024 Task 10は、コードミキシングされた対話における感情の識別に焦点を当てた共有タスクである。
このタスクは3つの異なるサブタスクから構成される - コードミックス対話のための会話における感情認識、コードミックス対話のための感情フリップ推論、および英語対話のための感情フリップ推論である。
このタスクには84人の参加者が参加し、各サブタスクのF1スコアは0.70、0.79、0.76に達した。
論文 参考訳(メタデータ) (2024-02-29T08:20:06Z) - Transformer-based Model for Word Level Language Identification in
Code-mixed Kannada-English Texts [55.41644538483948]
コードミキシングしたカンナダ英語テキストにおける単語レベル言語識別のためのトランスフォーマーベースモデルを提案する。
The proposed model on the CoLI-Kenglish dataset achieves a weighted F1-score of 0.84 and a macro F1-score of 0.61。
論文 参考訳(メタデータ) (2022-11-26T02:39:19Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - WLV-RIT at HASOC-Dravidian-CodeMix-FIRE2020: Offensive Language
Identification in Code-switched YouTube Comments [16.938836887702923]
本稿では,インド・ヨーロッパ語におけるHate Speech and Offensive Content IdentificationのWLV-RITエントリについて述べる。
HASOC 2020の主催者は、ドラヴィダ語(マラヤラム語とタミル語)で混在するコードのソーシャルメディア投稿を含むデータセットを参加者に提供した。
テストセットの平均F1スコアは89.89で,12名中5位にランクインした。
論文 参考訳(メタデータ) (2020-11-01T16:52:08Z) - LT3 at SemEval-2020 Task 9: Cross-lingual Embeddings for Sentiment
Analysis of Hinglish Social Media Text [1.0152838128195465]
ヒングリッシュ感情分析の課題を解決するための2つの方法を検討する。
最初のアプローチは、Hinglishと事前訓練された英語のFastText単語の埋め込みを投影した言語間埋め込みを使用する。
第2のアプローチは、Hinglishの一連のツイートで漸進的に再訓練される、事前訓練された英語の埋め込みだ。
論文 参考訳(メタデータ) (2020-10-21T14:03:16Z) - NLP-CIC at SemEval-2020 Task 9: Analysing sentiment in code-switching
language using a simple deep-learning classifier [63.137661897716555]
コードスイッチングは、2つ以上の言語が同じメッセージで使用される現象である。
標準的な畳み込みニューラルネットワークモデルを用いて、スペイン語と英語の混在するツイートの感情を予測する。
論文 参考訳(メタデータ) (2020-09-07T19:57:09Z) - SemEval-2020 Task 10: Emphasis Selection for Written Text in Visual
Media [50.29389719723529]
本稿では,SemEval-2020 Task 10, Emphasis Selection for Written Text in Visual Media の主な成果とその結果を比較した。
この共有タスクの目的は、強調選択のための自動メソッドを設計することである。
タスクに送信されたシステムの解析は、BERTとRoBERTaが、トレーニング済みモデルの最も一般的な選択であることを示している。
論文 参考訳(メタデータ) (2020-08-07T17:24:53Z) - Reed at SemEval-2020 Task 9: Fine-Tuning and Bag-of-Words Approaches to
Code-Mixed Sentiment Analysis [1.2147145617662432]
本研究では,SemEval-2020 大会第9タスク(SentiMix タスク)の参加者として,Hinglish (code-mixed Hindi- English) ツイートに対する感情分析の課題について検討する。
提案手法は,(1)事前学習したBERTモデルの微調整によるトランスファーラーニングの適用,2)単語のバッグ・オブ・ワード表現に基づくフィードフォワードニューラルネットワークのトレーニング,の2つであった。
コンペの結果,Fスコアは71.3%,ベストモデルでは62項目中4位にランクインした。
論文 参考訳(メタデータ) (2020-07-26T05:48:46Z) - NITS-Hinglish-SentiMix at SemEval-2020 Task 9: Sentiment Analysis For
Code-Mixed Social Media Text Using an Ensemble Model [1.1265248232450553]
本研究では,コードミキシングされたHinglishテキストの感情分析を活発に完了するシステムNITS-Hinglish-SentiMixを提案する。
提案したフレームワークはテストデータに対して0.617のFスコアを記録している。
論文 参考訳(メタデータ) (2020-07-23T15:45:12Z) - CS-Embed at SemEval-2020 Task 9: The effectiveness of code-switched word
embeddings for sentiment analysis [0.5908471365011942]
我々は、コード変更されたつぶやき、特にSpanglishとして知られるスペイン語と英語を利用するツイートで訓練された単語埋め込みを提示する。
我々は、F-1スコア0.722の感情分類器を訓練するためにそれらを利用する。
これは0.656の競争のベースラインよりも高く、29チーム中14チームがベースラインを上回っています。
論文 参考訳(メタデータ) (2020-06-08T13:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。