論文の概要: SemEval-2023 Task 12: Sentiment Analysis for African Languages
(AfriSenti-SemEval)
- arxiv url: http://arxiv.org/abs/2304.06845v2
- Date: Mon, 1 May 2023 10:18:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-02 17:55:12.750933
- Title: SemEval-2023 Task 12: Sentiment Analysis for African Languages
(AfriSenti-SemEval)
- Title(参考訳): semeval-2023タスク12:アフリカ語感情分析(アフィリエンス・セメヴァル)
- Authors: Shamsuddeen Hassan Muhammad, Idris Abdulmumin, Seid Muhie Yimam, David
Ifeoluwa Adelani, Ibrahim Sa'id Ahmad, Nedjma Ousidhoum, Abinew Ayele, Saif
M. Mohammad, Meriem Beloucif, Sebastian Ruder
- Abstract要約: AfriSenti-SemEvalは14のアフリカの言語における感情分類の課題である。
我々は,(1)タスクA:モノリンガル分類,(2)タスクB:マルチリンガル分類,(3)タスクC:ゼロショット分類,34のサブミッションを提示する。
- 参考スコア(独自算出の注目度): 42.140064297754634
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the first Africentric SemEval Shared task, Sentiment Analysis for
African Languages (AfriSenti-SemEval) - The dataset is available at
https://github.com/afrisenti-semeval/afrisent-semeval-2023. AfriSenti-SemEval
is a sentiment classification challenge in 14 African languages: Amharic,
Algerian Arabic, Hausa, Igbo, Kinyarwanda, Moroccan Arabic, Mozambican
Portuguese, Nigerian Pidgin, Oromo, Swahili, Tigrinya, Twi, Xitsonga, and
Yor\`ub\'a (Muhammad et al., 2023), using data labeled with 3 sentiment
classes. We present three subtasks: (1) Task A: monolingual classification,
which received 44 submissions; (2) Task B: multilingual classification, which
received 32 submissions; and (3) Task C: zero-shot classification, which
received 34 submissions. The best performance for tasks A and B was achieved by
NLNDE team with 71.31 and 75.06 weighted F1, respectively. UCAS-IIE-NLP
achieved the best average score for task C with 58.15 weighted F1. We describe
the various approaches adopted by the top 10 systems and their approaches.
- Abstract(参考訳): Africentric SemEval Shared Task, Sentiment Analysis for African Languages (AfriSenti-SemEval) - このデータセットはhttps://github.com/afrisenti-semeval/afrisent-semeval-2023で公開されている。
amharic, algerian arabic, hausa, igbo, kinyarwanda, moroccan arabic, mozambican portuguese, nigerian pidgin, oromo, swahili, tigrinya, twi, xitsonga, yor\`ub\'a (muhammad et al., 2023) の14のアフリカの言語における感情分類課題である。
1)タスクA:単言語分類44件,(2)タスクB:多言語分類32件,(3)タスクC:ゼロショット分類34件のサブタスクを提示した。
タスクAとBの最高のパフォーマンスは、それぞれ71.31と75.06の重み付きF1のNLNDEチームによって達成された。
UCAS-IIE-NLPは58.15重み付きF1のタスクCで最高の平均スコアを達成した。
トップ10システムで採用されている様々なアプローチとそのアプローチについて説明する。
関連論文リスト
- SemEval-2024 Task 1: Semantic Textual Relatedness for African and Asian Languages [39.770050337720676]
意味的テクスト関連性(STR)に関する最初の共有課題を提示する。
14言語にまたがる意味的関連性の広範な現象について検討する。
これらの言語は5つの異なる言語族の出身であり、主にアフリカとアジアで話されている。
論文 参考訳(メタデータ) (2024-03-27T18:30:26Z) - HausaNLP at SemEval-2023 Task 12: Leveraging African Low Resource
TweetData for Sentiment Analysis [0.0]
Twitter データセットを用いた低リソースアフリカ言語に対する感情分析の共有タスクである SemEval-2023 Task 12 について述べる。
我々のゴールは、Afro-xlmr-large、AfriBERTa-Large、Bert-base-arabic-camelbert-da-sentiment (アラビア語-camelbert)、Multilingual-BERT (mBERT)、BERTモデルを用いて、14のアフリカの言語に対する感情分析を行うことである。
論文 参考訳(メタデータ) (2023-04-26T15:47:50Z) - Masakhane-Afrisenti at SemEval-2023 Task 12: Sentiment Analysis using
Afro-centric Language Models and Adapters for Low-resource African Languages [0.0]
この課題は、アフリカの12言語に対する単言語感情分類(サブタスクA)、多言語感情分類(サブタスクB)、ゼロショット感情分類(タスクC)の実施を目的とする。
その結果, 事前学習したアフロ中心言語モデルを用いることで, 低資源アフリカ言語の性能が向上することが示唆された。
また,ゼロショットタスク用のアダプタを用いた実験を行った結果,限られたリソースしか持たないアダプタを用いて,有望な結果が得られることが示唆された。
論文 参考訳(メタデータ) (2023-04-13T12:54:29Z) - AfriSenti: A Twitter Sentiment Analysis Benchmark for African Languages [45.88640066767242]
アフリカには6以上の言語族から2000以上の言語があり、全大陸で最高の言語多様性がある。
しかし、アフリカ語で実施されているNLP研究はほとんどない。そのような研究を可能にする上で重要なのは、高品質な注釈付きデータセットが利用可能であることだ。
本稿では,14のアフリカ語で110,000以上のツイートを含む感情分析ベンチマークであるAfriSentiを紹介する。
論文 参考訳(メタデータ) (2023-02-17T15:40:12Z) - Overview of the HASOC Subtrack at FIRE 2022: Offensive Language
Identification in Marathi [15.466844451996051]
HASOC(Hate Speech and Offensive Content Identification)共有タスクは、これらのイニシアチブの1つである。
4枚目のバージョンでは、HASOC 2022は英語、ヒンディー語、マラティ語のサブトラックを3曲収録した。
HASOC 2022 Marathi subtrackの結果を報告する。このサブトラックは,一般的なOLID分類法を用いて手動でアノテートしたTwitterのデータを含むデータセットを参加者に提供する。
最高のパフォーマンスアルゴリズムは、伝統的な学習アプローチとディープラーニングアプローチの混合である。
論文 参考訳(メタデータ) (2022-11-18T11:17:15Z) - MasakhaNER 2.0: Africa-centric Transfer Learning for Named Entity
Recognition [55.95128479289923]
アフリカ系言語は10億人を超える人々によって話されているが、NLPの研究や開発ではあまり語られていない。
我々は、20のアフリカ言語で最大の人間アノテーション付きNERデータセットを作成します。
最適な転送言語を選択すると、ゼロショットF1スコアが平均14ポイント向上することを示す。
論文 参考訳(メタデータ) (2022-10-22T08:53:14Z) - MIA 2022 Shared Task: Evaluating Cross-lingual Open-Retrieval Question
Answering for 16 Diverse Languages [54.002969723086075]
16言語に類型的に多様である言語における言語横断的オープン-検索型問合せシステムの評価を行った。
反復的にマイニングされた多様な負の例を利用する最良のシステムは32.2 F1となり、ベースラインを4.5ポイント上回る。
第2のベストシステムは文書検索にエンティティを意識した文脈表現を使用し、タミル(20.8 F1)の大幅な改善を実現している。
論文 参考訳(メタデータ) (2022-07-02T06:54:10Z) - Comprehensive Benchmark Datasets for Amharic Scene Text Detection and
Recognition [56.048783994698425]
Ethiopic/Amharicスクリプトはアフリカ最古の書記システムの一つで、東アフリカで少なくとも23の言語に対応している。
アムハラ語の表記体系である Abugida は282音節、15句の句読点、20の数字を持つ。
HUST-ART, HUST-AST, ABE, Tana という,自然界におけるアムハラ文字の検出と認識のための総合的な公開データセットを提示した。
論文 参考訳(メタデータ) (2022-03-23T03:19:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。