論文の概要: NADI 2020: The First Nuanced Arabic Dialect Identification Shared Task
- arxiv url: http://arxiv.org/abs/2010.11334v3
- Date: Mon, 9 Nov 2020 19:18:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 22:48:46.237071
- Title: NADI 2020: The First Nuanced Arabic Dialect Identification Shared Task
- Title(参考訳): NADI 2020:アラビア語の方言を識別する最初のタスク
- Authors: Muhammad Abdul-Mageed, Chiyu Zhang, Houda Bouamor and Nizar Habash
- Abstract要約: 第1回Nuanced Arabic Dialect Identification Shared Task(NADI)の結果と結果について述べる。
共有タスクのデータは、アラブ21カ国から合計100か国をカバーし、Twitterドメインから収集されている。
NADIは、サブカントリーレベルで自然に発生する粒度の細かい方言テキストをターゲットにした最初の共有タスクである。
- 参考スコア(独自算出の注目度): 18.23153068720659
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the results and findings of the First Nuanced Arabic Dialect
Identification Shared Task (NADI). This Shared Task includes two subtasks:
country-level dialect identification (Subtask 1) and province-level sub-dialect
identification (Subtask 2). The data for the shared task covers a total of 100
provinces from 21 Arab countries and are collected from the Twitter domain. As
such, NADI is the first shared task to target naturally-occurring fine-grained
dialectal text at the sub-country level. A total of 61 teams from 25 countries
registered to participate in the tasks, thus reflecting the interest of the
community in this area. We received 47 submissions for Subtask 1 from 18 teams
and 9 submissions for Subtask 2 from 9 teams.
- Abstract(参考訳): 本稿では,第1回Nuanced Arabic Dialect Identification Shared Task(NADI)の結果と結果を紹介する。
この共有タスクには、国レベルの方言識別(Subtask 1)と州レベルの方言識別(Subtask2)の2つのサブタスクが含まれる。
共有タスクのデータは、アラブ21カ国から合計100か国をカバーし、Twitterドメインから収集されている。
このように、NADIは、サブカントリーレベルで自然にきめ細かい方言テキストをターゲットとする最初の共有タスクである。
25か国から61チームが参加しており、この地域のコミュニティの関心を反映している。
私たちは18チームからSubtask 1への47の応募、9チームからSubtask 2への9の応募を受け取りました。
関連論文リスト
- Findings of the IWSLT 2024 Evaluation Campaign [102.7608597658451]
本稿は、第21回IWSLT会議によって組織された共有タスクについて報告する。
共通タスクは、音声翻訳における7つの科学的課題に対処する。
論文 参考訳(メタデータ) (2024-11-07T19:11:55Z) - NADI 2024: The Fifth Nuanced Arabic Dialect Identification Shared Task [28.40134178913119]
第5回Nuanced Arabic Dialect Identification Shared Task(NADI 2024)の発見について述べる。
NADI 2024は、多ラベル課題としての方言の識別と、アラビア語の方言のレベルを識別することの両方を目標とした。
優勝チームはSubtask1で50.57 Ftextsubscript1、Subtask2で0.1403 RMSE、Subtask3で20.44 BLEUを達成した。
論文 参考訳(メタデータ) (2024-07-06T01:18:58Z) - SemEval-2024 Task 8: Multidomain, Multimodel and Multilingual Machine-Generated Text Detection [68.858931667807]
Subtask Aは、テキストが人間によって書かれたか、機械によって生成されたかを決定するバイナリ分類タスクである。
サブタスクBは、テキストの正確なソースを検出し、それが人間によって書かれたか、特定のLCMによって生成されたかを認識する。
Subtask Cは、著者が人間から機械へ遷移するテキスト内の変化点を特定することを目的としている。
論文 参考訳(メタデータ) (2024-04-22T13:56:07Z) - SemEval 2024 -- Task 10: Emotion Discovery and Reasoning its Flip in
Conversation (EDiReF) [61.49972925493912]
SemEval-2024 Task 10は、コードミキシングされた対話における感情の識別に焦点を当てた共有タスクである。
このタスクは3つの異なるサブタスクから構成される - コードミックス対話のための会話における感情認識、コードミックス対話のための感情フリップ推論、および英語対話のための感情フリップ推論である。
このタスクには84人の参加者が参加し、各サブタスクのF1スコアは0.70、0.79、0.76に達した。
論文 参考訳(メタデータ) (2024-02-29T08:20:06Z) - NADI 2023: The Fourth Nuanced Arabic Dialect Identification Shared Task [28.986040897360336]
第4回Nuanced Arabic Dialect Identification Shared Task(NADI 2023)の発見について述べる。
NADI 2023は、方言識別(Subtask 1)と方言間機械翻訳(Subtask 2とSubtask 3)の両方をターゲットにしている。
参加チームが採用する手法について述べるとともに,NADIの展望を簡潔に述べる。
論文 参考訳(メタデータ) (2023-10-24T18:41:24Z) - Findings of the WMT 2022 Shared Task on Translation Suggestion [63.457874930232926]
We report the results of the first edition of the WMT shared task on Translation Suggestion。
このタスクは、機械翻訳(MT)によって生成された文書全体に対して、特定の単語やフレーズの代替手段を提供することを目的としている。
2つのサブタスク、すなわち単純翻訳提案と暗示付き翻訳提案で構成されている。
論文 参考訳(メタデータ) (2022-11-30T03:48:36Z) - NADI 2022: The Third Nuanced Arabic Dialect Identification Shared Task [16.688997360734472]
第3回アラビア方言識別共有タスク(NADI 2022)
NADI 2022は,国レベルでの方言識別(Subtask 1)と方言感情分析(Subtask2)の両方を対象とした。
優勝チームはSubtask 1で27.06 F1、Subtask 2でF1=75.16を達成した。
論文 参考訳(メタデータ) (2022-10-18T04:31:05Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - UrduFake@FIRE2021: Shared Track on Fake News Identification in Urdu [55.41644538483948]
本研究は、ウルドゥー語で偽ニュースを検出するために、UrduFake@FIRE2021と名付けられた2番目の共有タスクを報告した。
提案システムは、様々なカウントベースの特徴に基づいており、異なる分類器とニューラルネットワークアーキテクチャを使用していた。
勾配降下(SGD)アルゴリズムは他の分類器よりも優れ、0.679Fスコアを達成した。
論文 参考訳(メタデータ) (2022-07-11T19:15:04Z) - NADI 2021: The Second Nuanced Arabic Dialect Identification Shared Task [20.34810224205086]
この共有タスクには、国レベルの現代標準アラビア語(MSA)識別(Subtask 1.1)、国レベルの方言識別(Subtask 1.2)、州レベルの方言識別(Subtask 2.1)の4つのサブタスクが含まれる。
このデータセットは、Twitterドメインから収集された21のアラブ諸国から合計100の州をカバーしている。
23か国53チームが参加登録しており、この地域のコミュニティの関心を反映している。
論文 参考訳(メタデータ) (2021-03-04T04:59:37Z) - Dialect Identification in Nuanced Arabic Tweets Using Farasa
Segmentation and AraBERT [0.0]
本稿では,EACL WANLP-2021共有タスク1:Nuanced Arabic Dialect Identification (NADI)について述べる。
この課題は、現代の標準アラビア語や方言の形でアラビア語のつぶやきが発せられる場所(国・地域)を識別するシステムを開発することを目的としている。
論文 参考訳(メタデータ) (2021-02-19T05:39:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。