論文の概要: NADI 2025: The First Multidialectal Arabic Speech Processing Shared Task
- arxiv url: http://arxiv.org/abs/2509.02038v1
- Date: Tue, 02 Sep 2025 07:28:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.943991
- Title: NADI 2025: The First Multidialectal Arabic Speech Processing Shared Task
- Title(参考訳): NADI 2025:最初の多言語アラビア語音声処理共有タスク
- Authors: Bashar Talafha, Hawau Olamide Toyin, Peter Sullivan, AbdelRahim Elmadany, Abdurrahman Juma, Amirbek Djanibekov, Chiyu Zhang, Hamad Alshehhi, Hanan Aldarmaki, Mustafa Jarrar, Nizar Habash, Muhammad Abdul-Mageed,
- Abstract要約: 第6回Nuanced Arabic Dialect Identification (ADIN 2025) Shared Taskについて報告する。
アラビア語の方言処理を3つのサブタスク(音声方言識別、音声認識、ダイアクリティカルな復元)に焦点をあてた。
最高性能のシステムはSubtask 1, 35.68/12.20 WER/CER(全平均)で79.8%、Subtask 3で55/13 WER/CERを達成した。
- 参考スコア(独自算出の注目度): 34.40587614887153
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present the findings of the sixth Nuanced Arabic Dialect Identification (NADI 2025) Shared Task, which focused on Arabic speech dialect processing across three subtasks: spoken dialect identification (Subtask 1), speech recognition (Subtask 2), and diacritic restoration for spoken dialects (Subtask 3). A total of 44 teams registered, and during the testing phase, 100 valid submissions were received from eight unique teams. The distribution was as follows: 34 submissions for Subtask 1 "five teams{\ae}, 47 submissions for Subtask 2 "six teams", and 19 submissions for Subtask 3 "two teams". The best-performing systems achieved 79.8% accuracy on Subtask 1, 35.68/12.20 WER/CER (overall average) on Subtask 2, and 55/13 WER/CER on Subtask 3. These results highlight the ongoing challenges of Arabic dialect speech processing, particularly in dialect identification, recognition, and diacritic restoration. We also summarize the methods adopted by participating teams and briefly outline directions for future editions of NADI.
- Abstract(参考訳): 第6回Nuanced Arabic Dialect Identification (NADI 2025) Shared Taskは,3つのサブタスク(音声弁別(Subtask 1),音声認識(Subtask2),音声弁別(Subtask3)の3つのサブタスクを対象とする。
合計44チームが登録され、テストフェーズには8つのユニークなチームから100の有効な応募が寄せられた。
ディストリビューションは、Subtask 1 "5 teams{\ae}"に34の応募、Subtask 2 "6チーム"に47の応募、Subtask 3 "2チーム"に19の応募があった。
最高性能のシステムはSubtask 1, 35.68/12.20 WER/CER(全平均)で79.8%、Subtask 3で55/13 WER/CERを達成した。
これらの結果は、アラビア方言音声処理の現在進行中の課題、特に方言識別、認識、発音復元の課題を浮き彫りにしている。
また、参加チームが採用する手法をまとめた上で、NADIの将来版について概説する。
関連論文リスト
- CardiffNLP at CLEARS-2025: Prompting Large Language Models for Plain Language and Easy-to-Read Text Rewriting [49.4237054647147]
本稿では、CardiffNLPチームのCLEARS共有タスクへの貢献について詳述する。
多数の急激なバリエーション、例、実験結果について詳述する。
論文 参考訳(メタデータ) (2025-08-05T09:16:19Z) - GenAI Content Detection Task 1: English and Multilingual Machine-Generated Text Detection: AI vs. Human [71.42669028683741]
我々は,Coling 2025におけるGenAIワークショップの一環として,バイナリマシン生成テキスト検出における共有タスクを提案する。
このタスクは、モノリンガル(英: Monolingual)とマルチリンガル(英: Multilingual)の2つのサブタスクから構成される。
本稿では,データの包括的概要,結果の概要,参加システムの詳細な説明,提出内容の詳細な分析について述べる。
論文 参考訳(メタデータ) (2025-01-19T11:11:55Z) - NADI 2024: The Fifth Nuanced Arabic Dialect Identification Shared Task [28.40134178913119]
第5回Nuanced Arabic Dialect Identification Shared Task(NADI 2024)の発見について述べる。
NADI 2024は、多ラベル課題としての方言の識別と、アラビア語の方言のレベルを識別することの両方を目標とした。
優勝チームはSubtask1で50.57 Ftextsubscript1、Subtask2で0.1403 RMSE、Subtask3で20.44 BLEUを達成した。
論文 参考訳(メタデータ) (2024-07-06T01:18:58Z) - SemEval-2024 Task 8: Multidomain, Multimodel and Multilingual Machine-Generated Text Detection [68.858931667807]
Subtask Aは、テキストが人間によって書かれたか、機械によって生成されたかを決定するバイナリ分類タスクである。
サブタスクBは、テキストの正確なソースを検出し、それが人間によって書かれたか、特定のLCMによって生成されたかを認識する。
Subtask Cは、著者が人間から機械へ遷移するテキスト内の変化点を特定することを目的としている。
論文 参考訳(メタデータ) (2024-04-22T13:56:07Z) - NADI 2023: The Fourth Nuanced Arabic Dialect Identification Shared Task [28.986040897360336]
第4回Nuanced Arabic Dialect Identification Shared Task(NADI 2023)の発見について述べる。
NADI 2023は、方言識別(Subtask 1)と方言間機械翻訳(Subtask 2とSubtask 3)の両方をターゲットにしている。
参加チームが採用する手法について述べるとともに,NADIの展望を簡潔に述べる。
論文 参考訳(メタデータ) (2023-10-24T18:41:24Z) - Findings of the WMT 2022 Shared Task on Translation Suggestion [63.457874930232926]
We report the results of the first edition of the WMT shared task on Translation Suggestion。
このタスクは、機械翻訳(MT)によって生成された文書全体に対して、特定の単語やフレーズの代替手段を提供することを目的としている。
2つのサブタスク、すなわち単純翻訳提案と暗示付き翻訳提案で構成されている。
論文 参考訳(メタデータ) (2022-11-30T03:48:36Z) - NADI 2022: The Third Nuanced Arabic Dialect Identification Shared Task [16.688997360734472]
第3回アラビア方言識別共有タスク(NADI 2022)
NADI 2022は,国レベルでの方言識別(Subtask 1)と方言感情分析(Subtask2)の両方を対象とした。
優勝チームはSubtask 1で27.06 F1、Subtask 2でF1=75.16を達成した。
論文 参考訳(メタデータ) (2022-10-18T04:31:05Z) - NADI 2021: The Second Nuanced Arabic Dialect Identification Shared Task [20.34810224205086]
この共有タスクには、国レベルの現代標準アラビア語(MSA)識別(Subtask 1.1)、国レベルの方言識別(Subtask 1.2)、州レベルの方言識別(Subtask 2.1)の4つのサブタスクが含まれる。
このデータセットは、Twitterドメインから収集された21のアラブ諸国から合計100の州をカバーしている。
23か国53チームが参加登録しており、この地域のコミュニティの関心を反映している。
論文 参考訳(メタデータ) (2021-03-04T04:59:37Z) - NADI 2020: The First Nuanced Arabic Dialect Identification Shared Task [18.23153068720659]
第1回Nuanced Arabic Dialect Identification Shared Task(NADI)の結果と結果について述べる。
共有タスクのデータは、アラブ21カ国から合計100か国をカバーし、Twitterドメインから収集されている。
NADIは、サブカントリーレベルで自然に発生する粒度の細かい方言テキストをターゲットにした最初の共有タスクである。
論文 参考訳(メタデータ) (2020-10-21T22:14:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。