論文の概要: AraFinNLP 2024: The First Arabic Financial NLP Shared Task
- arxiv url: http://arxiv.org/abs/2407.09818v1
- Date: Sat, 13 Jul 2024 09:28:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 20:37:36.935486
- Title: AraFinNLP 2024: The First Arabic Financial NLP Shared Task
- Title(参考訳): AraFinNLP 2024: アラビア初の金融NLP共有タスク
- Authors: Sanad Malaysha, Mo El-Haj, Saad Ezzini, Mohammed Khalilia, Mustafa Jarrar, Sultan Almujaiwel, Ismail Berrada, Houda Bouamor,
- Abstract要約: 合計45のチームがこの共有タスクに登録され、そのうち11チームがテストフェーズに積極的に参加した。
Subtask 1の勝利チームは0.8773点を獲得し、Subtask 2で提出された唯一のチームは1.667点のBLEU点を獲得した。
- 参考スコア(独自算出の注目度): 5.74170730791988
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The expanding financial markets of the Arab world require sophisticated Arabic NLP tools. To address this need within the banking domain, the Arabic Financial NLP (AraFinNLP) shared task proposes two subtasks: (i) Multi-dialect Intent Detection and (ii) Cross-dialect Translation and Intent Preservation. This shared task uses the updated ArBanking77 dataset, which includes about 39k parallel queries in MSA and four dialects. Each query is labeled with one or more of a common 77 intents in the banking domain. These resources aim to foster the development of robust financial Arabic NLP, particularly in the areas of machine translation and banking chat-bots. A total of 45 unique teams registered for this shared task, with 11 of them actively participated in the test phase. Specifically, 11 teams participated in Subtask 1, while only 1 team participated in Subtask 2. The winning team of Subtask 1 achieved F1 score of 0.8773, and the only team submitted in Subtask 2 achieved a 1.667 BLEU score.
- Abstract(参考訳): アラブ世界の金融市場は、洗練されたアラビア語のNLPツールを必要としている。
銀行分野におけるこのニーズに対処するため、アラビア金融NLP(AraFinNLP)共有タスクは2つのサブタスクを提案している。
一 マルチダイアレクトインテント検出及び検出方法
(二)通訳及び留置
この共有タスクは、更新されたArBanking77データセットを使用し、MSAと4つの方言で約39kの並列クエリを含む。
各クエリには、銀行ドメイン内の一般的な77のインテントの1つ以上のラベルが付けられている。
これらの資源は、特に機械翻訳や銀行チャットボットの分野で、ロバストな金融アラビアNLPの開発を促進することを目的としている。
合計45のチームがこの共有タスクに登録され、そのうち11チームがテストフェーズに積極的に参加した。
具体的には11チームがSubtask 1に参加し、1チームがSubtask 2に参加した。
Subtask 1の勝利チームは0.8773点を獲得し、Subtask 2で提出された唯一のチームは1.667点のBLEU点を獲得した。
関連論文リスト
- WojoodNER 2024: The Second Arabic Named Entity Recognition Shared Task [13.55190646427114]
WojoodNER-2024は、(i)クローズド・トラック・フラット・ファイン・グラインド・NER、(ii)クローズド・トラック・ネスト・ファイン・グラインド・NER、(iii)イスラエル・ガザ戦争のためのオープン・トラック・NERの3つのサブタスクを含んでいた。
優勝チームはF-1得点を91%、Nested Fine-Grained Subtasksで92%とした。
論文 参考訳(メタデータ) (2024-07-13T16:17:08Z) - NADI 2024: The Fifth Nuanced Arabic Dialect Identification Shared Task [28.40134178913119]
第5回Nuanced Arabic Dialect Identification Shared Task(NADI 2024)の発見について述べる。
NADI 2024は、多ラベル課題としての方言の識別と、アラビア語の方言のレベルを識別することの両方を目標とした。
優勝チームはSubtask1で50.57 Ftextsubscript1、Subtask2で0.1403 RMSE、Subtask3で20.44 BLEUを達成した。
論文 参考訳(メタデータ) (2024-07-06T01:18:58Z) - SemEval-2024 Task 8: Multidomain, Multimodel and Multilingual Machine-Generated Text Detection [68.858931667807]
Subtask Aは、テキストが人間によって書かれたか、機械によって生成されたかを決定するバイナリ分類タスクである。
サブタスクBは、テキストの正確なソースを検出し、それが人間によって書かれたか、特定のLCMによって生成されたかを認識する。
Subtask Cは、著者が人間から機械へ遷移するテキスト内の変化点を特定することを目的としている。
論文 参考訳(メタデータ) (2024-04-22T13:56:07Z) - SemEval 2024 -- Task 10: Emotion Discovery and Reasoning its Flip in
Conversation (EDiReF) [61.49972925493912]
SemEval-2024 Task 10は、コードミキシングされた対話における感情の識別に焦点を当てた共有タスクである。
このタスクは3つの異なるサブタスクから構成される - コードミックス対話のための会話における感情認識、コードミックス対話のための感情フリップ推論、および英語対話のための感情フリップ推論である。
このタスクには84人の参加者が参加し、各サブタスクのF1スコアは0.70、0.79、0.76に達した。
論文 参考訳(メタデータ) (2024-02-29T08:20:06Z) - ArabicMMLU: Assessing Massive Multitask Language Understanding in Arabic [53.1913348687902]
アラビア語に対する最初のマルチタスク言語理解ベンチマークであるアラビアMMLUを提示する。
我々のデータは、現代標準アラビア語(MSA)における40のタスクと14,575の多重選択質問からなる。
35モデルについて評価した結果,特にオープンソースモデルにおいて,改善の余地がかなり高いことが判明した。
論文 参考訳(メタデータ) (2024-02-20T09:07:41Z) - ArAIEval Shared Task: Persuasion Techniques and Disinformation Detection
in Arabic Text [41.3267575540348]
本稿では, EMNLP 2023と共同で開催される第1回アラビア2023会議の一環として組織されたArAIEval共有タスクの概要を紹介する。
ArAIEvalは、アラビア文字上の2つのタスクを提供する: (i) 説得テクニックの検出、ツイートやニュース記事における説得テクニックの識別、および (ii) ツイート上のバイナリとマルチクラスの設定における偽情報検出。
最終評価フェーズには合計20チームが参加し、タスク1と2には14チームと16チームが参加した。
論文 参考訳(メタデータ) (2023-11-06T15:21:19Z) - NADI 2023: The Fourth Nuanced Arabic Dialect Identification Shared Task [28.986040897360336]
第4回Nuanced Arabic Dialect Identification Shared Task(NADI 2023)の発見について述べる。
NADI 2023は、方言識別(Subtask 1)と方言間機械翻訳(Subtask 2とSubtask 3)の両方をターゲットにしている。
参加チームが採用する手法について述べるとともに,NADIの展望を簡潔に述べる。
論文 参考訳(メタデータ) (2023-10-24T18:41:24Z) - NADI 2022: The Third Nuanced Arabic Dialect Identification Shared Task [16.688997360734472]
第3回アラビア方言識別共有タスク(NADI 2022)
NADI 2022は,国レベルでの方言識別(Subtask 1)と方言感情分析(Subtask2)の両方を対象とした。
優勝チームはSubtask 1で27.06 F1、Subtask 2でF1=75.16を達成した。
論文 参考訳(メタデータ) (2022-10-18T04:31:05Z) - UrduFake@FIRE2021: Shared Track on Fake News Identification in Urdu [55.41644538483948]
本研究は、ウルドゥー語で偽ニュースを検出するために、UrduFake@FIRE2021と名付けられた2番目の共有タスクを報告した。
提案システムは、様々なカウントベースの特徴に基づいており、異なる分類器とニューラルネットワークアーキテクチャを使用していた。
勾配降下(SGD)アルゴリズムは他の分類器よりも優れ、0.679Fスコアを達成した。
論文 参考訳(メタデータ) (2022-07-11T19:15:04Z) - Number Entity Recognition [65.80137628972312]
番号は他のワードトークンと同様に、自然言語処理(NLP)モデルを構築し、デプロイするテキストの必須コンポーネントである。
本研究では、最先端のNLPモデルの可能性を活用し、関連するタスクにおける性能向上能力の伝達を試みる。
提案した数値をエンティティに分類することで,手作りのFill-In-The-Blank (FITB)タスクや,関節埋め込みを用いた質問応答など,NLPモデルの性能が向上する。
論文 参考訳(メタデータ) (2022-05-07T05:22:43Z) - NADI 2020: The First Nuanced Arabic Dialect Identification Shared Task [18.23153068720659]
第1回Nuanced Arabic Dialect Identification Shared Task(NADI)の結果と結果について述べる。
共有タスクのデータは、アラブ21カ国から合計100か国をカバーし、Twitterドメインから収集されている。
NADIは、サブカントリーレベルで自然に発生する粒度の細かい方言テキストをターゲットにした最初の共有タスクである。
論文 参考訳(メタデータ) (2020-10-21T22:14:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。