論文の概要: AHaSIS: Shared Task on Sentiment Analysis for Arabic Dialects
- arxiv url: http://arxiv.org/abs/2511.13335v1
- Date: Mon, 17 Nov 2025 13:06:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:25.219465
- Title: AHaSIS: Shared Task on Sentiment Analysis for Arabic Dialects
- Title(参考訳): AHaSIS:アラビア方言の感性分析の共有課題
- Authors: Maram Alharbi, Salmane Chafik, Saad Ezzini, Ruslan Mitkov, Tharindu Ranasinghe, Hansi Hettiarachchi,
- Abstract要約: 病院領域におけるアラビア語方言の感性分析 : アラビア語方言の感性検出に着目して
データセットは、ポジティブ、中立、ネガティブのカテゴリにまたがる538の感情バランスのレビューで構成されている。
トップパフォーマンスのシステムはF1スコアの0.81を達成し、アラビア語の方言における感情分析の可能性と継続的な課題を実証した。
- 参考スコア(独自算出の注目度): 10.336992954849213
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The hospitality industry in the Arab world increasingly relies on customer feedback to shape services, driving the need for advanced Arabic sentiment analysis tools. To address this challenge, the Sentiment Analysis on Arabic Dialects in the Hospitality Domain shared task focuses on Sentiment Detection in Arabic Dialects. This task leverages a multi-dialect, manually curated dataset derived from hotel reviews originally written in Modern Standard Arabic (MSA) and translated into Saudi and Moroccan (Darija) dialects. The dataset consists of 538 sentiment-balanced reviews spanning positive, neutral, and negative categories. Translations were validated by native speakers to ensure dialectal accuracy and sentiment preservation. This resource supports the development of dialect-aware NLP systems for real-world applications in customer experience analysis. More than 40 teams have registered for the shared task, with 12 submitting systems during the evaluation phase. The top-performing system achieved an F1 score of 0.81, demonstrating the feasibility and ongoing challenges of sentiment analysis across Arabic dialects.
- Abstract(参考訳): アラブ世界のホスピタリティ産業は、サービスを形成するために顧客からのフィードバックをますます頼りにしており、先進的なアラビア語感情分析ツールの必要性が高まっている。
この課題に対処するために、ホスピタリティドメインにおけるアラビア語方言の感性分析は、アラビア語方言の感性検出に焦点を当てている。
このタスクは、現代標準アラビア語(MSA)で書かれ、サウジアラビア語とモロッコ語(ダリヤ語)の方言に翻訳されたホテルレビューに由来する、多言語で手動でキュレートされたデータセットを活用する。
データセットは、ポジティブ、中立、ネガティブのカテゴリにまたがる538の感情バランスのレビューで構成されている。
翻訳は、方言の精度と感情の保存を確保するために、母語話者によって検証された。
このリソースは、顧客体験分析における実世界のアプリケーションのための方言対応NLPシステムの開発を支援する。
40以上のチームが共有タスクに登録しており、評価フェーズには12のシステムが提出されている。
トップパフォーマンスのシステムはF1スコアの0.81を達成し、アラビア語の方言における感情分析の可能性と継続的な課題を実証した。
関連論文リスト
- MAPROC at AHaSIS Shared Task: Few-Shot and Sentence Transformer for Sentiment Analysis of Arabic Hotel Reviews [0.0]
本稿では,AHaSIS共有課題に対する我々のアプローチについて述べる。
このデータセットはモロッコ方言とサウジアラビア方言で書かれたホテルレビューで構成されており、レビュー担当者の感情を肯定的、否定的、中立的なものに分類することを目的としている。
公式評価では,26名中12名中73%のF1を達成した。
論文 参考訳(メタデータ) (2025-11-19T09:56:16Z) - DialectalArabicMMLU: Benchmarking Dialectal Capabilities in Arabic and Multilingual Language Models [54.10223256792762]
アラビア方言における大規模言語モデル(LLM)の性能評価のための新しいベンチマークであるDialectalArabicMMLUを提案する。
MMLU-Redux フレームワークを手動で翻訳し、3K 個の質問応答対を5つの主要な方言に適応することで拡張する。
論文 参考訳(メタデータ) (2025-10-31T15:17:06Z) - UI-Level Evaluation of ALLaM 34B: Measuring an Arabic-Centric LLM via HUMAIN Chat [1.2788586581322734]
サウジのデータとAI機関は、アラビアに焦点を当てたモデルのファミリーである$allaM$を導入した。
最も有能な$ALLaM-34B$は、HUMAIN Chatを開発したHUMAINによって採用された。
本稿では,拡張されたUIレベルの$ALLaM-34B$について述べる。
論文 参考訳(メタデータ) (2025-08-24T14:32:15Z) - MuDRiC: Multi-Dialect Reasoning for Arabic Commonsense Validation [30.670712065855902]
複数の方言を組み込んだ拡張アラビア・コモンセンスデータセットである MuDRiC を導入し,(ii) アラビア・コモンセンス推論にグラフ畳み込みネットワーク(GCN)を適応させる新しい手法を提案する。
我々の研究は、その複雑なバリエーションを扱うための基礎的データセットと新しい方法の両方を提供することで、アラビア語の自然言語理解を強化する。
論文 参考訳(メタデータ) (2025-08-18T17:42:53Z) - BALSAM: A Platform for Benchmarking Arabic Large Language Models [34.50348949235453]
BALSAMは、アラビア語のLLM開発と評価を進めることを目的とした総合的なコミュニティ主導のベンチマークである。
14の幅広いカテゴリから78のNLPタスクが含まれており、52Kのサンプルは37Kテストと15K開発に分割されている。
論文 参考訳(メタデータ) (2025-07-30T12:16:39Z) - Second Language (Arabic) Acquisition of LLMs via Progressive Vocabulary Expansion [70.23624194206171]
本稿では,アラブ世界における大規模言語モデル(LLM)の民主化の必要性に対処する。
アラビア語のLLMの実用的な目的の1つは、復号を高速化するトークン化器にアラビア語固有の語彙を使用することである。
第二言語(アラビア語)による人への獲得の間に語彙学習に触発されたAraLLaMAは、進歩的な語彙拡張を採用している。
論文 参考訳(メタデータ) (2024-12-16T19:29:06Z) - Arabic Text Sentiment Analysis: Reinforcing Human-Performed Surveys with
Wider Topic Analysis [49.1574468325115]
詳細な研究は、2002年から2020年の間に英語で出版された133のASA論文を手作業で分析する。
主な発見は、機械学習、レキシコンベース、ハイブリッドアプローチといった、ASAで使用されるさまざまなアプローチを示している。
アラビア文字SAについては、業界だけでなく学術分野でも使用できるASAツールを開発する必要がある。
論文 参考訳(メタデータ) (2024-03-04T10:37:48Z) - ArabicMMLU: Assessing Massive Multitask Language Understanding in Arabic [51.922112625469836]
アラビア語における最初のマルチタスク言語理解ベンチマークである、データセット名を提案する。
我々のデータは、現代標準アラビア語(MSA)における40のタスクと14,575のマルチチョイス質問で構成されており、地域の母語話者と協調して慎重に構築されている。
35モデルについて評価した結果,特にオープンソースモデルにおいて,改善の余地がかなり高いことが判明した。
論文 参考訳(メタデータ) (2024-02-20T09:07:41Z) - ALDi: Quantifying the Arabic Level of Dialectness of Text [17.37857915257019]
我々は、アラビア語話者が方言のスペクトルを知覚し、文レベルでアラビア方言レベル(ALDi)として機能すると主張している。
AOC-ALDiの詳細な分析を行い、訓練したモデルが他のコーパスの方言のレベルを効果的に識別できることを示す。
論文 参考訳(メタデータ) (2023-10-20T18:07:39Z) - Arabic Sentiment Analysis with Noisy Deep Explainable Model [48.22321420680046]
本稿では,アラビア語の感情分類フレームワークを提案する。
提案フレームワークは,局所的な代理説明可能なモデルをトレーニングすることで,特定の予測を説明することができる。
アラビアサデータセットの公開ベンチマーク実験を行った。
論文 参考訳(メタデータ) (2023-09-24T19:26:53Z) - AceGPT, Localizing Large Language Models in Arabic [73.39989503874634]
本稿では,アラビア語のテキストによる事前学習,ネイティブなアラビア語命令を利用したSFT(Supervised Fine-Tuning),アラビア語のGPT-4応答を含む総合的なソリューションを提案する。
目標は、文化的に認知され、価値に整合したアラビア語のLLMを、多様で応用特有のアラビア語コミュニティのニーズに適応させることである。
論文 参考訳(メタデータ) (2023-09-21T13:20:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。