論文の概要: AHaSIS: Shared Task on Sentiment Analysis for Arabic Dialects
- arxiv url: http://arxiv.org/abs/2511.13335v1
- Date: Mon, 17 Nov 2025 13:06:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:25.219465
- Title: AHaSIS: Shared Task on Sentiment Analysis for Arabic Dialects
- Title(参考訳): AHaSIS:アラビア方言の感性分析の共有課題
- Authors: Maram Alharbi, Salmane Chafik, Saad Ezzini, Ruslan Mitkov, Tharindu Ranasinghe, Hansi Hettiarachchi,
- Abstract要約: 病院領域におけるアラビア語方言の感性分析 : アラビア語方言の感性検出に着目して
データセットは、ポジティブ、中立、ネガティブのカテゴリにまたがる538の感情バランスのレビューで構成されている。
トップパフォーマンスのシステムはF1スコアの0.81を達成し、アラビア語の方言における感情分析の可能性と継続的な課題を実証した。
- 参考スコア(独自算出の注目度): 10.336992954849213
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The hospitality industry in the Arab world increasingly relies on customer feedback to shape services, driving the need for advanced Arabic sentiment analysis tools. To address this challenge, the Sentiment Analysis on Arabic Dialects in the Hospitality Domain shared task focuses on Sentiment Detection in Arabic Dialects. This task leverages a multi-dialect, manually curated dataset derived from hotel reviews originally written in Modern Standard Arabic (MSA) and translated into Saudi and Moroccan (Darija) dialects. The dataset consists of 538 sentiment-balanced reviews spanning positive, neutral, and negative categories. Translations were validated by native speakers to ensure dialectal accuracy and sentiment preservation. This resource supports the development of dialect-aware NLP systems for real-world applications in customer experience analysis. More than 40 teams have registered for the shared task, with 12 submitting systems during the evaluation phase. The top-performing system achieved an F1 score of 0.81, demonstrating the feasibility and ongoing challenges of sentiment analysis across Arabic dialects.
- Abstract(参考訳): アラブ世界のホスピタリティ産業は、サービスを形成するために顧客からのフィードバックをますます頼りにしており、先進的なアラビア語感情分析ツールの必要性が高まっている。
この課題に対処するために、ホスピタリティドメインにおけるアラビア語方言の感性分析は、アラビア語方言の感性検出に焦点を当てている。
このタスクは、現代標準アラビア語(MSA)で書かれ、サウジアラビア語とモロッコ語(ダリヤ語)の方言に翻訳されたホテルレビューに由来する、多言語で手動でキュレートされたデータセットを活用する。
データセットは、ポジティブ、中立、ネガティブのカテゴリにまたがる538の感情バランスのレビューで構成されている。
翻訳は、方言の精度と感情の保存を確保するために、母語話者によって検証された。
このリソースは、顧客体験分析における実世界のアプリケーションのための方言対応NLPシステムの開発を支援する。
40以上のチームが共有タスクに登録しており、評価フェーズには12のシステムが提出されている。
トップパフォーマンスのシステムはF1スコアの0.81を達成し、アラビア語の方言における感情分析の可能性と継続的な課題を実証した。
関連論文リスト
- DialectalArabicMMLU: Benchmarking Dialectal Capabilities in Arabic and Multilingual Language Models [54.10223256792762]
アラビア方言における大規模言語モデル(LLM)の性能評価のための新しいベンチマークであるDialectalArabicMMLUを提案する。
MMLU-Redux フレームワークを手動で翻訳し、3K 個の質問応答対を5つの主要な方言に適応することで拡張する。
論文 参考訳(メタデータ) (2025-10-31T15:17:06Z) - UI-Level Evaluation of ALLaM 34B: Measuring an Arabic-Centric LLM via HUMAIN Chat [1.2788586581322734]
サウジのデータとAI機関は、アラビアに焦点を当てたモデルのファミリーである$allaM$を導入した。
最も有能な$ALLaM-34B$は、HUMAIN Chatを開発したHUMAINによって採用された。
本稿では,拡張されたUIレベルの$ALLaM-34B$について述べる。
論文 参考訳(メタデータ) (2025-08-24T14:32:15Z) - MuDRiC: Multi-Dialect Reasoning for Arabic Commonsense Validation [30.670712065855902]
複数の方言を組み込んだ拡張アラビア・コモンセンスデータセットである MuDRiC を導入し,(ii) アラビア・コモンセンス推論にグラフ畳み込みネットワーク(GCN)を適応させる新しい手法を提案する。
我々の研究は、その複雑なバリエーションを扱うための基礎的データセットと新しい方法の両方を提供することで、アラビア語の自然言語理解を強化する。
論文 参考訳(メタデータ) (2025-08-18T17:42:53Z) - BALSAM: A Platform for Benchmarking Arabic Large Language Models [34.50348949235453]
BALSAMは、アラビア語のLLM開発と評価を進めることを目的とした総合的なコミュニティ主導のベンチマークである。
14の幅広いカテゴリから78のNLPタスクが含まれており、52Kのサンプルは37Kテストと15K開発に分割されている。
論文 参考訳(メタデータ) (2025-07-30T12:16:39Z) - ArabicMMLU: Assessing Massive Multitask Language Understanding in Arabic [51.922112625469836]
アラビア語における最初のマルチタスク言語理解ベンチマークである、データセット名を提案する。
我々のデータは、現代標準アラビア語(MSA)における40のタスクと14,575のマルチチョイス質問で構成されており、地域の母語話者と協調して慎重に構築されている。
35モデルについて評価した結果,特にオープンソースモデルにおいて,改善の余地がかなり高いことが判明した。
論文 参考訳(メタデータ) (2024-02-20T09:07:41Z) - ALDi: Quantifying the Arabic Level of Dialectness of Text [17.37857915257019]
我々は、アラビア語話者が方言のスペクトルを知覚し、文レベルでアラビア方言レベル(ALDi)として機能すると主張している。
AOC-ALDiの詳細な分析を行い、訓練したモデルが他のコーパスの方言のレベルを効果的に識別できることを示す。
論文 参考訳(メタデータ) (2023-10-20T18:07:39Z) - AceGPT, Localizing Large Language Models in Arabic [73.39989503874634]
本稿では,アラビア語のテキストによる事前学習,ネイティブなアラビア語命令を利用したSFT(Supervised Fine-Tuning),アラビア語のGPT-4応答を含む総合的なソリューションを提案する。
目標は、文化的に認知され、価値に整合したアラビア語のLLMを、多様で応用特有のアラビア語コミュニティのニーズに適応させることである。
論文 参考訳(メタデータ) (2023-09-21T13:20:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。