Fugu-MT 論文翻訳(概要): A Novel Dialect-Aware Framework for the Classification of Arabic Dialects and Emotions

論文の概要: A Novel Dialect-Aware Framework for the Classification of Arabic Dialects and Emotions

arxiv url: http://arxiv.org/abs/2502.09128v1
Date: Thu, 13 Feb 2025 10:05:44 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-14 20:05:35.191976
Title: A Novel Dialect-Aware Framework for the Classification of Arabic Dialects and Emotions
Title（参考訳）: アラビア語の方言と感情の分類のための新しい方言認識フレームワーク
Authors: Nasser A Alsadhan,
Abstract要約: アラビア語における感情検出の現在の研究は、異なる方言で感情がどのように表現されるかについての認識を欠いている。この研究は、与えられたテキストからアラビア語の方言や感情を識別し、予測できる新しいフレームワークを構築する。アラビア方言の分類では88.9%の精度を達成し、最先端の結果を6.45ポイント上回った。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Arabic is one of the oldest languages still in use today. As a result, several Arabic-speaking regions have developed dialects that are unique to them. Dialect and emotion recognition have various uses in Arabic text analysis, such as determining an online customer's origin based on their comments. Furthermore, intelligent chatbots that are aware of a user's emotions can respond appropriately to the user. Current research in emotion detection in the Arabic language lacks awareness of how emotions are exhibited in different dialects, which motivates the work found in this study. This research addresses the problems of dialect and emotion classification in Arabic. Specifically, this is achieved by building a novel framework that can identify and predict Arabic dialects and emotions from a given text. The framework consists of three modules: A text-preprocessing module, a classification module, and a clustering module with the novel capability of building new dialect-aware emotion lexicons. The proposed framework generated a new emotional lexicon for different dialects. It achieved an accuracy of 88.9% in classifying Arabic dialects, which outperforms the state-of-the-art results by 6.45 percentage points. Furthermore, the framework achieved 89.1-79% accuracy in detecting emotions in the Egyptian and Gulf dialects, respectively.
Abstract（参考訳）: アラビア語は現在も使われている最古の言語の一つである。その結果、アラビア語圏のいくつかの地域では独自の方言が発達した。方言と感情認識は、アラビア語のテキスト分析において、コメントに基づいてオンライン顧客の起源を決定するなど、様々な用途がある。さらに、ユーザの感情を認識しているインテリジェントなチャットボットは、ユーザに対して適切に応答することができる。アラビア語における感情検出の現在の研究は、異なる方言で感情がどのように表現されるかの認識を欠いている。本研究は、アラビア語における方言と感情分類の問題に対処する。具体的には、与えられたテキストからアラビア語の方言や感情を識別し、予測できる新しいフレームワークを構築することで達成される。フレームワークは3つのモジュールで構成されている: テキスト前処理モジュール、分類モジュール、新しい方言対応感情辞書を構築する新しい能力を備えたクラスタリングモジュール。提案した枠組みは、異なる方言に対する新たな感情的語彙を生み出した。アラビア方言の分類では88.9%の精度を達成し、最先端の結果を6.45ポイント上回った。さらに、この枠組みはエジプト方言と湾岸方言の感情の検出において89.1-79%の精度を達成した。

関連論文リスト

DialectalArabicMMLU: Benchmarking Dialectal Capabilities in Arabic and Multilingual Language Models [54.10223256792762]
アラビア方言における大規模言語モデル(LLM)の性能評価のための新しいベンチマークであるDialectalArabicMMLUを提案する。 MMLU-Redux フレームワークを手動で翻訳し、3K 個の質問応答対を5つの主要な方言に適応することで拡張する。
論文参考訳（メタデータ） (2025-10-31T15:17:06Z)
DialectGen: Benchmarking and Improving Dialect Robustness in Multimodal Generation [111.94720088481614]
多モーダル生成モデルは方言テキスト入力を効果的に生成できるのか? 6つの共通英語方言にまたがる大規模ベンチマークを構築した。マルチモーダル生成モデルのための一般的なエンコーダに基づく緩和戦略を設計する。
論文参考訳（メタデータ） (2025-10-16T17:56:55Z)
Second Language (Arabic) Acquisition of LLMs via Progressive Vocabulary Expansion [55.27025066199226]
本稿では,アラブ世界における大規模言語モデル(LLM)の民主化の必要性に対処する。アラビア語のLLMの実用的な目的の1つは、復号を高速化するトークン化器にアラビア語固有の語彙を使用することである。第二言語(アラビア語)による人への獲得の間に語彙学習に触発されたAraLLaMAは、進歩的な語彙拡張を採用している。
論文参考訳（メタデータ） (2024-12-16T19:29:06Z)
Exploiting Dialect Identification in Automatic Dialectal Text Normalization [9.320305816520422]
我々は、方言アラビア語を標準オーソグラフィー(CODA)に標準化することを目指している。我々はCODAフィケーションのタスクに基づいて,新たに開発されたシーケンス・ツー・シーケンスのモデルをベンチマークした。方言識別情報を使用することで,すべての方言のパフォーマンスが向上することを示す。
論文参考訳（メタデータ） (2024-07-03T11:30:03Z)
ArabicMMLU: Assessing Massive Multitask Language Understanding in Arabic [51.922112625469836]
アラビア語における最初のマルチタスク言語理解ベンチマークである、データセット名を提案する。我々のデータは、現代標準アラビア語(MSA)における40のタスクと14,575のマルチチョイス質問で構成されており、地域の母語話者と協調して慎重に構築されている。 35モデルについて評価した結果,特にオープンソースモデルにおいて,改善の余地がかなり高いことが判明した。
論文参考訳（メタデータ） (2024-02-20T09:07:41Z)
ALDi: Quantifying the Arabic Level of Dialectness of Text [17.37857915257019]
我々は、アラビア語話者が方言のスペクトルを知覚し、文レベルでアラビア方言レベル(ALDi)として機能すると主張している。 AOC-ALDiの詳細な分析を行い、訓練したモデルが他のコーパスの方言のレベルを効果的に識別できることを示す。
論文参考訳（メタデータ） (2023-10-20T18:07:39Z)
AceGPT, Localizing Large Language Models in Arabic [73.39989503874634]
本稿では,アラビア語のテキストによる事前学習,ネイティブなアラビア語命令を利用したSFT(Supervised Fine-Tuning),アラビア語のGPT-4応答を含む総合的なソリューションを提案する。目標は、文化的に認知され、価値に整合したアラビア語のLLMを、多様で応用特有のアラビア語コミュニティのニーズに適応させることである。
論文参考訳（メタデータ） (2023-09-21T13:20:13Z)
Multi-VALUE: A Framework for Cross-Dialectal English NLP [49.55176102659081]
マルチディレクト (Multi-Dilect) は、50の英語方言にまたがる制御可能なルールベースの翻訳システムである。ストレステストは、非標準方言の先行モデルに対する顕著な性能格差を示す。私たちはチカノやインド英語のネイティブスピーカーと提携して、人気のあるCoQAタスクの新しいゴールドスタンダード版をリリースしています。
論文参考訳（メタデータ） (2022-12-15T18:17:01Z)
Offensive Language Detection in Under-resourced Algerian Dialectal Arabic Language [0.0]
我々は、未資源の言語の1つであるアルジェリア方言のアラビア語に焦点を当てている。同じ言語での作業が不足しているため、我々は8.7k以上のテキストを通常の、虐待的、攻撃的に手動で注釈付けした新しいコーパスを構築した。
論文参考訳（メタデータ） (2022-03-18T15:42:21Z)
A New Generation of Perspective API: Efficient Multilingual Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文参考訳（メタデータ） (2022-02-22T20:55:31Z)
Textless Speech Emotion Conversion using Decomposed and Discrete Representations [49.55101900501656]
我々は、音声を、コンテンツ単位、F0、話者、感情からなる離散的、非絡み合いの学習表現に分解する。まず、内容単位を対象の感情に翻訳し、その単位に基づいて韻律的特徴を予測することによって、音声内容を変更する。最後に、予測された表現をニューラルボコーダに入力して音声波形を生成する。
論文参考訳（メタデータ） (2021-11-14T18:16:42Z)
Sentiment Analysis in Poems in Misurata Sub-dialect -- A Sentiment Detection in an Arabic Sub-dialect [0.0]
この研究は、リビアで話されているミシュラタ・アラビア語サブ方言で書かれた詩の感情を検出することに焦点を当てた。データセットから感情を検出するために使用されるツールは、SklearnとMazajak sentiment tool 1.1である。
論文参考訳（メタデータ） (2021-09-15T10:42:39Z)
Automatic Arabic Dialect Identification Systems for Written Texts: A Survey [0.0]
アラビア語の方言識別は自然言語処理の特定のタスクであり、与えられたテキストのアラビア語方言を自動的に予測することを目的としている。本稿では,アラビア語の方言識別研究をテキストで包括的に調査する。本稿では、従来の機械学習手法、ディープラーニングアーキテクチャ、アラビア方言識別のための複雑な学習アプローチについてレビューする。
論文参考訳（メタデータ） (2020-09-26T15:33:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。