論文の概要: Sentiment Analysis in Poems in Misurata Sub-dialect -- A Sentiment
Detection in an Arabic Sub-dialect
- arxiv url: http://arxiv.org/abs/2109.07203v1
- Date: Wed, 15 Sep 2021 10:42:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-16 22:21:53.960755
- Title: Sentiment Analysis in Poems in Misurata Sub-dialect -- A Sentiment
Detection in an Arabic Sub-dialect
- Title(参考訳): Misurata sub-dialectにおける歌の感性分析 -アラビア語サブ-dialectにおける感性検出
- Authors: Azza Abugharsa
- Abstract要約: この研究は、リビアで話されているミシュラタ・アラビア語サブ方言で書かれた詩の感情を検出することに焦点を当てた。
データセットから感情を検出するために使用されるツールは、SklearnとMazajak sentiment tool 1.1である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Over the recent decades, there has been a significant increase and
development of resources for Arabic natural language processing. This includes
the task of exploring Arabic Language Sentiment Analysis (ALSA) from Arabic
utterances in both Modern Standard Arabic (MSA) and different Arabic dialects.
This study focuses on detecting sentiment in poems written in Misurata Arabic
sub-dialect spoken in Misurata, Libya. The tools used to detect sentiment from
the dataset are Sklearn as well as Mazajak sentiment tool 1. Logistic
Regression, Random Forest, Naive Bayes (NB), and Support Vector Machines (SVM)
classifiers are used with Sklearn, while the Convolutional Neural Network (CNN)
is implemented with Mazajak. The results show that the traditional classifiers
score a higher level of accuracy as compared to Mazajak which is built on an
algorithm that includes deep learning techniques. More research is suggested to
analyze Arabic sub-dialect poetry in order to investigate the aspects that
contribute to sentiments in these multi-line texts; for example, the use of
figurative language such as metaphors.
- Abstract(参考訳): この数十年間、アラビア語の自然言語処理のための資源の大幅な増加と発展がみられた。
これには、現代標準アラビア語(MSA)と異なるアラビア語方言のアラビア語発話からアラビア言語知覚分析(ALSA)を探索するタスクが含まれる。
本研究は,リビアのミシュラタで話されているミシュラタ・アラビア方言の詩の感情を検出することに焦点を当てた。
データセットから感情を検出するために使用されるツールは、SklearnとMazajak sentiment tool 1.1である。
Logistic Regression, Random Forest, Naive Bayes (NB) と Support Vector Machines (SVM) は Sklearn で、Convolutional Neural Network (CNN) は Mazajak で実装されている。
その結果、従来の分類器は、ディープラーニング技術を含むアルゴリズムに基づいて構築されたMazajakに比べて精度が高いことがわかった。
これらの多行テキストにおける感情に寄与する側面、例えば比喩のような比喩的言語の使用を調査するために、アラビア語の副方言詩を分析するためにさらなる研究が提案されている。
関連論文リスト
- Arabic Text Sentiment Analysis: Reinforcing Human-Performed Surveys with
Wider Topic Analysis [49.1574468325115]
詳細な研究は、2002年から2020年の間に英語で出版された133のASA論文を手作業で分析する。
主な発見は、機械学習、レキシコンベース、ハイブリッドアプローチといった、ASAで使用されるさまざまなアプローチを示している。
アラビア文字SAについては、業界だけでなく学術分野でも使用できるASAツールを開発する必要がある。
論文 参考訳(メタデータ) (2024-03-04T10:37:48Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - ALDi: Quantifying the Arabic Level of Dialectness of Text [17.37857915257019]
我々は、アラビア語話者が方言のスペクトルを知覚し、文レベルでアラビア方言レベル(ALDi)として機能すると主張している。
AOC-ALDiの詳細な分析を行い、訓練したモデルが他のコーパスの方言のレベルを効果的に識別できることを示す。
論文 参考訳(メタデータ) (2023-10-20T18:07:39Z) - Arabic Sentiment Analysis with Noisy Deep Explainable Model [48.22321420680046]
本稿では,アラビア語の感情分類フレームワークを提案する。
提案フレームワークは,局所的な代理説明可能なモデルをトレーニングすることで,特定の予測を説明することができる。
アラビアサデータセットの公開ベンチマーク実験を行った。
論文 参考訳(メタデータ) (2023-09-24T19:26:53Z) - AceGPT, Localizing Large Language Models in Arabic [73.39989503874634]
本稿では,アラビア語のテキストによる事前学習,ネイティブなアラビア語命令を利用したSFT(Supervised Fine-Tuning),アラビア語のGPT-4応答を含む総合的なソリューションを提案する。
目標は、文化的に認知され、価値に整合したアラビア語のLLMを、多様で応用特有のアラビア語コミュニティのニーズに適応させることである。
論文 参考訳(メタデータ) (2023-09-21T13:20:13Z) - Beyond Arabic: Software for Perso-Arabic Script Manipulation [67.31374614549237]
ペルソ・アラビア文字を使用する言語の書き起こしシステムを操作するための有限状態トランスデューサ(FST)コンポーネントとそれに対応するユーティリティのセットを提供する。
ライブラリはまた、単純なFSTベースのロマン化と文字変換も提供する。
論文 参考訳(メタデータ) (2023-01-26T20:37:03Z) - Offensive Language Detection in Under-resourced Algerian Dialectal
Arabic Language [0.0]
我々は、未資源の言語の1つであるアルジェリア方言のアラビア語に焦点を当てている。
同じ言語での作業が不足しているため、我々は8.7k以上のテキストを通常の、虐待的、攻撃的に手動で注釈付けした新しいコーパスを構築した。
論文 参考訳(メタデータ) (2022-03-18T15:42:21Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Effect of Word Embedding Variable Parameters on Arabic Sentiment
Analysis Performance [0.0]
Twitter、Facebookなどのソーシャルメディア。
ユーザーの意見を含むコメントの数が増加しています。
本研究は,アラビア語感情分析のための3つのパラメータ(ウィンドウサイズ,ベクトル次元,負サンプル)について考察する。
4つのバイナリ分類器(ロジスティック回帰、決定木、サポートベクターマシン、ネイブベイ)を使用して感情を検出する。
論文 参考訳(メタデータ) (2021-01-08T08:31:00Z) - Automatic Arabic Dialect Identification Systems for Written Texts: A
Survey [0.0]
アラビア語の方言識別は自然言語処理の特定のタスクであり、与えられたテキストのアラビア語方言を自動的に予測することを目的としている。
本稿では,アラビア語の方言識別研究をテキストで包括的に調査する。
本稿では、従来の機械学習手法、ディープラーニングアーキテクチャ、アラビア方言識別のための複雑な学習アプローチについてレビューする。
論文 参考訳(メタデータ) (2020-09-26T15:33:16Z) - TArC: Incrementally and Semi-Automatically Collecting a Tunisian Arabish
Corpus [3.8580784887142774]
本稿では,第1次チュニジア・アラブ人コーパス(TArC)の構成過程について述べる。
アラビア語(アラビア語: Arabizi)は、アラビア語の方言をラテン文字とアリスモグラフ(文字として使われる数字)で自発的に符号化したものである。
論文 参考訳(メタデータ) (2020-03-20T22:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。