論文の概要: Sentiment Analysis in Twitter for Macedonian
- arxiv url: http://arxiv.org/abs/2109.13725v1
- Date: Mon, 27 Sep 2021 06:53:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-29 15:00:07.332478
- Title: Sentiment Analysis in Twitter for Macedonian
- Title(参考訳): マケドニアのTwitterにおける感情分析
- Authors: Dame Jovanoski, Veno Pachovski, Preslav Nakov
- Abstract要約: この研究は、形態的に豊かなマケドニア語のための感情分析システムを構築する最初の試みである。
我々は、ツイートレベルの感情極性(肯定的、否定的、中立的)を付加したツイートのコーパスを開発する。
マケドニア語に対する大規模な感情のレキシコンをいくつかブートストラップし、英語に対する以前の研究に動機づけられた。
実験結果によると、F1スコアは92.16で、非常に強く、英語の最良の結果に匹敵する。
- 参考スコア(独自算出の注目度): 17.53242370567476
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present work on sentiment analysis in Twitter for Macedonian. As this is
pioneering work for this combination of language and genre, we created suitable
resources for training and evaluating a system for sentiment analysis of
Macedonian tweets. In particular, we developed a corpus of tweets annotated
with tweet-level sentiment polarity (positive, negative, and neutral), as well
as with phrase-level sentiment, which we made freely available for research
purposes. We further bootstrapped several large-scale sentiment lexicons for
Macedonian, motivated by previous work for English. The impact of several
different pre-processing steps as well as of various features is shown in
experiments that represent the first attempt to build a system for sentiment
analysis in Twitter for the morphologically rich Macedonian language. Overall,
our experimental results show an F1-score of 92.16, which is very strong and is
on par with the best results for English, which were achieved in recent SemEval
competitions.
- Abstract(参考訳): マケドニア語に対するTwitterの感情分析について紹介する。
これは言語とジャンルの組み合わせの先駆的な作業であり、マケドニアのつぶやきの感情分析システムの訓練と評価に最適なリソースを作成しました。
特に,ツイートレベルの感情極性(肯定的,否定的,中立的)や,フレーズレベルの感情をアノテーションしたツイートコーパスを開発し,研究目的で自由に利用できるようにした。
我々はさらに、以前の英語の作業によって動機付けられたマケドニア語の大規模な感情語彙のいくつかをブートストラップした。
いくつかの異なる前処理ステップと様々な特徴の影響は、形態的にリッチなマケドニア語のためのTwitterで感情分析システムを構築する最初の試みを示す実験で示されている。
実験の結果、F1スコアは92.16で、これは非常に強く、最近のSemEvalコンペティションで達成された英語の最良の結果と同等である。
関連論文リスト
- You Shall Know a Tool by the Traces it Leaves: The Predictability of Sentiment Analysis Tools [74.98850427240464]
感情分析ツールが同じデータセットで一致しないことを示す。
感傷的アノテーションに使用される感情ツールは,その結果から予測できることを示す。
論文 参考訳(メタデータ) (2024-10-18T17:27:38Z) - M2SA: Multimodal and Multilingual Model for Sentiment Analysis of Tweets [4.478789600295492]
本稿では,既存のテキスト型Twitter感情データセットを,簡単なキュレーションプロセスを通じてマルチモーダルフォーマットに変換する。
本研究は,研究コミュニティにおける感情関連研究の新たな道を開くものである。
論文 参考訳(メタデータ) (2024-04-02T09:11:58Z) - Ensemble Language Models for Multilingual Sentiment Analysis [0.0]
SemEval-17のツイートテキストとアラビアセンティメントのつぶやきデータセットの感情分析について検討する。
その結果,単言語モデルでは性能が優れ,アンサンブルモデルではベースラインよりも優れていた。
論文 参考訳(メタデータ) (2024-03-10T01:39:10Z) - SAIDS: A Novel Approach for Sentiment Analysis Informed of Dialect and
Sarcasm [0.0]
本稿では,アラビア語ツイートの感情,皮肉,方言を予測する新しいシステム(SAIDS)を紹介する。
すべてのタスクを一緒にトレーニングすることで、SAIDSの結果は75.98 FPN、59.09 F1スコア、71.13 F1スコアで、それぞれ感情分析、肉腫検出、方言識別を行う。
論文 参考訳(メタデータ) (2023-01-06T14:19:46Z) - Sentiment-Aware Word and Sentence Level Pre-training for Sentiment
Analysis [64.70116276295609]
SentiWSPは、WordレベルとSentenceレベルの事前トレーニングタスクを組み合わせた、Sentiment対応の事前トレーニング言語モデルである。
SentiWSPは、様々な文レベルおよびアスペクトレベルの感情分類ベンチマーク上で、最先端のパフォーマンスを新たに達成する。
論文 参考訳(メタデータ) (2022-10-18T12:25:29Z) - NaijaSenti: A Nigerian Twitter Sentiment Corpus for Multilingual
Sentiment Analysis [5.048355865260207]
ナイジェリアでもっとも広く話されている4言語に対して、人手によるTwitter感情データセットを初めて導入する。
データセットは1言語あたり約30,000の注釈付きツイートで構成されている。
私たちは、データセット、訓練されたモデル、感情レキシコン、コードをリリースし、表現不足言語における感情分析の研究にインセンティブを与えます。
論文 参考訳(メタデータ) (2022-01-20T16:28:06Z) - Exploiting BERT For Multimodal Target SentimentClassification Through
Input Space Translation [75.82110684355979]
オブジェクト認識変換器を用いて入力空間内の画像を変換する2ストリームモデルを提案する。
次に、翻訳を利用して、言語モデルに多モーダル情報を提供する補助文を構築する。
2つのマルチモーダルTwitterデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-08-03T18:02:38Z) - Improving Sentiment Analysis over non-English Tweets using Multilingual
Transformers and Automatic Translation for Data-Augmentation [77.69102711230248]
我々は、英語のつぶやきを事前学習し、自動翻訳を用いてデータ拡張を適用して非英語の言語に適応する多言語トランスフォーマーモデルを提案する。
我々のフランス語、スペイン語、ドイツ語、イタリア語での実験は、この手法が非英語のツイートの小さなコーパスよりも、トランスフォーマーの結果を改善する効果的な方法であることを示唆している。
論文 参考訳(メタデータ) (2020-10-07T15:44:55Z) - NLP-CIC at SemEval-2020 Task 9: Analysing sentiment in code-switching
language using a simple deep-learning classifier [63.137661897716555]
コードスイッチングは、2つ以上の言語が同じメッセージで使用される現象である。
標準的な畳み込みニューラルネットワークモデルを用いて、スペイン語と英語の混在するツイートの感情を予測する。
論文 参考訳(メタデータ) (2020-09-07T19:57:09Z) - SKEP: Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis [69.80296394461149]
本稿では,複数の感情分析タスクに対する統一的な感情表現を学習するために,感覚知識強化事前学習(SKEP)を導入する。
自動的な知識の助けを借りて、SKEPは感情マスキングを行い、3つの感情知識予測目標を構築する。
3種類の感情タスクの実験では、SKEPはトレーニング前ベースラインよりも有意に優れていた。
論文 参考訳(メタデータ) (2020-05-12T09:23:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。