論文の概要: Political Sentiment Analysis of Persian Tweets Using CNN-LSTM Model
- arxiv url: http://arxiv.org/abs/2307.07740v2
- Date: Tue, 29 Aug 2023 16:55:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-30 17:48:01.037006
- Title: Political Sentiment Analysis of Persian Tweets Using CNN-LSTM Model
- Title(参考訳): CNN-LSTMモデルを用いたペルシャツイートの政治的感性分析
- Authors: Mohammad Dehghani, Zahra Yazdanparast
- Abstract要約: ペルシャの政治ツイートの分析感情に機械学習とディープラーニングモデルを提案する。
ParsBERTの埋め込みによるディープラーニングは、機械学習よりも優れている。
- 参考スコア(独自算出の注目度): 0.356008609689971
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Sentiment analysis is the process of identifying and categorizing people's
emotions or opinions regarding various topics. The analysis of Twitter
sentiment has become an increasingly popular topic in recent years. In this
paper, we present several machine learning and a deep learning model to
analysis sentiment of Persian political tweets. Our analysis was conducted
using Bag of Words and ParsBERT for word representation. We applied Gaussian
Naive Bayes, Gradient Boosting, Logistic Regression, Decision Trees, Random
Forests, as well as a combination of CNN and LSTM to classify the polarities of
tweets. The results of this study indicate that deep learning with ParsBERT
embedding performs better than machine learning. The CNN-LSTM model had the
highest classification accuracy with 89 percent on the first dataset and 71
percent on the second dataset. Due to the complexity of Persian, it was a
difficult task to achieve this level of efficiency. The main objective of our
research was to reduce the training time while maintaining the model's
performance. As a result, several adjustments were made to the model
architecture and parameters. In addition to achieving the objective, the
performance was slightly improved as well.
- Abstract(参考訳): 感情分析は、人々の感情や様々なトピックに関する意見を特定し分類するプロセスである。
Twitterの感情分析は、近年ますます人気が高まっている。
本稿では,ペルシャの政治ツイートの感情分析のために,いくつかの機械学習とディープラーニングモデルを提案する。
分析は単語表現のためのbag of wordsとparsbertを用いて行った。
我々は、ツイートの極性を分類するために、Gaussian Naive Bayes、Gradient Boosting、Logistic Regression、Decision Trees、Random Forests、CNNとLSTMを組み合わせた。
本研究では,ParsBERT埋め込みによるディープラーニングが機械学習よりも優れていることを示す。
CNN-LSTMモデルは分類精度が最も高く、第1データセットでは99%、第2データセットでは71%であった。
ペルシャの複雑さのため、このレベルの効率を達成するのは困難であった。
本研究の目的は,モデルの性能を維持しながらトレーニング時間を短縮することであった。
その結果、モデルアーキテクチャとパラメータにいくつかの調整が加えられた。
目的を達成することに加えて、パフォーマンスもわずかに改善された。
関連論文リスト
- Convolutional Neural Networks for Sentiment Analysis on Weibo Data: A
Natural Language Processing Approach [0.228438857884398]
本研究では,Weiboの119,988ツイートのデータセット上で,畳み込みニューラルネットワーク(CNN)を用いた感情分析の複雑な課題に対処する。
CNNに基づくモデルを用いて,特徴抽出に単語埋め込みを活用し,感情分類を行う訓練を行った。
このモデルは、テストセットで平均約0.73のマクロ平均F1スコアを達成し、正、中、負の感情でバランスの取れた性能を示した。
論文 参考訳(メタデータ) (2023-07-13T03:02:56Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - Constructing Colloquial Dataset for Persian Sentiment Analysis of Social
Microblogs [0.0]
本稿ではまず,ITRC-Opinionというユーザ意見データセットを協調的かつインソース的に構築する。
私たちのデータセットには、TwitterやInstagramといったソーシャルなマイクロブログから、6万の非公式で口語的なペルシア語のテキストが含まれています。
次に,畳み込みニューラルネットワーク(CNN)モデルに基づく新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-06-22T05:51:22Z) - Robust Learning with Progressive Data Expansion Against Spurious
Correlation [65.83104529677234]
本研究では,2層非線形畳み込みニューラルネットワークの学習過程について検討した。
分析の結果,不均衡なデータ群と学習容易なスプリアス特徴が学習過程におけるスプリアス特徴の優位性に繋がる可能性が示唆された。
本稿では,PDEと呼ばれる新たなトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-08T05:44:06Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Empirical evaluation of shallow and deep learning classifiers for Arabic
sentiment analysis [1.1172382217477126]
本研究は、アラビア語レビューの感情分析のためのディープラーニングモデルの性能を詳細に比較したものである。
この研究で使用されるデータセットは、アラビア語のホテルと本レビューデータセットである。
その結果,2次・複数ラベル分類では深層学習が浅層学習より優れており,文献で報告された同様の研究結果とは対照的であった。
論文 参考訳(メタデータ) (2021-12-01T14:45:43Z) - Multi-Class and Automated Tweet Categorization [0.0]
この研究は、ツイートのカテゴリーをテキストから検出することを目的としている。
ツイートは、テキストマイニングまたは自然言語処理(NLP)と機械学習(ML)技術を使用して、12の特定カテゴリに分類される。
最高のアンサンブルモデルであるグラディエント・ブースティングはAUCのスコアが85%に達した。
論文 参考訳(メタデータ) (2021-11-13T14:28:47Z) - Improving Classifier Training Efficiency for Automatic Cyberbullying
Detection with Feature Density [58.64907136562178]
言語支援の異なる特徴前処理手法を用いて特徴密度(FD)の有効性を検討した。
データセットの複雑さを推定することで、必要な実験の数を削減できると仮定する。
データセットの言語的複雑さの違いにより、言語的に支援された単語前処理の有効性を議論することが可能になる。
論文 参考訳(メタデータ) (2021-11-02T15:48:28Z) - AES Systems Are Both Overstable And Oversensitive: Explaining Why And
Proposing Defenses [66.49753193098356]
スコアリングモデルの驚くべき逆方向の脆さの原因について検討する。
のモデルとして訓練されているにもかかわらず、単語の袋のように振る舞うことを示唆している。
高い精度で試料を発生させる過敏性と過敏性を検出できる検出ベース保護モデルを提案する。
論文 参考訳(メタデータ) (2021-09-24T03:49:38Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。