論文の概要: Evaluation of Non-Negative Matrix Factorization and n-stage Latent
Dirichlet Allocation for Emotion Analysis in Turkish Tweets
- arxiv url: http://arxiv.org/abs/2110.00418v1
- Date: Mon, 27 Sep 2021 18:43:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-10 09:16:25.085882
- Title: Evaluation of Non-Negative Matrix Factorization and n-stage Latent
Dirichlet Allocation for Emotion Analysis in Turkish Tweets
- Title(参考訳): トルコのツイート感情分析における非負行列因子分解とn段階潜在ディリクレ割当ての評価
- Authors: Zekeriya Anil Guven, Banu Diri, Tolgahan Cakaloglu
- Abstract要約: トピックモデリングにおけるLDAおよび非負行列分解法を用いて、トルコのツイートがTwitterで投稿した感情を判断した。
データセットは5つの感情、すなわち怒り、恐怖、幸せ、悲しみ、混乱から構成される。
Wekaの結果の中で、最も成功した方法はnステージのLDAであり、最も成功したアルゴリズムはランダムフォレストである。
- 参考スコア(独自算出の注目度): 1.503974529275767
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the development of technology, the use of social media has become quite
common. Analyzing comments on social media in areas such as media and
advertising plays an important role today. For this reason, new and traditional
natural language processing methods are used to detect the emotion of these
shares. In this paper, the Latent Dirichlet Allocation, namely LDA, and
Non-Negative Matrix Factorization methods in topic modeling were used to
determine which emotion the Turkish tweets posted via Twitter. In addition, the
accuracy of a proposed n-level method based on LDA was analyzed. Dataset
consists of 5 emotions, namely angry, fear, happy, sad and confused. NMF was
the most successful method among all topic modeling methods in this study.
Then, the F1-measure of Random Forest, Naive Bayes and Support Vector Machine
methods was analyzed by obtaining a file suitable for Weka by using the word
weights and class labels of the topics. Among the Weka results, the most
successful method was n-stage LDA, and the most successful algorithm was Random
Forest.
- Abstract(参考訳): テクノロジーの発達により、ソーシャルメディアの利用は非常に一般的になった。
ソーシャルメディア上のコメントの分析は、メディアや広告といった分野で今日重要な役割を担っている。
このため、これらの共有の感情を検出するために、新しく伝統的な自然言語処理手法が用いられる。
本稿では,トルコのツイートがTwitterで投稿した感情を決定するために,LDA(Latent Dirichlet Allocation)とNon-Negative Matrix Factorization法を用いた。
さらに,LDAに基づくnレベル手法の精度について検討した。
データセットは5つの感情、すなわち怒り、恐怖、幸せ、悲しみ、混乱から構成される。
この研究でNMFはすべてのトピックモデリング手法の中で最も成功した手法である。
そして,そのトピックの重みとクラスラベルを用いて,Wekaに適したファイルを取得することにより,ランダムフォレスト,ネイブベイズ,サポートベクターマシンのF1尺度を解析した。
wekaの結果のうち最も成功した手法はn段階ldaであり、最も成功したアルゴリズムはランダムフォレストであった。
関連論文リスト
- MFABA: A More Faithful and Accelerated Boundary-based Attribution Method
for Deep Neural Networks [69.28125286491502]
我々は,公理に固執する帰属アルゴリズムであるMFABAを紹介する。
結果は、最先端の属性アルゴリズムよりも101.5142倍高速に達成することで、その優位性を証明している。
論文 参考訳(メタデータ) (2023-12-21T07:48:15Z) - Towards LogiGLUE: A Brief Survey and A Benchmark for Analyzing Logical
Reasoning Capabilities of Language Models [58.76688462256284]
大規模言語モデル(LLM)は、形式的知識表現(KR)システムの様々な制限を克服する能力を示した。
一つのタスクトレーニング,複数タスクトレーニング,および思考知識の蒸留微調整手法の連鎖について検討し,異なる論理的推論カテゴリにおけるモデルの性能を評価する。
論文 参考訳(メタデータ) (2023-10-02T01:00:50Z) - Bias and Fairness in Large Language Models: A Survey [76.65471160523444]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Exploring the Power of Topic Modeling Techniques in Analyzing Customer
Reviews: A Comparative Analysis [0.0]
大量のテキストデータをオンラインで分析するために、機械学習と自然言語処理アルゴリズムがデプロイされている。
本研究では,顧客レビューに特化して用いられる5つのトピックモデリング手法について検討・比較する。
以上の結果から,BERTopicはより意味のあるトピックを抽出し,良好な結果を得ることができた。
論文 参考訳(メタデータ) (2023-08-19T08:18:04Z) - An Experimental Investigation into the Evaluation of Explainability
Methods [60.54170260771932]
この研究は、9つの最先端XAI法と3つのダミー法(例えば、ランダム・サリエンシ・マップ)に適用された14の異なるメトリクスを比較した。
実験の結果、これらの指標のどれが高い相関関係を示し、潜在的な冗長性を示している。
論文 参考訳(メタデータ) (2023-05-25T08:07:07Z) - A Context-Sensitive Word Embedding Approach for The Detection of Troll
Tweets [0.0]
本研究では,トロルツイートの自動検出のためのモデルアーキテクチャの開発と評価を行う。
BERT,ELMo,GloVeの埋め込み法はGloVe法よりも優れた性能を示した。
CNNおよびGRUエンコーダも同様にF1スコアとAUCで実行された。
AUCスコア0.929のGRU分類器を用いたELMoベースのアーキテクチャが最適であることがわかった。
論文 参考訳(メタデータ) (2022-07-17T17:12:16Z) - Phrase-level Adversarial Example Generation for Neural Machine
Translation [75.01476479100569]
本稿では,句レベルの逆例生成(PAEG)手法を提案し,モデルの堅牢性を高める。
我々は,LDC中英語,IWSLT14ドイツ語-英語,WMT14英語-ドイツ語タスクの3つのベンチマークで検証を行った。
論文 参考訳(メタデータ) (2022-01-06T11:00:49Z) - Lexicon-based Methods vs. BERT for Text Sentiment Analysis [0.15293427903448023]
ロシア語に適応したSO-CALとSentiStrength lexiconに基づく手法
RuBERTはレキシコン法を平均で上回っているが、SO-CALは16の4コーパスでRuBERTを上回っている。
論文 参考訳(メタデータ) (2021-11-19T08:47:32Z) - n-stage Latent Dirichlet Allocation: A Novel Approach for LDA [1.503974529275767]
トピックモデリングフィールドは、テキスト文書のセマンティック構造を決定することができる。
Latent Dirichlet Allocation (LDA) はトピックモデリング手法で最も一般的な手法である。
LDA法をより効果的に活用できるn段式LDA法について詳述する。
論文 参考訳(メタデータ) (2021-10-16T15:26:53Z) - Fuzzy-Rough Nearest Neighbour Approaches for Emotion Detection in Tweets [1.7581155313656314]
ソーシャルメディアは、感情分析や感情認識といった様々なタスクで使用できる意味のあるデータの本質的な情報源である。
ファジィ粗近傍(FRNN)に基づくSemEval-2018感情検出タスクのためのアプローチを開発する。
我々の結果は、より複雑なディープラーニング手法に基づく最高のSemEvalソリューションと競合する。
論文 参考訳(メタデータ) (2021-07-08T12:52:47Z) - There and Back Again: Revisiting Backpropagation Saliency Methods [87.40330595283969]
正当性法は,各入力サンプルの重要度マップを作成することによって,モデルの予測を説明する。
このような手法の一般的なクラスは、信号のバックプロパゲートと結果の勾配の分析に基づいている。
本稿では,そのような手法を統一可能な単一のフレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-06T17:58:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。