論文の概要: Towards A Sentiment Analyzer for Low-Resource Languages
- arxiv url: http://arxiv.org/abs/2011.06382v1
- Date: Thu, 12 Nov 2020 13:50:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 06:24:16.953119
- Title: Towards A Sentiment Analyzer for Low-Resource Languages
- Title(参考訳): 低リソース言語のための感情分析
- Authors: Dian Indriani, Arbi Haza Nasution, Winda Monika and Salhazan Nasution
- Abstract要約: 本研究は,当時盛んに議論されてきた特定のトレンドトピックに対して,ユーザの感情を分析することを目的としている。
2019年のインドネシア大統領選挙で話題になったハッシュタグのtextit#kpujangancurangを使っています。
本研究は,ラピッドマイニングツールを用いて,Twitterデータを生成し,Nieve Bayes,K-Nearest Neighbor,Decision Tree,Multi-Layer Perceptronの分類手法を比較し,Twitterデータの感情を分類する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Twitter is one of the top influenced social media which has a million number
of active users. It is commonly used for microblogging that allows users to
share messages, ideas, thoughts and many more. Thus, millions interaction such
as short messages or tweets are flowing around among the twitter users
discussing various topics that has been happening world-wide. This research
aims to analyse a sentiment of the users towards a particular trending topic
that has been actively and massively discussed at that time. We chose a hashtag
\textit{\#kpujangancurang} that was the trending topic during the Indonesia
presidential election in 2019. We use the hashtag to obtain a set of data from
Twitter to analyse and investigate further the positive or the negative
sentiment of the users from their tweets. This research utilizes rapid miner
tool to generate the twitter data and comparing Naive Bayes, K-Nearest
Neighbor, Decision Tree, and Multi-Layer Perceptron classification methods to
classify the sentiment of the twitter data. There are overall 200 labeled data
in this experiment. Overall, Naive Bayes and Multi-Layer Perceptron
classification outperformed the other two methods on 11 experiments with
different size of training-testing data split. The two classifiers are
potential to be used in creating sentiment analyzer for low-resource languages
with small corpus.
- Abstract(参考訳): Twitterは、100万人のアクティブユーザーを抱える最も影響力のあるソーシャルメディアの1つだ。
一般的にはマイクロブログに使われ、ユーザーはメッセージ、アイデア、考えなどを共有できる。
このように、世界中の様々なトピックについて議論するtwitterユーザーの間で、ショートメッセージやツイートのような何百万もの対話が流れている。
本研究では,当時盛んに議論されてきた特定のトレンドトピックに対して,ユーザの感情を分析することを目的とする。
2019年のインドネシア大統領選挙で話題になったハッシュタグである「textit{\#kpujangancurang」を選択した。
ハッシュタグを使ってTwitterから一連のデータを取得し、ツイートからユーザーの肯定的あるいは否定的な感情を分析・調査します。
本研究では,twitterデータの生成にrapid minerツールを使用し,naive bayes,k-nearest neighbor, decision tree,多層パーセプトロン分類法を比較し,その感情を分類する。
この実験には200のラベル付きデータがある。
Naive BayesとMulti-Layer Perceptronの分類は、トレーニングテストデータの分割サイズが異なる11の実験において、他の2つの手法よりも優れていた。
この2つの分類器は、コーパスが小さい低リソース言語のための感情分析器を作成するのに使える可能性がある。
関連論文リスト
- ViralBERT: A User Focused BERT-Based Approach to Virality Prediction [11.992815669875924]
本稿では、コンテンツとユーザベースの機能を用いて、ツイートのバイラル性を予測できるViralBERTを提案する。
ハッシュタグやフォロワー数などの数値的特徴を合成してテキストをツイートし、2つのBERTモジュールを利用する手法を用いる。
ViralBERTをトレーニングするために330kのツイートのデータセットを収集し、この分野での現在の研究からベースラインを使用して、モデルの有効性を検証する。
論文 参考訳(メタデータ) (2022-05-17T21:40:24Z) - Manipulating Twitter Through Deletions [64.33261764633504]
Twitter上でのインフルエンスキャンペーンの研究は、公開APIを通じて得られたツイートから悪意のあるアクティビティを識別することに大きく依存している。
ここでは,1100万以上のアカウントによる10億以上の削除を含む,異常な削除パターンを網羅的かつ大規模に分析する。
少数のアカウントが毎日大量のツイートを削除していることがわかった。
まず、ツイートのボリューム制限が回避され、特定のアカウントが毎日2600万以上のツイートをネットワークに流すことができる。
第二に、調整されたアカウントのネットワークは、繰り返しのいいね!や、最終的に削除されるコンテンツとは違って、ランキングアルゴリズムを操作できる。
論文 参考訳(メタデータ) (2022-03-25T20:07:08Z) - Sentiment Analysis and Sarcasm Detection of Indian General Election
Tweets [0.0]
ソーシャルメディアの利用は、今日のデジタル世界では史上最高水準まで増加している。
一般大衆の感情や意見を分析することは、政府とビジネス関係者の両方にとって非常に重要である。
本稿では,ロクサバ選挙中のインド国民の感情をTwitterデータを用いて分析することに取り組んでいる。
論文 参考訳(メタデータ) (2022-01-03T17:30:00Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - News consumption and social media regulations policy [70.31753171707005]
我々は、ニュース消費とコンテンツ規制の間の相互作用を評価するために、反対のモデレーション手法であるTwitterとGabを強制した2つのソーシャルメディアを分析した。
以上の結果から,Twitterが追求するモデレーションの存在は,疑わしいコンテンツを著しく減少させることがわかった。
Gabに対する明確な規制の欠如は、ユーザが両方のタイプのコンテンツを扱う傾向を生じさせ、ディスカウント/エンドレスメントの振る舞いを考慮に入れた疑わしいコンテンツに対してわずかに好みを示す。
論文 参考訳(メタデータ) (2021-06-07T19:26:32Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Understanding Information Spreading Mechanisms During COVID-19 Pandemic
by Analyzing the Impact of Tweet Text and User Features for Retweet
Prediction [6.658785818853953]
新型コロナウイルスは世界の経済や、ほぼすべての人々の日常生活に影響を与えている。
ソーシャルメディアプラットフォームは、情報を共有できる他のユーザーと情報を共有できる。
CNNとRNNをベースとした2つのモデルを提案し、これらのモデルの性能を公開のTweetsCOV19データセットで評価する。
論文 参考訳(メタデータ) (2021-05-26T15:55:58Z) - Sentiment Analysis on Social Media Content [0.0]
本研究の目的は,Twitterから収集した実データの感情分析を行うモデルを提案することである。
Twitterのデータは非常に非構造化されており、分析が困難である。
提案手法は,教師付き機械学習アルゴリズムと教師なし機械学習アルゴリズムの併用により,この分野の先行研究とは異なる。
論文 参考訳(メタデータ) (2020-07-04T17:03:30Z) - Echo Chambers on Social Media: A comparative analysis [64.2256216637683]
本研究では,4つのソーシャルメディアプラットフォーム上で100万ユーザが生成した100万個のコンテンツに対して,エコーチャンバーの操作的定義を導入し,大規模な比較分析を行う。
議論の的になっているトピックについてユーザの傾きを推測し、異なる特徴を分析してインタラクションネットワークを再構築する。
我々は、Facebookのようなニュースフィードアルゴリズムを実装するプラットフォームが、エコーチャンバの出現を招きかねないという仮説を支持する。
論文 参考訳(メタデータ) (2020-04-20T20:00:27Z) - Forensic Authorship Analysis of Microblogging Texts Using N-Grams and
Stylometric Features [63.48764893706088]
この研究は、280文字に制限されたツイートメッセージの作者を特定することを目的としている。
弊社の実験では、40名のユーザによる、ユーザ毎120から200のつぶやきを自己キャプチャしたデータベースを使っています。
この小さなセットを使った結果は有望であり、異なる特徴は92%から98.5%の分類精度を提供する。
論文 参考訳(メタデータ) (2020-03-24T19:32:11Z) - Investigating Classification Techniques with Feature Selection For
Intention Mining From Twitter Feed [0.0]
マイクロブログサービスのTwitterには2億人以上の登録ユーザーがいて、1日に6500万以上の投稿をやりとりしている。
ほとんどのツイートは非公式に書かれ、しばしばスラング語で書かれている。
本稿では,Twitterフィードからユーザの意図を抽出する機能の選択の問題について検討する。
論文 参考訳(メタデータ) (2020-01-22T11:55:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。