論文の概要: The emojification of sentiment on social media: Collection and analysis
of a longitudinal Twitter sentiment dataset
- arxiv url: http://arxiv.org/abs/2108.13898v1
- Date: Tue, 31 Aug 2021 14:54:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-01 14:24:56.740153
- Title: The emojification of sentiment on social media: Collection and analysis
of a longitudinal Twitter sentiment dataset
- Title(参考訳): ソーシャルメディアにおける感情の絵文字化:縦断的twitter感情データセットの収集と分析
- Authors: Wenjie Yin, Rabab Alkhalifa, Arkaitz Zubiaga
- Abstract要約: TM-Sentiは、Twitterの感情データセットを大規模に管理し、ツイート数は1億1400万を超えている。
我々は,大規模なエモティコンと絵文字に基づくラベル付き感情分析データセットを組み立てるための方法論を記述し,評価する。
私たちの分析では絵文字のエモティコンへの利用の増加など、興味深い時間的変化が強調されている。
- 参考スコア(独自算出の注目度): 5.528896840956628
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social media, as a means for computer-mediated communication, has been
extensively used to study the sentiment expressed by users around events or
topics. There is however a gap in the longitudinal study of how sentiment
evolved in social media over the years. To fill this gap, we develop TM-Senti,
a new large-scale, distantly supervised Twitter sentiment dataset with over 184
million tweets and covering a time period of over seven years. We describe and
assess our methodology to put together a large-scale, emoticon- and emoji-based
labelled sentiment analysis dataset, along with an analysis of the resulting
dataset. Our analysis highlights interesting temporal changes, among others in
the increasing use of emojis over emoticons. We publicly release the dataset
for further research in tasks including sentiment analysis and text
classification of tweets. The dataset can be fully rehydrated including tweet
metadata and without missing tweets thanks to the archive of tweets publicly
available on the Internet Archive, which the dataset is based on.
- Abstract(参考訳): ソーシャルメディアは、コンピュータによるコミュニケーションの手段として、イベントやトピックに関するユーザによる感情の研究に広く利用されている。
しかし、ソーシャルメディアにおける感情の進化に関する縦断的な研究にはギャップがある。
このギャップを埋めるために、TM-Sentiを開発した。これはTwitterの感情データセットで、1億1400万以上のツイートと7年以上の期間をカバーしている。
我々は,大規模なエモティコンと絵文字に基づくラベル付き感情分析データセットと,得られたデータセットの分析を行うための方法論を記述し,評価する。
私たちの分析では絵文字のエモティコンへの利用の増加など、興味深い時間的変化が強調されている。
我々は、感情分析やツイートのテキスト分類などのタスクに関するさらなる研究のためにデータセットを公開する。
データセットは、ツイートメタデータを含む完全なリハイドが可能で、データセットがベースとするインターネットアーカイブで公開されているツイートのアーカイブのおかげで、欠落したつぶやきがなくなる。
関連論文リスト
- Into the LAIONs Den: Investigating Hate in Multimodal Datasets [67.21783778038645]
本稿では、LAION-400MとLAION-2Bの2つのデータセットの比較監査を通して、ヘイトフルコンテンツに対するデータセットのスケーリングの効果について検討する。
その結果、データセットのスケールによってヘイトコンテンツは12%近く増加し、質的にも定量的にも測定された。
また、画像のみに基づいて算出されたNot Safe For Work(NSFW)値に基づくデータセットの内容のフィルタリングは、アルトテキストにおける有害なコンテンツをすべて排除するものではないことがわかった。
論文 参考訳(メタデータ) (2023-11-06T19:00:05Z) - An LSTM model for Twitter Sentiment Analysis [0.0]
公開され、手動で注釈付けされたTwitterの感情データセットを7つ集めました。
収集したデータセットから、新たなトレーニングとテストデータセットを作成します。
我々は、ツイートの感情を分類し、新しいデータセットでモデルを評価するLSTMモデルを開発した。
論文 参考訳(メタデータ) (2022-12-04T10:42:46Z) - Decay No More: A Persistent Twitter Dataset for Learning Social Meaning [10.227026799075215]
社会意味のための英語Twitterデータセット(PTSM)を提案する。
PTSMは17ドルのソーシャル意味データセットと10ドルのタスクカテゴリで構成されている。
我々は2つのSOTA事前訓練言語モデルを用いて実験を行い、PTSMが実際のツイートをパラフレーズに置換し、性能損失を極端に抑えることを示した。
論文 参考訳(メタデータ) (2022-04-10T06:07:54Z) - Extracting Feelings of People Regarding COVID-19 by Social Network
Mining [0.0]
英語における新型コロナウイルス関連ツイートのデータセットが収集される。
2020年3月23日から6月23日までに200万件以上のツイートが分析されている。
論文 参考訳(メタデータ) (2021-10-12T16:45:33Z) - Exploiting BERT For Multimodal Target SentimentClassification Through
Input Space Translation [75.82110684355979]
オブジェクト認識変換器を用いて入力空間内の画像を変換する2ストリームモデルを提案する。
次に、翻訳を利用して、言語モデルに多モーダル情報を提供する補助文を構築する。
2つのマルチモーダルTwitterデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-08-03T18:02:38Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Understanding the Hoarding Behaviors during the COVID-19 Pandemic using
Large Scale Social Media Data [77.34726150561087]
われわれは、2020年3月1日から4月30日まで、米国で4万2000人以上のユニークTwitterユーザーによる嫌がらせと反嫌悪のパターンを分析した。
ホアーディンググループと反ホアーディンググループの両方の女性の比率が、一般のTwitter利用者の比率よりも高いことがわかりました。
LIWCの不安度はTwitterの不安度よりもかなり高い。
論文 参考訳(メタデータ) (2020-10-15T16:02:25Z) - Tweets Sentiment Analysis via Word Embeddings and Machine Learning
Techniques [1.345251051985899]
本論文では、感情分類のための特徴選択モデルWord2vecと機械学習アルゴリズムランダムフォレストを用いて、リアルタイムの2019年選挙Twitterデータに対する感情分析を行うことを目的とする。
Word2vecはテキスト中の単語の文脈意味を考慮し、特徴の質を改善し、機械学習と感情分析の精度を向上させる。
論文 参考訳(メタデータ) (2020-07-05T08:10:30Z) - Neural Temporal Opinion Modelling for Opinion Prediction on Twitter [42.87769996249732]
本研究では,周辺環境における動的トピックシフトを捉えるために,トピック駆動型アテンション機構を設計する。
実験の結果,提案モデルでは,ポスト時間と将来のツイートのスタンスラベルの両方を,競合するベースラインよりも正確に予測できることがわかった。
論文 参考訳(メタデータ) (2020-05-27T16:49:04Z) - Privacy-Aware Recommender Systems Challenge on Twitter's Home Timeline [47.434392695347924]
ACM RecSysが主催するRecSys 2020 Challengeは、このデータセットを使用してTwitterと提携している。
本稿では,ユーザエンゲージメントを予測しようとする研究者や専門家が直面する課題について述べる。
論文 参考訳(メタデータ) (2020-04-28T23:54:33Z) - That Message Went Viral?! Exploratory Analytics and Sentiment Analysis
into the Propagation of Tweets [0.0]
我々は100万ツイート以上のデータセットについて探索分析を行った。
我々は、最も人気のあるメッセージを特定し、複数の内因性次元でつぶやきを分析した。
私たちはいくつかの興味深いパターンを発見し、研究者や実践者が人気のあるバイラルツイートの振る舞いをよりよく理解するための新たな洞察を明らかにしました。
論文 参考訳(メタデータ) (2020-04-21T02:38:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。