論文の概要: COVID-19 Twitter Dataset with Latent Topics, Sentiments and Emotions
Attributes
- arxiv url: http://arxiv.org/abs/2007.06954v8
- Date: Sat, 25 Jun 2022 06:35:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 15:08:29.115315
- Title: COVID-19 Twitter Dataset with Latent Topics, Sentiments and Emotions
Attributes
- Title(参考訳): 潜在トピック、感情、感情属性を備えたcovid-19 twitterデータセット
- Authors: Raj Kumar Gupta, Ajay Vishwanath, Yinping Yang
- Abstract要約: 本稿は、Twitterプラットフォーム上でのCOVID-19パンデミックに対する人々の言論と対応に関する大規模なグローバルデータセットについて述べる。
われわれは2億2200万件以上のTwitter投稿を「コロナ」「武漢」「nCov」「コビッド」という4つのキーワードを使って収集、処理した。
この論文は、コミュニケーション、心理学、公衆衛生、経済学、疫学におけるデータセットの使用に関する議論から締めくくっている。
- 参考スコア(独自算出の注目度): 4.254099382808598
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper describes a large global dataset on people's discourse and
responses to the COVID-19 pandemic over the Twitter platform. From 28 January
2020 to 1 June 2022, we collected and processed over 252 million Twitter posts
from more than 29 million unique users using four keywords: "corona", "wuhan",
"nCov" and "covid". Leveraging probabilistic topic modelling and pre-trained
machine learning-based emotion recognition algorithms, we labelled each tweet
with seventeen attributes, including a) ten binary attributes indicating the
tweet's relevance (1) or irrelevance (0) to the top ten detected topics, b)
five quantitative emotion attributes indicating the degree of intensity of the
valence or sentiment (from 0: extremely negative to 1: extremely positive) and
the degree of intensity of fear, anger, sadness and happiness emotions (from 0:
not at all to 1: extremely intense), and c) two categorical attributes
indicating the sentiment (very negative, negative, neutral or mixed, positive,
very positive) and the dominant emotion (fear, anger, sadness, happiness, no
specific emotion) the tweet is mainly expressing. We discuss the technical
validity and report the descriptive statistics of these attributes, their
temporal distribution, and geographic representation. The paper concludes with
a discussion of the dataset's usage in communication, psychology, public
health, economics, and epidemiology.
- Abstract(参考訳): 本稿は、Twitterプラットフォーム上でのCOVID-19パンデミックに対する人々の言論と対応に関する大規模なグローバルデータセットについて述べる。
2020年1月28日から2022年6月1日まで、私たちは2億2200万以上のユニークユーザーから、"corona"、"wuhan"、"nCov"、"covid"の4つのキーワードを使用して、2900万以上のTwitter投稿を収集し、処理しました。
確率的トピックモデリングと機械学習に基づく感情認識アルゴリズムを活用して,各ツイートに17の属性をラベル付けした。
a) ツイートの関連性を示す10のバイナリ属性(1)又は(0)が検出された上位10のトピックに関するもの
b) 原子価又は感情の強さの程度を示す5つの定量的感情属性(0:極端に否定的から1:極端に肯定的)及び恐怖、怒り、悲しみ、幸福の強さの程度(0:全くないから1:極端に激しい)
c) 感情(非常に否定的、否定的、中性的、混合的、肯定的、非常に肯定的)と支配的感情(恐怖、怒り、悲しみ、幸福、特定の感情を伴わない。)を示す2つのカテゴリーの属性は、主に表現されている。
技術的妥当性を議論し,これらの属性の記述統計,時間分布,地理的表現について報告する。
この論文は、コミュニケーション、心理学、公衆衛生、経済学、疫学におけるデータセットの使用に関する議論から締めくくっている。
関連論文リスト
- Lexicon-Based Sentiment Analysis on Text Polarities with Evaluation of Classification Models [1.342834401139078]
本研究は,レキシコン法を用いて感情分析を行い,テキストデータを用いた分類モデルの評価を行った。
語彙に基づく手法は、単語レベルでの感情と主観性の強さを識別する。
この研究は、テキストが正、負、中立とラベル付けされているというマルチクラスの問題に基づいている。
論文 参考訳(メタデータ) (2024-09-19T15:31:12Z) - EMO-KNOW: A Large Scale Dataset on Emotion and Emotion-cause [8.616061735005314]
我々は15年間で980万件のツイートから導かれた感情原因の大規模なデータセットを紹介した。
データセットの新規性は、その幅広い感情クラスと抽象的な感情原因に由来する。
私たちのデータセットは、異なる人々の多様な感情反応を考慮に入れた感情認識システムの設計を可能にします。
論文 参考訳(メタデータ) (2024-06-18T08:26:33Z) - DepressionEmo: A novel dataset for multilabel classification of
depression emotions [6.26397257917403]
DepressionEmoは、Redditの長いユーザー投稿の6037例によって、うつ病に関連する8つの感情を検出するために設計されたデータセットである。
このデータセットは、事前訓練されたモデルのゼロショット分類による入力に対する多数決によって作成された。
本稿では,SVM,XGBoost,Light GBMなどの機械学習手法と,BERT,GAN-BERT,BARTなどのディープラーニング手法の2つのグループに分類されるテキスト分類手法を提案する。
論文 参考訳(メタデータ) (2024-01-09T16:25:31Z) - Emotion Rendering for Conversational Speech Synthesis with Heterogeneous
Graph-Based Context Modeling [50.99252242917458]
会話音声合成(CSS)は,会話環境の中で適切な韻律と感情のインフレクションで発話を正確に表現することを目的としている。
データ不足の問題に対処するため、私たちはカテゴリと強度の点で感情的なラベルを慎重に作成します。
我々のモデルは感情の理解と表現においてベースラインモデルよりも優れています。
論文 参考訳(メタデータ) (2023-12-19T08:47:50Z) - Exploring a Hybrid Deep Learning Framework to Automatically Discover
Topic and Sentiment in COVID-19 Tweets [2.3940819037450987]
新型コロナウイルスは、世界的な公衆衛生問題や、経済危機、失業、精神的苦痛などの問題を引き起こしている。
このパンデミックは世界中で致命的であり、多くの人々が感染症だけでなく、問題、ストレス、不思議、恐怖、恨み、憎しみに悩まされている。
Twitterは、非常に影響力のあるソーシャルメディアプラットフォームであり、健康関連情報、ニュース、意見、世論などの重要な情報源である。
論文 参考訳(メタデータ) (2023-12-02T16:58:17Z) - EmoSet: A Large-scale Visual Emotion Dataset with Rich Attributes [53.95428298229396]
リッチ属性を付加した最初の大規模視覚感情データセットであるEmoSetを紹介する。
EmoSetは合計330万枚の画像で構成され、そのうち118,102枚は人間のアノテーションによって慎重にラベル付けされている。
心理学的な研究によって動機付けられ、感情のカテゴリに加えて、各画像には記述可能な感情特性のセットが注釈付けされている。
論文 参考訳(メタデータ) (2023-07-16T06:42:46Z) - ArPanEmo: An Open-Source Dataset for Fine-Grained Emotion Recognition in
Arabic Online Content during COVID-19 Pandemic [0.0]
本稿では,アラビア語におけるオンライン投稿の微粒な感情認識のための新しいデータセットであるArPanEmoデータセットを提案する。
データセットは、10の感情カテゴリまたは中立性のために手動でラベル付けされた11,128のオンライン投稿で構成されており、Fleissのカッパは0.71である。
特定のアラビア語方言をターゲットとし、新型コロナウイルス(COVID-19)のパンデミックに関連する話題に対処する。
論文 参考訳(メタデータ) (2023-05-27T21:04:26Z) - Why Do You Feel This Way? Summarizing Triggers of Emotions in Social
Media Posts [61.723046082145416]
CovidET (Emotions and their Triggers during Covid-19)は、COVID-19に関連する英国のReddit投稿1,900件のデータセットである。
我々は、感情を共同で検出し、感情のトリガーを要約する強力なベースラインを開発する。
分析の結果,コビデットは感情特異的要約における新たな課題と,長文のソーシャルメディア投稿におけるマルチ感情検出の課題が示唆された。
論文 参考訳(メタデータ) (2022-10-22T19:10:26Z) - Affection: Learning Affective Explanations for Real-World Visual Data [50.28825017427716]
我々は,85,007枚の公開画像に対して,感情反応と自由形式のテキスト説明を含む大規模データセットを研究コミュニティに導入し,共有する。
本研究は, 被写体集団に大きな支持を得て, 潜在的に有意な感情反応をとらえる上で, 重要な共通基盤があることを示唆する。
私たちの研究は、より豊かで、より人間中心で、感情に敏感な画像分析システムへの道を開くものです。
論文 参考訳(メタデータ) (2022-10-04T22:44:17Z) - Accurate Emotion Strength Assessment for Seen and Unseen Speech Based on
Data-Driven Deep Learning [70.30713251031052]
本研究では,データ駆動型深層学習モデル,すなわちSenseNetを提案する。
実験の結果,提案した強度ネットの予測感情強度は,目視と目視の両方の真理値と高い相関性を示した。
論文 参考訳(メタデータ) (2022-06-15T01:25:32Z) - Detecting Perceived Emotions in Hurricane Disasters [62.760131661847986]
私たちはHurricaneEmoを紹介します。HurricaneEmoは、Harvey、Irma、Mariaの3つのハリケーンにまたがる15,000の英語ツイートの感情データセットです。
本稿では, きめ細かい感情を包括的に研究し, 粗い感情群を識別するための分類タスクを提案する。
論文 参考訳(メタデータ) (2020-04-29T16:17:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。