論文の概要: CML-COVID: A Large-Scale COVID-19 Twitter Dataset with Latent Topics,
Sentiment and Location Information
- arxiv url: http://arxiv.org/abs/2101.12202v1
- Date: Thu, 28 Jan 2021 18:59:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-13 11:19:40.494850
- Title: CML-COVID: A Large-Scale COVID-19 Twitter Dataset with Latent Topics,
Sentiment and Location Information
- Title(参考訳): CML-COVID: トピック、センチメント、位置情報を備えた大規模COVID-19 Twitterデータセット
- Authors: Hassan Dashtian, Dhiraj Murthy
- Abstract要約: CML-COVID(CML-COVID)は、新型コロナウイルス(COVID-19)による5,977,653人のツイート19,298,967万件のTwitterデータセットである。
これらのツイートは、2020年3月から7月にかけて、新型コロナウイルスに関連する質問文、コビッド、マスクを使って収集された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As a platform, Twitter has been a significant public space for discussion
related to the COVID-19 pandemic. Public social media platforms such as Twitter
represent important sites of engagement regarding the pandemic and these data
can be used by research teams for social, health, and other research.
Understanding public opinion about COVID-19 and how information diffuses in
social media is important for governments and research institutions. Twitter is
a ubiquitous public platform and, as such, has tremendous utility for
understanding public perceptions, behavior, and attitudes related to COVID-19.
In this research, we present CML-COVID, a COVID-19 Twitter data set of
19,298,967 million tweets from 5,977,653 unique individuals and summarize some
of the attributes of these data. These tweets were collected between March 2020
and July 2020 using the query terms coronavirus, covid and mask related to
COVID-19. We use topic modeling, sentiment analysis, and descriptive statistics
to describe the tweets related to COVID-19 we collected and the geographical
location of tweets, where available. We provide information on how to access
our tweet dataset (archived using twarc).
- Abstract(参考訳): プラットフォームとしてTwitterは、新型コロナウイルス(COVID-19)パンデミックに関する議論のための重要な公共空間となっている。
Twitterのような公共ソーシャルメディアプラットフォームは、パンデミックに関する重要なエンゲージメントの場所であり、これらのデータは研究チームによって社会、健康、その他の研究に利用することができる。
新型コロナウイルスに関する世論とソーシャルメディアにおける情報拡散の理解は、政府や研究機関にとって重要である。
Twitterはユビキタスな公共プラットフォームであり、COVID-19に関連する大衆の認識、行動、態度を理解するのに非常に便利だ。
本研究では,5,977,653人の独特な個人による19,298,967万ツイートのcml-covid(cml-covid)と,それらの属性を要約した。
これらのツイートは、2020年3月から7月にかけて、新型コロナウイルスに関連する質問文、コビッド、マスクを使って収集された。
トピックモデリング、感情分析、記述統計を用いて、私たちが収集した新型コロナウイルスに関連するツイートと、利用可能なツイートの地理的位置を記述します。
ツイートデータセット(twarcを使って構築された)へのアクセス方法に関する情報を提供する。
関連論文リスト
- Just Another Day on Twitter: A Complete 24 Hours of Twitter Data [39.98744837726886]
われわれは2022年9月21日から24時間以内に3億7500万件のツイートを収集した。
これは、研究コミュニティで利用可能な24時間Twitterデータセットの最初のものである。
論文 参考訳(メタデータ) (2023-01-26T21:28:40Z) - METS-CoV: A Dataset of Medical Entity and Targeted Sentiment on COVID-19
Related Tweets [13.35986397208115]
本稿では、医療機関と新型コロナウイルス関連ツイートのターゲット感情を含むデータセットであるMETS-CoVをリリースする。
私たちの知る限りでは、METS-CoVは、新型コロナウイルス関連ツイートの医療機関とそれに対応する感情を収集する最初のデータセットです。
論文 参考訳(メタデータ) (2022-09-28T01:55:14Z) - "COVID-19 was a FIFA conspiracy #curropt": An Investigation into the
Viral Spread of COVID-19 Misinformation [60.268682953952506]
我々は、自然言語処理モデルを用いて、誤報がCOVID-19パンデミックの進行にどのような影響を及ぼしたかを推定する。
我々は、広範囲に害をもたらす可能性のあるソーシャルメディアポストと戦うための戦略を提供する。
論文 参考訳(メタデータ) (2022-06-12T19:41:01Z) - Twitter Dataset on the Russo-Ukrainian War [68.713984286035]
Twitter APIから現在進行中のデータセットの取得を開始しています。
データセットは770万人のユーザーを起源とする5730万ツイートに達している。
我々は、最初のボリュームと感情分析を適用し、データセットはトピック分析、ヘイトスピーチ、プロパガンダ認識、ボットネットのような潜在的な悪意のあるエンティティを示すためにさらに探索的な調査に使用することができる。
論文 参考訳(メタデータ) (2022-04-07T12:33:06Z) - Extracting Feelings of People Regarding COVID-19 by Social Network
Mining [0.0]
英語における新型コロナウイルス関連ツイートのデータセットが収集される。
2020年3月23日から6月23日までに200万件以上のツイートが分析されている。
論文 参考訳(メタデータ) (2021-10-12T16:45:33Z) - ArCOV19-Rumors: Arabic COVID-19 Twitter Dataset for Misinformation
Detection [6.688963029270579]
ArCOV19-Rumorsは、1月27日から2020年4月末までのクレームを含むツイートからなる誤情報検出のためのアラビア語のTwitterデータセットである。
本誌は138件の確認済みのクレームを、主に人気ファクトチェックサイトから収集し、それらのクレームに関連する9.4万件のツイートを特定した。
ツイートは、パンデミックで直面した主要な問題の一つである誤情報検出の研究を支援するために、正確さで手動で注釈付けされた。
論文 参考訳(メタデータ) (2020-10-17T11:21:40Z) - Understanding the Hoarding Behaviors during the COVID-19 Pandemic using
Large Scale Social Media Data [77.34726150561087]
われわれは、2020年3月1日から4月30日まで、米国で4万2000人以上のユニークTwitterユーザーによる嫌がらせと反嫌悪のパターンを分析した。
ホアーディンググループと反ホアーディンググループの両方の女性の比率が、一般のTwitter利用者の比率よりも高いことがわかりました。
LIWCの不安度はTwitterの不安度よりもかなり高い。
論文 参考訳(メタデータ) (2020-10-15T16:02:25Z) - Privacy-Aware Recommender Systems Challenge on Twitter's Home Timeline [47.434392695347924]
ACM RecSysが主催するRecSys 2020 Challengeは、このデータセットを使用してTwitterと提携している。
本稿では,ユーザエンゲージメントを予測しようとする研究者や専門家が直面する課題について述べる。
論文 参考訳(メタデータ) (2020-04-28T23:54:33Z) - The Ivory Tower Lost: How College Students Respond Differently than the
General Public to the COVID-19 Pandemic [66.80677233314002]
新型コロナウイルス感染症(COVID-19)のパンデミックは、政府に究極の課題を提示した。
米国では、新型コロナウイルス感染者が最も多い国で、全国的なソーシャルディスタンシングプロトコルが大統領によって実施されている。
本稿では,この対話型社会における前例のない破壊の社会的意義を,ソーシャルメディア上での人々の意見のマイニングによって発見することを目的とする。
論文 参考訳(メタデータ) (2020-04-21T13:02:38Z) - ArCOV-19: The First Arabic COVID-19 Twitter Dataset with Propagation
Networks [6.688963029270579]
ArCOV-19は、新型コロナウイルスのパンデミックをカバーする最初のアラビア語のTwitterデータセットである。
約270万のツイートと、最も人気のあるサブセットの伝播ネットワークが含まれている。
論文 参考訳(メタデータ) (2020-04-13T10:49:53Z) - COVID-19 on Social Media: Analyzing Misinformation in Twitter
Conversations [22.43295864610142]
私たちは、2020年3月1日からTwitter APIを使用して、COVID-19に関連するストリーミングデータを収集しました。
事実確認情報をもとに、信頼できない内容と誤解を招く内容を特定した。
偽情報ツイートで宣伝された物語と、これらのツイートとのエンゲージメントの分配について検討した。
論文 参考訳(メタデータ) (2020-03-26T09:48:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。