論文の概要: GeoCoV19: A Dataset of Hundreds of Millions of Multilingual COVID-19
Tweets with Location Information
- arxiv url: http://arxiv.org/abs/2005.11177v1
- Date: Fri, 22 May 2020 13:30:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 09:33:57.422933
- Title: GeoCoV19: A Dataset of Hundreds of Millions of Multilingual COVID-19
Tweets with Location Information
- Title(参考訳): GeoCoV19: 位置情報付き多言語COVID-19ツイート数十万件のデータセット
- Authors: Umair Qazi, Muhammad Imran, Ferda Ofli
- Abstract要約: GeoCoV19は、2020年2月1日から90日間に5億2400万件の多言語ツイートが投稿された大規模なTwitterデータセットです。
我々は、この大規模かつ多言語で位置決めされたソーシャルメディアデータは、この前例のない世界的な危機に社会がどう対処しているかを評価する研究コミュニティに力を与えることができると仮定する。
- 参考スコア(独自算出の注目度): 4.541389211258011
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The past several years have witnessed a huge surge in the use of social media
platforms during mass convergence events such as health emergencies, natural or
human-induced disasters. These non-traditional data sources are becoming vital
for disease forecasts and surveillance when preparing for epidemic and pandemic
outbreaks. In this paper, we present GeoCoV19, a large-scale Twitter dataset
containing more than 524 million multilingual tweets posted over a period of 90
days since February 1, 2020. Moreover, we employ a gazetteer-based approach to
infer the geolocation of tweets. We postulate that this large-scale,
multilingual, geolocated social media data can empower the research communities
to evaluate how societies are collectively coping with this unprecedented
global crisis as well as to develop computational methods to address challenges
such as identifying fake news, understanding communities' knowledge gaps,
building disease forecast and surveillance models, among others.
- Abstract(参考訳): 過去数年間、健康危機や自然災害や人的災害といった大規模な収束イベントにおいて、ソーシャルメディアプラットフォームの利用が急増している。
これらの非伝統的なデータソースは、伝染病やパンデミックの流行に備える上で、疾病の予測や監視に不可欠になりつつある。
本稿では,2020年2月1日から90日間に5億2400万件の多言語ツイートが投稿された大規模TwitterデータセットGeoCoV19を紹介する。
さらに、ツイートの位置を推測するために、ガゼッタに基づくアプローチを用いる。
我々は,この大規模かつ多言語で位置決めされたソーシャルメディアデータによって,この前例のない世界的な危機に社会がどう対処しているのかを研究コミュニティに評価し,フェイクニュースの特定,コミュニティの知識ギャップの理解,疾患予測や監視モデルの構築といった課題に対処するための計算手法を開発することができると仮定した。
関連論文リスト
- CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - Sarcasm Detection in a Disaster Context [103.93691731605163]
HurricaneSARCは,意図した皮肉に注釈を付けた15,000ツイートのデータセットである。
私たちの最高のモデルは、データセットで最大0.70F1を得ることができます。
論文 参考訳(メタデータ) (2023-08-16T05:58:12Z) - Twitter conversations predict the daily confirmed COVID-19 cases [0.2320417845168326]
パンデミック特有の談話は、TwitterやWeiboのようなマイクロブログプラットフォーム上では、今も続いている。
本稿では、新型コロナウイルス関連Twitter会話から複数の時系列を設計するための感情関連トピックベースの方法論を提案する。
モデリングにソーシャルメディア変数を組み込むことで、RMSEのベースラインモデルよりも48.83-51.38%の改善がもたらされることが示されている。
論文 参考訳(メタデータ) (2022-06-21T15:31:06Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - TBCOV: Two Billion Multilingual COVID-19 Tweets with Sentiment, Entity,
Geo, and Gender Labels [5.267993069044648]
この研究は、新型コロナウイルス(COVID-19)のパンデミックに関連する20億以上の多言語ツイートを1年以上にわたって収集した大規模なTwitterデータセットTBCOVを提示する。
いくつかの最先端のディープラーニングモデルは、感情ラベル、名前付きエンティティ、人物の言及、組織、場所、ユーザータイプ、性別情報など、重要な属性でデータを強化するために使用される。
我々の感情と傾向分析は興味深い洞察を示し、TBCOVが重要なトピックを幅広くカバーしていることを確認する。
論文 参考訳(メタデータ) (2021-10-04T06:17:12Z) - Changes in European Solidarity Before and During COVID-19: Evidence from
a Large Crowd- and Expert-Annotated Twitter Dataset [77.27709662210363]
我々は,NLPにおける教師付き機械学習の新たな課題として,社会的連帯という社会科学的概念とその競争,反連帯の概念を導入する。
我々は,複数のアノテータと2つのアノテーションアプローチ(専門家対群衆)を利用して,(反)整合性表現のための2.3kの英語とドイツ語のつぶやきを注釈する。
今回の結果は、新型コロナウイルス危機で連帯がますます健全になり、競争が激化したことを示している。
論文 参考訳(メタデータ) (2021-08-02T17:03:12Z) - COVID-19 and Big Data: Multi-faceted Analysis for Spatio-temporal
Understanding of the Pandemic with Social Media Conversations [4.07452542897703]
ソーシャルメディアプラットフォームは、新型コロナウイルス(COVID-19)に関する世界的な会話の手段として機能している。
本稿では,パンデミックを取り巻くソーシャルメディア会話の重要コンテンツと特徴の分析,マイニング,追跡のための枠組みを提案する。
論文 参考訳(メタデータ) (2021-04-22T00:45:50Z) - Cross-lingual Transfer Learning for COVID-19 Outbreak Alignment [90.12602012910465]
われわれは、Twitterを通じてイタリアの新型コロナウイルス感染症(COVID-19)の早期流行を訓練し、他のいくつかの国に移る。
実験の結果,クロスカントリー予測において最大0.85のスピアマン相関が得られた。
論文 参考訳(メタデータ) (2020-06-05T02:04:25Z) - Critical Impact of Social Networks Infodemic on Defeating Coronavirus
COVID-19 Pandemic: Twitter-Based Study and Research Directions [1.6571886312953874]
2019年の推計295億人が世界中でソーシャルメディアを利用している。
コロナウイルスの流行は、ソーシャルメディアの津波を引き起こした。
本稿では,Twitterから収集したデータに基づく大規模研究について述べる。
論文 参考訳(メタデータ) (2020-05-18T15:53:13Z) - COVI White Paper [67.04578448931741]
接触追跡は、新型コロナウイルスのパンデミックの進行を変える上で不可欠なツールだ。
カナダで開発されたCovid-19の公衆ピアツーピア接触追跡とリスク認識モバイルアプリケーションであるCOVIの理論的、設計、倫理的考察、プライバシ戦略について概説する。
論文 参考訳(メタデータ) (2020-05-18T07:40:49Z) - Large Arabic Twitter Dataset on COVID-19 [0.7734726150561088]
2019年12月下旬に中国で発生した新型コロナウイルス(COVID-19)は、今や世界中で急速に普及している。
全世界で確認された感染者は200万人を超え、死者は180,000人を超えている。
この研究は、2020年1月1日以来、私たちが収集してきた新型コロナウイルスに関する最初のアラビア語のつぶやきデータセットについて述べています。
論文 参考訳(メタデータ) (2020-04-09T01:07:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。