論文の概要: GeoCoV19: A Dataset of Hundreds of Millions of Multilingual COVID-19
Tweets with Location Information
- arxiv url: http://arxiv.org/abs/2005.11177v1
- Date: Fri, 22 May 2020 13:30:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 09:33:57.422933
- Title: GeoCoV19: A Dataset of Hundreds of Millions of Multilingual COVID-19
Tweets with Location Information
- Title(参考訳): GeoCoV19: 位置情報付き多言語COVID-19ツイート数十万件のデータセット
- Authors: Umair Qazi, Muhammad Imran, Ferda Ofli
- Abstract要約: GeoCoV19は、2020年2月1日から90日間に5億2400万件の多言語ツイートが投稿された大規模なTwitterデータセットです。
我々は、この大規模かつ多言語で位置決めされたソーシャルメディアデータは、この前例のない世界的な危機に社会がどう対処しているかを評価する研究コミュニティに力を与えることができると仮定する。
- 参考スコア(独自算出の注目度): 4.541389211258011
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The past several years have witnessed a huge surge in the use of social media
platforms during mass convergence events such as health emergencies, natural or
human-induced disasters. These non-traditional data sources are becoming vital
for disease forecasts and surveillance when preparing for epidemic and pandemic
outbreaks. In this paper, we present GeoCoV19, a large-scale Twitter dataset
containing more than 524 million multilingual tweets posted over a period of 90
days since February 1, 2020. Moreover, we employ a gazetteer-based approach to
infer the geolocation of tweets. We postulate that this large-scale,
multilingual, geolocated social media data can empower the research communities
to evaluate how societies are collectively coping with this unprecedented
global crisis as well as to develop computational methods to address challenges
such as identifying fake news, understanding communities' knowledge gaps,
building disease forecast and surveillance models, among others.
- Abstract(参考訳): 過去数年間、健康危機や自然災害や人的災害といった大規模な収束イベントにおいて、ソーシャルメディアプラットフォームの利用が急増している。
これらの非伝統的なデータソースは、伝染病やパンデミックの流行に備える上で、疾病の予測や監視に不可欠になりつつある。
本稿では,2020年2月1日から90日間に5億2400万件の多言語ツイートが投稿された大規模TwitterデータセットGeoCoV19を紹介する。
さらに、ツイートの位置を推測するために、ガゼッタに基づくアプローチを用いる。
我々は,この大規模かつ多言語で位置決めされたソーシャルメディアデータによって,この前例のない世界的な危機に社会がどう対処しているのかを研究コミュニティに評価し,フェイクニュースの特定,コミュニティの知識ギャップの理解,疾患予測や監視モデルの構築といった課題に対処するための計算手法を開発することができると仮定した。
関連論文リスト
- SPEED++: A Multilingual Event Extraction Framework for Epidemic Prediction and Preparedness [73.73883111570458]
多様な疾患や言語に対する流行イベント情報を抽出する,最初の多言語イベント抽出フレームワークを提案する。
各言語でデータに注釈を付けることは不可能であり、ゼロショット・クロスランガル・クロス・ディスリーズ・モデルを開発する。
われわれのフレームワークは、2019年12月初旬に中国のWeiboポストから、中国でのトレーニングなしに、新型コロナウイルスの流行を警告することができる。
論文 参考訳(メタデータ) (2024-10-24T03:03:54Z) - Event Detection from Social Media for Epidemic Prediction [76.90779562626541]
ソーシャルメディア投稿から疫病関連事象を抽出・分析する枠組みを構築した。
実験では、新型コロナウイルスベースのSPEEDで訓練されたEDモデルが、3つの目に見えない流行の流行を効果的に検出する方法が明らかにされている。
モンキーポックスのWHO流行宣言より4~9週間早く,抽出した事象の報告が急激な増加を示すことを示す。
論文 参考訳(メタデータ) (2024-04-02T06:31:17Z) - CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - Twitter conversations predict the daily confirmed COVID-19 cases [0.2320417845168326]
パンデミック特有の談話は、TwitterやWeiboのようなマイクロブログプラットフォーム上では、今も続いている。
本稿では、新型コロナウイルス関連Twitter会話から複数の時系列を設計するための感情関連トピックベースの方法論を提案する。
モデリングにソーシャルメディア変数を組み込むことで、RMSEのベースラインモデルよりも48.83-51.38%の改善がもたらされることが示されている。
論文 参考訳(メタデータ) (2022-06-21T15:31:06Z) - TBCOV: Two Billion Multilingual COVID-19 Tweets with Sentiment, Entity,
Geo, and Gender Labels [5.267993069044648]
この研究は、新型コロナウイルス(COVID-19)のパンデミックに関連する20億以上の多言語ツイートを1年以上にわたって収集した大規模なTwitterデータセットTBCOVを提示する。
いくつかの最先端のディープラーニングモデルは、感情ラベル、名前付きエンティティ、人物の言及、組織、場所、ユーザータイプ、性別情報など、重要な属性でデータを強化するために使用される。
我々の感情と傾向分析は興味深い洞察を示し、TBCOVが重要なトピックを幅広くカバーしていることを確認する。
論文 参考訳(メタデータ) (2021-10-04T06:17:12Z) - Changes in European Solidarity Before and During COVID-19: Evidence from
a Large Crowd- and Expert-Annotated Twitter Dataset [77.27709662210363]
我々は,NLPにおける教師付き機械学習の新たな課題として,社会的連帯という社会科学的概念とその競争,反連帯の概念を導入する。
我々は,複数のアノテータと2つのアノテーションアプローチ(専門家対群衆)を利用して,(反)整合性表現のための2.3kの英語とドイツ語のつぶやきを注釈する。
今回の結果は、新型コロナウイルス危機で連帯がますます健全になり、競争が激化したことを示している。
論文 参考訳(メタデータ) (2021-08-02T17:03:12Z) - COVID-19 and Big Data: Multi-faceted Analysis for Spatio-temporal
Understanding of the Pandemic with Social Media Conversations [4.07452542897703]
ソーシャルメディアプラットフォームは、新型コロナウイルス(COVID-19)に関する世界的な会話の手段として機能している。
本稿では,パンデミックを取り巻くソーシャルメディア会話の重要コンテンツと特徴の分析,マイニング,追跡のための枠組みを提案する。
論文 参考訳(メタデータ) (2021-04-22T00:45:50Z) - Cross-lingual Transfer Learning for COVID-19 Outbreak Alignment [90.12602012910465]
われわれは、Twitterを通じてイタリアの新型コロナウイルス感染症(COVID-19)の早期流行を訓練し、他のいくつかの国に移る。
実験の結果,クロスカントリー予測において最大0.85のスピアマン相関が得られた。
論文 参考訳(メタデータ) (2020-06-05T02:04:25Z) - Critical Impact of Social Networks Infodemic on Defeating Coronavirus
COVID-19 Pandemic: Twitter-Based Study and Research Directions [1.6571886312953874]
2019年の推計295億人が世界中でソーシャルメディアを利用している。
コロナウイルスの流行は、ソーシャルメディアの津波を引き起こした。
本稿では,Twitterから収集したデータに基づく大規模研究について述べる。
論文 参考訳(メタデータ) (2020-05-18T15:53:13Z) - COVI White Paper [67.04578448931741]
接触追跡は、新型コロナウイルスのパンデミックの進行を変える上で不可欠なツールだ。
カナダで開発されたCovid-19の公衆ピアツーピア接触追跡とリスク認識モバイルアプリケーションであるCOVIの理論的、設計、倫理的考察、プライバシ戦略について概説する。
論文 参考訳(メタデータ) (2020-05-18T07:40:49Z) - Large Arabic Twitter Dataset on COVID-19 [0.7734726150561088]
2019年12月下旬に中国で発生した新型コロナウイルス(COVID-19)は、今や世界中で急速に普及している。
全世界で確認された感染者は200万人を超え、死者は180,000人を超えている。
この研究は、2020年1月1日以来、私たちが収集してきた新型コロナウイルスに関する最初のアラビア語のつぶやきデータセットについて述べています。
論文 参考訳(メタデータ) (2020-04-09T01:07:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。