論文の概要: ArCOV-19: The First Arabic COVID-19 Twitter Dataset with Propagation
Networks
- arxiv url: http://arxiv.org/abs/2004.05861v4
- Date: Sat, 13 Mar 2021 23:14:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 00:18:29.400346
- Title: ArCOV-19: The First Arabic COVID-19 Twitter Dataset with Propagation
Networks
- Title(参考訳): ArCOV-19: プロパゲーションネットワークを備えた最初のアラビアのCOVID-19 Twitterデータセット
- Authors: Fatima Haouari, Maram Hasanain, Reem Suwaileh, Tamer Elsayed
- Abstract要約: ArCOV-19は、新型コロナウイルスのパンデミックをカバーする最初のアラビア語のTwitterデータセットである。
約270万のツイートと、最も人気のあるサブセットの伝播ネットワークが含まれている。
- 参考スコア(独自算出の注目度): 6.688963029270579
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present ArCOV-19, an Arabic COVID-19 Twitter dataset that
spans one year, covering the period from 27th of January 2020 till 31st of
January 2021. ArCOV-19 is the first publicly-available Arabic Twitter dataset
covering COVID-19 pandemic that includes about 2.7M tweets alongside the
propagation networks of the most-popular subset of them (i.e., most-retweeted
and -liked). The propagation networks include both retweets and conversational
threads (i.e., threads of replies). ArCOV-19 is designed to enable research
under several domains including natural language processing, information
retrieval, and social computing. Preliminary analysis shows that ArCOV-19
captures rising discussions associated with the first reported cases of the
disease as they appeared in the Arab world. In addition to the source tweets
and propagation networks, we also release the search queries and
language-independent crawler used to collect the tweets to encourage the
curation of similar datasets.
- Abstract(参考訳): 本稿では、2020年1月27日から2021年1月31日までの期間をカバーする、アラビア語のcovid-19twitterデータセットarcov-19を提案する。
arcov-19は、新型コロナウイルス(covid-19)のパンデミックをカバーする、初めて一般公開されたアラビア語のtwitterデータセットである。
伝搬ネットワークにはリツイートと会話スレッド(つまり返信のスレッド)の両方が含まれている。
ArCOV-19は自然言語処理、情報検索、ソーシャルコンピューティングなど、いくつかの分野における研究を可能にするように設計されている。
予備分析の結果、ArCOV-19はアラブ世界で初めて報告された疾患に関する議論の高まりを捉えている。
ソースのつぶやきや伝播ネットワークに加えて、類似したデータセットのキュレーションを促進するためにツイートを収集するために使用される検索クエリや言語に依存しないクローラもリリースします。
関連論文リスト
- "COVID-19 was a FIFA conspiracy #curropt": An Investigation into the
Viral Spread of COVID-19 Misinformation [60.268682953952506]
我々は、自然言語処理モデルを用いて、誤報がCOVID-19パンデミックの進行にどのような影響を及ぼしたかを推定する。
我々は、広範囲に害をもたらす可能性のあるソーシャルメディアポストと戦うための戦略を提供する。
論文 参考訳(メタデータ) (2022-06-12T19:41:01Z) - Twitter Dataset on the Russo-Ukrainian War [68.713984286035]
Twitter APIから現在進行中のデータセットの取得を開始しています。
データセットは770万人のユーザーを起源とする5730万ツイートに達している。
我々は、最初のボリュームと感情分析を適用し、データセットはトピック分析、ヘイトスピーチ、プロパガンダ認識、ボットネットのような潜在的な悪意のあるエンティティを示すためにさらに探索的な調査に使用することができる。
論文 参考訳(メタデータ) (2022-04-07T12:33:06Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - Extracting Feelings of People Regarding COVID-19 by Social Network
Mining [0.0]
英語における新型コロナウイルス関連ツイートのデータセットが収集される。
2020年3月23日から6月23日までに200万件以上のツイートが分析されている。
論文 参考訳(メタデータ) (2021-10-12T16:45:33Z) - Evaluating the COVID-19 Identification ResNet (CIdeR) on the INTERSPEECH
COVID-19 from Audio Challenges [59.78485839636553]
CIdeRはエンド・ツー・エンドのディープラーニング・ニューラルネットワークで、個人が新型コロナウイルス陽性か新型コロナウイルス陰性かを分類するために設計された。
COVID-19 CoughとInterSPEECH 2021, ComParE, DiCOVAの両者によるCIdeRのバイナリ診断の可能性を示した。
論文 参考訳(メタデータ) (2021-07-30T10:59:08Z) - CML-COVID: A Large-Scale COVID-19 Twitter Dataset with Latent Topics,
Sentiment and Location Information [0.0]
CML-COVID(CML-COVID)は、新型コロナウイルス(COVID-19)による5,977,653人のツイート19,298,967万件のTwitterデータセットである。
これらのツイートは、2020年3月から7月にかけて、新型コロナウイルスに関連する質問文、コビッド、マスクを使って収集された。
論文 参考訳(メタデータ) (2021-01-28T18:59:10Z) - ArCorona: Analyzing Arabic Tweets in the Early Days of Coronavirus
(COVID-19) Pandemic [3.057212947792573]
我々は、新型コロナウイルスに関連するアラビア語のツイートを手動で注釈付けした最大のデータセットを提示する。
アノテーションガイドラインを記述し、データセットを分析し、効果的な機械学習とトランスフォーマーに基づく分類モデルを構築する。
論文 参考訳(メタデータ) (2020-12-02T19:05:25Z) - ArCOV19-Rumors: Arabic COVID-19 Twitter Dataset for Misinformation
Detection [6.688963029270579]
ArCOV19-Rumorsは、1月27日から2020年4月末までのクレームを含むツイートからなる誤情報検出のためのアラビア語のTwitterデータセットである。
本誌は138件の確認済みのクレームを、主に人気ファクトチェックサイトから収集し、それらのクレームに関連する9.4万件のツイートを特定した。
ツイートは、パンデミックで直面した主要な問題の一つである誤情報検出の研究を支援するために、正確さで手動で注釈付けされた。
論文 参考訳(メタデータ) (2020-10-17T11:21:40Z) - TICO-19: the Translation Initiative for Covid-19 [112.5601530395345]
COvid-19の翻訳イニシアチブ(TICO-19)は、テストおよび開発データを、35の異なる言語でAIおよびMT研究者に提供した。
同じデータが表現されているすべての言語に変換されるため、テストや開発は、セット内の任意の言語のペアリングに対して行うことができる。
論文 参考訳(メタデータ) (2020-07-03T16:26:17Z) - CO-Search: COVID-19 Information Retrieval with Semantic Search, Question
Answering, and Abstractive Summarization [53.67205506042232]
CO-Searchは、新型コロナウイルスの文献上の複雑なクエリを処理するように設計された、レトリバーランサーセマンティック検索エンジンである。
ドメイン固有の比較的限られたデータセットを考慮し、文書の段落と引用の2部グラフを生成する。
TREC-COVID情報検索課題のデータに基づいて,本システムの評価を行った。
論文 参考訳(メタデータ) (2020-06-17T01:32:48Z) - COVID-19 on Social Media: Analyzing Misinformation in Twitter
Conversations [22.43295864610142]
私たちは、2020年3月1日からTwitter APIを使用して、COVID-19に関連するストリーミングデータを収集しました。
事実確認情報をもとに、信頼できない内容と誤解を招く内容を特定した。
偽情報ツイートで宣伝された物語と、これらのツイートとのエンゲージメントの分配について検討した。
論文 参考訳(メタデータ) (2020-03-26T09:48:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。