論文の概要: ArCorona: Analyzing Arabic Tweets in the Early Days of Coronavirus
(COVID-19) Pandemic
- arxiv url: http://arxiv.org/abs/2012.01462v3
- Date: Mon, 1 Mar 2021 12:24:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-30 03:23:53.671079
- Title: ArCorona: Analyzing Arabic Tweets in the Early Days of Coronavirus
(COVID-19) Pandemic
- Title(参考訳): ArCorona:コロナウイルス(COVID-19)パンデミック初期のアラビア語ツイートの分析
- Authors: Hamdy Mubarak and Sabit Hassan
- Abstract要約: 我々は、新型コロナウイルスに関連するアラビア語のツイートを手動で注釈付けした最大のデータセットを提示する。
アノテーションガイドラインを記述し、データセットを分析し、効果的な機械学習とトランスフォーマーに基づく分類モデルを構築する。
- 参考スコア(独自算出の注目度): 3.057212947792573
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Over the past few months, there were huge numbers of circulating tweets and
discussions about Coronavirus (COVID-19) in the Arab region. It is important
for policy makers and many people to identify types of shared tweets to better
understand public behavior, topics of interest, requests from governments,
sources of tweets, etc. It is also crucial to prevent spreading of rumors and
misinformation about the virus or bad cures. To this end, we present the
largest manually annotated dataset of Arabic tweets related to COVID-19. We
describe annotation guidelines, analyze our dataset and build effective machine
learning and transformer based models for classification.
- Abstract(参考訳): 過去数ヶ月の間に、アラブ地域では大量のツイートやコロナウイルス(COVID-19)に関する議論があった。
政策立案者や多くの人々が、公開行動や関心事、政府からの要求、ツイートソースなどを理解するために、共有ツイートの種類を特定することが重要である。
また、ウイルスや悪い治療法に関する噂や誤報の拡散を防ぐことも重要である。
この目的のために、私たちは、covid-19に関連するアラビア語のつぶやきの、手作業による最大のデータセットを提示します。
アノテーションガイドラインを記述し、データセットを分析し、効果的な機械学習とトランスフォーマーに基づく分類モデルを構築する。
関連論文リスト
- "COVID-19 was a FIFA conspiracy #curropt": An Investigation into the
Viral Spread of COVID-19 Misinformation [60.268682953952506]
我々は、自然言語処理モデルを用いて、誤報がCOVID-19パンデミックの進行にどのような影響を及ぼしたかを推定する。
我々は、広範囲に害をもたらす可能性のあるソーシャルメディアポストと戦うための戦略を提供する。
論文 参考訳(メタデータ) (2022-06-12T19:41:01Z) - ArCovidVac: Analyzing Arabic Tweets About COVID-19 Vaccination [7.594204373985492]
新型コロナウイルス(COVID-19)予防接種キャンペーンのために、手動で注釈付けされた最初のアラビアのツイートデータセットArCovidVacをリリースしました。
データセットには、(i)Informativeness(より重要でないツイート)、(ii)きめ細かいツイートコンテンツタイプ(アドバイス、噂、制限、認証されたニュース/情報)、(iii)予防接種に対するスタンスなど、さまざまなアノテーション層が組み込まれている。
論文 参考訳(メタデータ) (2022-01-17T16:19:21Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - AraCOVID19-SSD: Arabic COVID-19 Sentiment and Sarcasm Detection Dataset [0.0]
本稿は、AraCOVID19-SSDに5,162ツイートを含む、手動でアノテートされたアラビア語 COVID-19 sarcasm と感情検出データセットを構築し、リリースする。
これらのユーザの多くは、自分の意図した意味をユーモラスで面白い間接的な方法で伝達するために、サルカズム(sarcasm)を使っている。
論文 参考訳(メタデータ) (2021-10-05T11:24:24Z) - CML-COVID: A Large-Scale COVID-19 Twitter Dataset with Latent Topics,
Sentiment and Location Information [0.0]
CML-COVID(CML-COVID)は、新型コロナウイルス(COVID-19)による5,977,653人のツイート19,298,967万件のTwitterデータセットである。
これらのツイートは、2020年3月から7月にかけて、新型コロナウイルスに関連する質問文、コビッド、マスクを使って収集された。
論文 参考訳(メタデータ) (2021-01-28T18:59:10Z) - Eating Garlic Prevents COVID-19 Infection: Detecting Misinformation on
the Arabic Content of Twitter [0.23624125155742054]
私たちは、covid-19の誤った情報に関連する大きなアラビア語データセットを構築し、そのツイートを2つのカテゴリに分類します。
単語埋め込みや単語頻度など、さまざまな機能を備えた8つの従来型および深層機械学習モデルを適用する。
実験では、曲線下の領域(AUC)を最適化することでモデルのパフォーマンスが向上し、Extreme Gradient Boosting(XGBoost)は、オンラインでCOVID-19の誤情報を検出する最高精度を示します。
論文 参考訳(メタデータ) (2021-01-09T22:52:21Z) - Understanding the Hoarding Behaviors during the COVID-19 Pandemic using
Large Scale Social Media Data [77.34726150561087]
われわれは、2020年3月1日から4月30日まで、米国で4万2000人以上のユニークTwitterユーザーによる嫌がらせと反嫌悪のパターンを分析した。
ホアーディンググループと反ホアーディンググループの両方の女性の比率が、一般のTwitter利用者の比率よりも高いことがわかりました。
LIWCの不安度はTwitterの不安度よりもかなり高い。
論文 参考訳(メタデータ) (2020-10-15T16:02:25Z) - A System for Worldwide COVID-19 Information Aggregation [92.60866520230803]
我々は、トピックによって分類された7言語10の地域から信頼できる記事を含む世界的な新型コロナウイルス情報収集システムを構築した。
ニューラルマシン翻訳モジュールは、他言語の論文を日本語と英語に翻訳する。
記事とトピックのペアデータセットに基づいてトレーニングされたBERTベースのトピック分類器は、ユーザが興味のある情報を効率的に見つけるのに役立つ。
論文 参考訳(メタデータ) (2020-07-28T01:33:54Z) - TICO-19: the Translation Initiative for Covid-19 [112.5601530395345]
COvid-19の翻訳イニシアチブ(TICO-19)は、テストおよび開発データを、35の異なる言語でAIおよびMT研究者に提供した。
同じデータが表現されているすべての言語に変換されるため、テストや開発は、セット内の任意の言語のペアリングに対して行うことができる。
論文 参考訳(メタデータ) (2020-07-03T16:26:17Z) - Cross-lingual Transfer Learning for COVID-19 Outbreak Alignment [90.12602012910465]
われわれは、Twitterを通じてイタリアの新型コロナウイルス感染症(COVID-19)の早期流行を訓練し、他のいくつかの国に移る。
実験の結果,クロスカントリー予測において最大0.85のスピアマン相関が得られた。
論文 参考訳(メタデータ) (2020-06-05T02:04:25Z) - Large Arabic Twitter Dataset on COVID-19 [0.7734726150561088]
2019年12月下旬に中国で発生した新型コロナウイルス(COVID-19)は、今や世界中で急速に普及している。
全世界で確認された感染者は200万人を超え、死者は180,000人を超えている。
この研究は、2020年1月1日以来、私たちが収集してきた新型コロナウイルスに関する最初のアラビア語のつぶやきデータセットについて述べています。
論文 参考訳(メタデータ) (2020-04-09T01:07:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。