論文の概要: MM-COVID: A Multilingual and Multimodal Data Repository for Combating
COVID-19 Disinformation
- arxiv url: http://arxiv.org/abs/2011.04088v2
- Date: Mon, 23 Nov 2020 06:04:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-24 23:20:30.401427
- Title: MM-COVID: A Multilingual and Multimodal Data Repository for Combating
COVID-19 Disinformation
- Title(参考訳): mm-covid: 新型コロナウイルスの偽情報に対処するための多言語およびマルチモーダルデータリポジトリ
- Authors: Yichuan Li, Bohan Jiang, Kai Shu, Huan Liu
- Abstract要約: このデータセットは、多言語フェイクニュースと関連する社会的コンテキストを提供する。
偽ニュースコンテンツ3981点と、英語、スペイン語、ポルトガル語、ヒンディー語、フランス語、イタリア語の信頼に値する情報7192点を収集します。
- 参考スコア(独自算出の注目度): 37.52398946169075
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The COVID-19 epidemic is considered as the global health crisis of the whole
society and the greatest challenge mankind faced since World War Two.
Unfortunately, the fake news about COVID-19 is spreading as fast as the virus
itself. The incorrect health measurements, anxiety, and hate speeches will have
bad consequences on people's physical health, as well as their mental health in
the whole world. To help better combat the COVID-19 fake news, we propose a new
fake news detection dataset MM-COVID(Multilingual and Multidimensional COVID-19
Fake News Data Repository). This dataset provides the multilingual fake news
and the relevant social context. We collect 3981 pieces of fake news content
and 7192 trustworthy information from English, Spanish, Portuguese, Hindi,
French and Italian, 6 different languages. We present a detailed and
exploratory analysis of MM-COVID from different perspectives and demonstrate
the utility of MM-COVID in several potential applications of COVID-19 fake news
study on multilingual and social media.
- Abstract(参考訳): 新型コロナウイルスの流行は、社会全体の世界的な健康危機であり、第2次世界大戦以来最大の課題だと考えられている。
残念ながら、新型コロナウイルスに関するフェイクニュースは、ウイルスそのものと同じくらい急速に広まっている。
不正確な健康測定、不安、ヘイトスピーチは、人々の身体的健康と世界中の精神的な健康に悪影響を及ぼす。
新型の偽ニュース検出データセットMM-COVID(Multilingual and Multidimensional COVID-19 Fake News Data Repository)を提案する。
このデータセットは、多言語フェイクニュースと関連する社会的コンテキストを提供する。
偽ニュースコンテンツ3981点と、英語、スペイン語、ポルトガル語、ヒンディー語、フランス語、イタリア語の信頼に値する情報7192点を収集します。
異なる視点からMM-COVIDの詳細な探索分析を行い、多言語およびソーシャルメディアにおける偽ニュース研究の潜在的な応用としてMM-COVIDの有用性を実証する。
関連論文リスト
- "COVID-19 was a FIFA conspiracy #curropt": An Investigation into the
Viral Spread of COVID-19 Misinformation [60.268682953952506]
我々は、自然言語処理モデルを用いて、誤報がCOVID-19パンデミックの進行にどのような影響を及ぼしたかを推定する。
我々は、広範囲に害をもたらす可能性のあるソーシャルメディアポストと戦うための戦略を提供する。
論文 参考訳(メタデータ) (2022-06-12T19:41:01Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - COVID-19 and Big Data: Multi-faceted Analysis for Spatio-temporal
Understanding of the Pandemic with Social Media Conversations [4.07452542897703]
ソーシャルメディアプラットフォームは、新型コロナウイルス(COVID-19)に関する世界的な会話の手段として機能している。
本稿では,パンデミックを取り巻くソーシャルメディア会話の重要コンテンツと特徴の分析,マイニング,追跡のための枠組みを提案する。
論文 参考訳(メタデータ) (2021-04-22T00:45:50Z) - Transformer based Automatic COVID-19 Fake News Detection System [9.23545668304066]
新型コロナウイルス(COVID-19)のパンデミックでは、誤報が特に多い。
新型コロナウイルスのパンデミックに関するソーシャルメディア上で共有される情報の信頼性を分析する手法を報告する。
テストセットでは0.9855 f1スコアを獲得し,160チーム中5位にランクインした。
論文 参考訳(メタデータ) (2021-01-01T06:49:27Z) - A Multilingual Neural Machine Translation Model for Biomedical Data [84.17747489525794]
生物医学領域におけるテキストの翻訳に使用できる多言語ニューラルマシン翻訳モデルをリリースする。
このモデルは5つの言語(フランス語、ドイツ語、イタリア語、韓国語、スペイン語)から英語に翻訳できる。
ドメインタグを使用して、大量のジェネリックおよびバイオメディカルデータをトレーニングする。
論文 参考訳(メタデータ) (2020-08-06T21:26:43Z) - A System for Worldwide COVID-19 Information Aggregation [92.60866520230803]
我々は、トピックによって分類された7言語10の地域から信頼できる記事を含む世界的な新型コロナウイルス情報収集システムを構築した。
ニューラルマシン翻訳モジュールは、他言語の論文を日本語と英語に翻訳する。
記事とトピックのペアデータセットに基づいてトレーニングされたBERTベースのトピック分類器は、ユーザが興味のある情報を効率的に見つけるのに役立つ。
論文 参考訳(メタデータ) (2020-07-28T01:33:54Z) - TICO-19: the Translation Initiative for Covid-19 [112.5601530395345]
COvid-19の翻訳イニシアチブ(TICO-19)は、テストおよび開発データを、35の異なる言語でAIおよびMT研究者に提供した。
同じデータが表現されているすべての言語に変換されるため、テストや開発は、セット内の任意の言語のペアリングに対して行うことができる。
論文 参考訳(メタデータ) (2020-07-03T16:26:17Z) - CoAID: COVID-19 Healthcare Misinformation Dataset [12.768221316730674]
CoAIDには4,251件のニュース、296,000件のユーザーエンゲージメント、新型コロナウイルスに関する926件のソーシャルプラットフォーム投稿、および地上の真実ラベルが含まれている。
CoAIDには4,251件のニュース、296,000件のユーザーエンゲージメント、新型コロナウイルスに関する926件のソーシャルプラットフォーム投稿、および地上の真実ラベルが含まれている。
論文 参考訳(メタデータ) (2020-05-22T19:08:14Z) - Fighting the COVID-19 Infodemic: Modeling the Perspective of
Journalists, Fact-Checkers, Social Media Platforms, Policy Makers, and the
Society [37.9389191670008]
新型コロナウイルスは世界保健機関(WHO)にとって最も重要な分野の一つだと宣言されている。
このインフォデミックと戦うことは、世界保健機関(WHO)の最も重要な焦点の1つと宣言されている。
詳細な偽情報分析のために,手動で注釈付きツイート16Kの大規模なデータセットをリリースする。
論文 参考訳(メタデータ) (2020-04-30T18:04:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。