論文の概要: MMCoVaR: Multimodal COVID-19 Vaccine Focused Data Repository for Fake
News Detection and a Baseline Architecture for Classification
- arxiv url: http://arxiv.org/abs/2109.06416v1
- Date: Tue, 14 Sep 2021 03:57:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-16 03:34:57.038210
- Title: MMCoVaR: Multimodal COVID-19 Vaccine Focused Data Repository for Fake
News Detection and a Baseline Architecture for Classification
- Title(参考訳): MMCoVaR: Fake News DetectionのためのマルチモーダルCOVID-19ワクチンフォーカスデータリポジトリと分類のためのベースラインアーキテクチャ
- Authors: Mingxuan Chen, Xinqiao Chu, K.P. Subbalakshmi
- Abstract要約: 新型コロナウイルスワクチンに関するニュース記事やツイートを含む新しいマルチモーダルラベル付きデータセットを提供する。
3つのニュースメディアランキングサイトからのレーティングを組み合わせて、ニュースデータセットを信頼性と信頼性の2つのレベルに分類する。
提案アーキテクチャはFスコア0.919,精度0.882で偽ニュース検出を行う。
- 参考スコア(独自算出の注目度): 1.587767395906846
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The outbreak of COVID-19 has resulted in an "infodemic" that has encouraged
the propagation of misinformation about COVID-19 and cure methods which, in
turn, could negatively affect the adoption of recommended public health
measures in the larger population. In this paper, we provide a new multimodal
(consisting of images, text and temporal information) labeled dataset
containing news articles and tweets on the COVID-19 vaccine. We collected 2,593
news articles from 80 publishers for one year between Feb 16th 2020 to May 8th
2021 and 24184 Twitter posts (collected between April 17th 2021 to May 8th
2021). We combine ratings from three news media ranking sites: Medias Bias
Chart, News Guard and Media Bias/Fact Check (MBFC) to classify the news dataset
into two levels of credibility: reliable and unreliable. The combination of
three filters allows for higher precision of labeling. We also propose a stance
detection mechanism to annotate tweets into three levels of credibility:
reliable, unreliable and inconclusive. We provide several statistics as well as
other analytics like, publisher distribution, publication date distribution,
topic analysis, etc. We also provide a novel architecture that classifies the
news data into misinformation or truth to provide a baseline performance for
this dataset. We find that the proposed architecture has an F-Score of 0.919
and accuracy of 0.882 for fake news detection. Furthermore, we provide
benchmark performance for misinformation detection on tweet dataset. This new
multimodal dataset can be used in research on COVID-19 vaccine, including
misinformation detection, influence of fake COVID-19 vaccine information, etc.
- Abstract(参考訳): 新型コロナウイルス(COVID-19)の流行は、新型コロナウイルスに関する誤報の伝播を助長する「インフォデミック」を引き起こし、その結果、より大きな人口に推奨される公衆衛生対策の導入に悪影響を及ぼす可能性がある。
本稿では、新型コロナウイルスワクチンのニュース記事やツイートを含む新しいマルチモーダル(画像、テキスト、時間情報からなる)ラベル付きデータセットを提供する。
われわれは2020年2月16日から2021年5月8日までの1年間、80社から2,593件のニュース記事を収集した(2021年4月17日から2021年5月8日まで)。
medias bias chart、news guard、media bias/fact check(mbfc)という3つのニュースメディアランキングサイトからのレーティングを組み合わせることで、ニュースデータセットを信頼性と信頼性の2つのレベルに分類する。
3つのフィルタの組み合わせにより、ラベリングの精度が向上する。
また,ツイートを信頼度,信頼度,信頼度,不決定性の3レベルにアノテートするためのスタンス検出機構を提案する。
我々は,出版社分布,出版日分布,トピック分析など,いくつかの統計情報を提供している。
また、このデータセットのベースライン性能を提供するために、ニュースデータを誤情報または真実に分類する新しいアーキテクチャを提供する。
提案アーキテクチャはFスコア0.919,精度0.882で偽ニュース検出を行う。
さらに,ツイートデータセット上での誤情報検出のためのベンチマーク性能も提供する。
この新しいマルチモーダルデータセットは、誤った情報検出や偽の新型コロナウイルスワクチン情報の影響など、新型コロナウイルスワクチンの研究に使用できる。
関連論文リスト
- Utilization of Multinomial Naive Bayes Algorithm and Term Frequency
Inverse Document Frequency (TF-IDF Vectorizer) in Checking the Credibility of
News Tweet in the Philippines [0.0]
本稿では,ニュース記事の特徴抽出として,地中真理に基づくアノテーションとTF-IDFを利用する。
モデルの精度は99.46%、88.98%である。
論文 参考訳(メタデータ) (2023-05-30T15:41:15Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - CovidMis20: COVID-19 Misinformation Detection System on Twitter Tweets
using Deep Learning Models [1.4085013201980032]
この研究は、2020年2月から7月にかけて収集された1,375,592ツイートからなるCovidMis20データセット(COVID-19 Misinformation 2020データセット)を提示する。
本研究は,Bi-LSTM深層学習とCNN+Bi-GRUを用いてフェイクニュースの検出を行った。
論文 参考訳(メタデータ) (2022-09-13T00:43:44Z) - Machine Learning-based Automatic Annotation and Detection of COVID-19
Fake News [8.020736472947581]
新型コロナウイルス(COVID-19)は世界のあらゆる地域に影響を与えるが、感染の誤報はウイルスよりも速く移動した。
既存の作業は、拡散の触媒として働くボットの存在を無視する。
そこで本稿では,Twitterデータセット上で事実確認文をラベル付けする手法を提案する。
論文 参考訳(メタデータ) (2022-09-07T13:55:59Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - User Preference-aware Fake News Detection [61.86175081368782]
既存の偽ニュース検出アルゴリズムは、詐欺信号のニュースコンテンツをマイニングすることに焦点を当てている。
本稿では,共同コンテンツとグラフモデリングにより,ユーザの好みから様々な信号を同時にキャプチャする新しいフレームワークUPFDを提案する。
論文 参考訳(メタデータ) (2021-04-25T21:19:24Z) - Misinfo Belief Frames: A Case Study on Covid & Climate News [49.979419711713795]
読者がニュースの信頼性や誤った情報の影響をどのように認識するかを理解するための形式主義を提案する。
23.5kの見出しに66kの推論データセットであるMisinfo Belief Frames (MBF) corpusを紹介する。
大規模言語モデルを用いて誤情報フレームを予測した結果,機械生成推論がニュース見出しに対する読者の信頼に影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2021-04-18T09:50:11Z) - A Heuristic-driven Uncertainty based Ensemble Framework for Fake News
Detection in Tweets and News Articles [5.979726271522835]
ニュース項目が「本物」か「偽」かを自動的に識別する新しい偽ニュース検出システムについて述べる。
我々は,事前学習したモデルと統計的特徴融合ネットワークからなるアンサンブルモデルを用いた。
提案手法は,分類タスクの適切なクラス出力信頼度レベルとともに,信頼性の高い予測不確実性を定量化した。
論文 参考訳(メタデータ) (2021-04-05T06:35:30Z) - Transformer based Automatic COVID-19 Fake News Detection System [9.23545668304066]
新型コロナウイルス(COVID-19)のパンデミックでは、誤報が特に多い。
新型コロナウイルスのパンデミックに関するソーシャルメディア上で共有される情報の信頼性を分析する手法を報告する。
テストセットでは0.9855 f1スコアを獲得し,160チーム中5位にランクインした。
論文 参考訳(メタデータ) (2021-01-01T06:49:27Z) - Misinformation Has High Perplexity [55.47422012881148]
疑似クレームを教師なしの方法でデバンクするために, 難易度を活用することを提案する。
まず,これらの主張に類似した文に基づいて,科学的およびニュースソースから信頼性のある証拠を抽出する。
第2に,抽出したエビデンスを言語モデルにプライマリし,難易度スコアに基づいて与えられたクレームの正当性を評価する。
論文 参考訳(メタデータ) (2020-06-08T15:13:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。