論文の概要: Fighting an Infodemic: COVID-19 Fake News Dataset
- arxiv url: http://arxiv.org/abs/2011.03327v4
- Date: Wed, 26 May 2021 15:38:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 05:16:56.634560
- Title: Fighting an Infodemic: COVID-19 Fake News Dataset
- Title(参考訳): 新型コロナのフェイクニュースデータセット、情報デミックと戦う
- Authors: Parth Patwa, Shivam Sharma, Srinivas Pykl, Vineeth Guptha, Gitanjali
Kumari, Md Shad Akhtar, Asif Ekbal, Amitava Das, Tanmoy Chakraborty
- Abstract要約: 偽ニュースや噂はソーシャルメディアで広まっている。
これを解決するために、新型コロナウイルス(COVID-19)のソーシャルメディア投稿10,700件の注釈付きデータセットとリアルニュースとフェイクニュースの記事を手動でキュレートし、リリースしました。
- 参考スコア(独自算出の注目度): 40.418407303807456
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Along with COVID-19 pandemic we are also fighting an `infodemic'. Fake news
and rumors are rampant on social media. Believing in rumors can cause
significant harm. This is further exacerbated at the time of a pandemic. To
tackle this, we curate and release a manually annotated dataset of 10,700
social media posts and articles of real and fake news on COVID-19. We benchmark
the annotated dataset with four machine learning baselines - Decision Tree,
Logistic Regression, Gradient Boost, and Support Vector Machine (SVM). We
obtain the best performance of 93.46% F1-score with SVM. The data and code is
available at: https://github.com/parthpatwa/covid19-fake-news-dectection
- Abstract(参考訳): 新型コロナウイルス(COVID-19)のパンデミックとともに、我々は「不死身」と戦っている。
偽ニュースや噂はソーシャルメディアで広まっている。
噂を信じることは重大な害をもたらす可能性がある。
これはパンデミックの時にさらに悪化している。
これに対処するために、私たちは10,700のソーシャルメディア投稿と、covid-19のリアルおよびフェイクニュースの記事を手作業でアノテートしたデータセットをキュレートし、公開します。
アノテーション付きデータセットを、決定木、ロジスティック回帰、グラディエントブースト、サポートベクトルマシン(SVM)の4つの機械学習ベースラインでベンチマークする。
SVMで93.46%のF1スコアを得る。
データとコードは、https://github.com/parthpatwa/covid19-fake-news-dectectionで入手できる。
関連論文リスト
- "COVID-19 was a FIFA conspiracy #curropt": An Investigation into the
Viral Spread of COVID-19 Misinformation [60.268682953952506]
我々は、自然言語処理モデルを用いて、誤報がCOVID-19パンデミックの進行にどのような影響を及ぼしたかを推定する。
我々は、広範囲に害をもたらす可能性のあるソーシャルメディアポストと戦うための戦略を提供する。
論文 参考訳(メタデータ) (2022-06-12T19:41:01Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - MMCoVaR: Multimodal COVID-19 Vaccine Focused Data Repository for Fake
News Detection and a Baseline Architecture for Classification [1.587767395906846]
新型コロナウイルスワクチンに関するニュース記事やツイートを含む新しいマルチモーダルラベル付きデータセットを提供する。
3つのニュースメディアランキングサイトからのレーティングを組み合わせて、ニュースデータセットを信頼性と信頼性の2つのレベルに分類する。
提案アーキテクチャはFスコア0.919,精度0.882で偽ニュース検出を行う。
論文 参考訳(メタデータ) (2021-09-14T03:57:50Z) - Tackling COVID-19 Infodemic using Deep Learning [0.0]
オンラインメディア上で偽ニュースを検出し、分類し、新型コロナウイルスや新型コロナウイルスに関連する偽情報を検出する。
データセットには偽の投稿、記事、ニュースがポリティファクトのような事実チェックサイトから集められ、実際のツイートは確認済みのTwitterハンドルから取られた。
論文 参考訳(メタデータ) (2021-07-01T11:07:47Z) - AraCOVID19-MFH: Arabic COVID-19 Multi-label Fake News and Hate Speech
Detection Dataset [0.0]
「AraCOVID19-MFH」は、アラビア・COVID-19の偽ニュースとヘイトスピーチ検出データセットを手動で注釈付けしたものである。
当社のデータセットには、10の異なるラベルで注釈付けされた10,828のアラビア語ツイートが含まれています。
ヘイトスピーチの検出、意見/ニュースの分類、方言の識別、その他多くのタスクにも使用できる。
論文 参考訳(メタデータ) (2021-05-07T09:52:44Z) - ExcavatorCovid: Extracting Events and Relations from Text Corpora for
Temporal and Causal Analysis for COVID-19 [63.72766553648224]
excavatorcovidは、オープンソースのテキスト文書を取り込む機械読取システムである。
COVID19関連イベントとそれらの関係を抽出し、時間と因果分析グラフを構築する。
論文 参考訳(メタデータ) (2021-05-05T01:18:46Z) - User Preference-aware Fake News Detection [61.86175081368782]
既存の偽ニュース検出アルゴリズムは、詐欺信号のニュースコンテンツをマイニングすることに焦点を当てている。
本稿では,共同コンテンツとグラフモデリングにより,ユーザの好みから様々な信号を同時にキャプチャする新しいフレームワークUPFDを提案する。
論文 参考訳(メタデータ) (2021-04-25T21:19:24Z) - Misinfo Belief Frames: A Case Study on Covid & Climate News [49.979419711713795]
読者がニュースの信頼性や誤った情報の影響をどのように認識するかを理解するための形式主義を提案する。
23.5kの見出しに66kの推論データセットであるMisinfo Belief Frames (MBF) corpusを紹介する。
大規模言語モデルを用いて誤情報フレームを予測した結果,機械生成推論がニュース見出しに対する読者の信頼に影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2021-04-18T09:50:11Z) - Transformer based Automatic COVID-19 Fake News Detection System [9.23545668304066]
新型コロナウイルス(COVID-19)のパンデミックでは、誤報が特に多い。
新型コロナウイルスのパンデミックに関するソーシャルメディア上で共有される情報の信頼性を分析する手法を報告する。
テストセットでは0.9855 f1スコアを獲得し,160チーム中5位にランクインした。
論文 参考訳(メタデータ) (2021-01-01T06:49:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。