論文の概要: FakeCovid -- A Multilingual Cross-domain Fact Check News Dataset for
COVID-19
- arxiv url: http://arxiv.org/abs/2006.11343v1
- Date: Fri, 19 Jun 2020 19:48:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-13 11:15:44.199003
- Title: FakeCovid -- A Multilingual Cross-domain Fact Check News Dataset for
COVID-19
- Title(参考訳): fakecovid - 新型コロナウイルス(covid-19)のための多言語クロスドメインファクトチェックニュースデータセット
- Authors: Gautam Kishore Shahi, Durgesh Nandini
- Abstract要約: COVID-19に関する5182のファクトチェックされたニュース記事の最初の多言語クロスドメインデータセットを提示する。
我々は、PynterとSnopesから参照を得た後、92の異なるファクトチェックサイトからファクトチェックした記事を収集した。
データセットは105カ国から40言語で提供されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present a first multilingual cross-domain dataset of 5182
fact-checked news articles for COVID-19, collected from 04/01/2020 to
15/05/2020. We have collected the fact-checked articles from 92 different
fact-checking websites after obtaining references from Poynter and Snopes. We
have manually annotated articles into 11 different categories of the
fact-checked news according to their content. The dataset is in 40 languages
from 105 countries. We have built a classifier to detect fake news and present
results for the automatic fake news detection and its class. Our model achieves
an F1 score of 0.76 to detect the false class and other fact check articles.
The FakeCovid dataset is available at Github.
- Abstract(参考訳): 本稿では、2020年の04/01から2020年の15/05に収集された、5182件の事実チェック済みニュース記事からなる、最初の多言語クロスドメインデータセットを提案する。
我々は、PynterとSnopesから参照を得た後、92の異なるファクトチェックサイトからファクトチェック記事を収集した。
われわれは手動で注釈付き記事を11のカテゴリーに分類した。
データセットは105カ国から40言語で提供されている。
我々は,偽ニュースを検知し,偽ニュースの自動検出とそのクラスに結果を提示する分類器を開発した。
本モデルでは,F1スコア0.76を達成し,偽クラスやその他の事実チェック項目を検出する。
FakeCovidデータセットはGithubで公開されている。
関連論文リスト
- Written and spoken corpus of real and fake social media postings about
COVID-19 [0.0]
データは言語データ中のパターンを検出するためにLingguistic Inquiry and Word Count (LIWC)ソフトウェアを用いて分析された。
その結果, 偽ニュースと実ニュースを区別する言語的特徴の集合が, 文章データと音声データの両方で示されることがわかった。
論文 参考訳(メタデータ) (2023-10-06T13:21:04Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - UrduFake@FIRE2020: Shared Track on Fake News Identification in Urdu [62.6928395368204]
本稿では、ウルドゥー語における偽ニュース検出に関するFIRE 2020における最初の共有タスクの概要について述べる。
目標は、900の注釈付きニュース記事と400のニュース記事からなるデータセットを使って偽ニュースを特定することである。
データセットには、 (i) Health、 (ii) Sports、 (iii) Showbiz、 (iv) Technology、 (v) Businessの5つのドメインのニュースが含まれている。
論文 参考訳(メタデータ) (2022-07-25T03:46:51Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2020 [62.6928395368204]
タスクはバイナリ分類タスクとして設定され、ゴールはリアルニュースとフェイクニュースを区別することである。
トレーニング用に900の注釈付きニュース記事とテスト用に400のニュース記事のデータセットを作成した。
6カ国(インド、中国、エジプト、ドイツ、パキスタン、イギリス)の42チームが登録された。
論文 参考訳(メタデータ) (2022-07-25T03:41:32Z) - UrduFake@FIRE2021: Shared Track on Fake News Identification in Urdu [55.41644538483948]
本研究は、ウルドゥー語で偽ニュースを検出するために、UrduFake@FIRE2021と名付けられた2番目の共有タスクを報告した。
提案システムは、様々なカウントベースの特徴に基づいており、異なる分類器とニューラルネットワークアーキテクチャを使用していた。
勾配降下(SGD)アルゴリズムは他の分類器よりも優れ、0.679Fスコアを達成した。
論文 参考訳(メタデータ) (2022-07-11T19:15:04Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2021 [55.41644538483948]
共有タスクの目標は、コミュニティにこの重要な問題を解決するための効率的な方法を考え出すことを動機付けることです。
トレーニングセットには1300件の注釈付きニュース記事、750件のリアルニュース、550件のフェイクニュース、300件のニュース記事、200件のリアルニュース、100件のフェイクニュースが含まれている。
F1-macroスコアは0.679で、これは過去最高の0.907 F1-macroよりも低かった。
論文 参考訳(メタデータ) (2022-07-11T18:58:36Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - NoFake at CheckThat! 2021: Fake News Detection Using BERT [0.0]
我々は、領域と分類を予測するためにBERTに基づく分類モデルを提示した。
我々は、追加のトレーニングデータを用いて、タスク3Aでは83.76%、タスク3Bでは85.55%というマクロF1スコアを達成した。
論文 参考訳(メタデータ) (2021-08-11T19:13:04Z) - AraCOVID19-MFH: Arabic COVID-19 Multi-label Fake News and Hate Speech
Detection Dataset [0.0]
「AraCOVID19-MFH」は、アラビア・COVID-19の偽ニュースとヘイトスピーチ検出データセットを手動で注釈付けしたものである。
当社のデータセットには、10の異なるラベルで注釈付けされた10,828のアラビア語ツイートが含まれています。
ヘイトスピーチの検出、意見/ニュースの分類、方言の識別、その他多くのタスクにも使用できる。
論文 参考訳(メタデータ) (2021-05-07T09:52:44Z) - A Heuristic-driven Uncertainty based Ensemble Framework for Fake News
Detection in Tweets and News Articles [5.979726271522835]
ニュース項目が「本物」か「偽」かを自動的に識別する新しい偽ニュース検出システムについて述べる。
我々は,事前学習したモデルと統計的特徴融合ネットワークからなるアンサンブルモデルを用いた。
提案手法は,分類タスクの適切なクラス出力信頼度レベルとともに,信頼性の高い予測不確実性を定量化した。
論文 参考訳(メタデータ) (2021-04-05T06:35:30Z) - Hostility Detection and Covid-19 Fake News Detection in Social Media [1.3499391168620467]
我々は,Hindi BERTとHindi FastTextモデルを用いて,乱用言語検出と特徴抽出を併用したモデルを構築した。
また、英語のツイートでCovid-19に関連する偽ニュースを識別するためのモデルを構築しています。
論文 参考訳(メタデータ) (2021-01-15T03:24:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。