論文の概要: Cross-lingual COVID-19 Fake News Detection
- arxiv url: http://arxiv.org/abs/2110.06495v1
- Date: Wed, 13 Oct 2021 04:44:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-15 01:16:41.318670
- Title: Cross-lingual COVID-19 Fake News Detection
- Title(参考訳): 言語横断型「フェイクニュース」発見
- Authors: Jiangshu Du, Yingtong Dou, Congying Xia, Limeng Cui, Jing Ma, Philip
S. Yu
- Abstract要約: 低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,CorssFakeの言語横断環境下での有効性が示された。
- 参考スコア(独自算出の注目度): 54.125563009333995
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The COVID-19 pandemic poses a great threat to global public health.
Meanwhile, there is massive misinformation associated with the pandemic which
advocates unfounded or unscientific claims. Even major social media and news
outlets have made an extra effort in debunking COVID-19 misinformation, most of
the fact-checking information is in English, whereas some unmoderated COVID-19
misinformation is still circulating in other languages, threatening the health
of less-informed people in immigrant communities and developing countries. In
this paper, we make the first attempt to detect COVID-19 misinformation in a
low-resource language (Chinese) only using the fact-checked news in a
high-resource language (English). We start by curating a Chinese real&fake news
dataset according to existing fact-checking information. Then, we propose a
deep learning framework named CrossFake to jointly encode the cross-lingual
news body texts and capture the news content as much as possible. Empirical
results on our dataset demonstrate the effectiveness of CorssFake under the
cross-lingual setting and it also outperforms several monolingual and
cross-lingual fake news detectors. The dataset is available at
https://github.com/YingtongDou/CrossFake.
- Abstract(参考訳): 新型コロナウイルスのパンデミックは世界の公衆衛生に大きな脅威をもたらす。
一方、根拠のない、あるいは科学的でない主張を主張するパンデミックに関連する大量の誤報がある。
新型コロナウイルス(COVID-19)の誤報は英語で報告されているが、一部の未修正の誤報は依然として他の言語で流布しており、移民社会や発展途上国の低インフォームの人々の健康を脅かしている。
本稿は,高リソース言語(英語)で事実チェックされたニュースのみを用いて,低リソース言語(中国語)における新型コロナウイルスの誤情報を初めて検出する試みである。
まずは、既存の事実チェック情報に基づいて、中国のリアル&フェイクニュースデータセットをキュレートする。
そこで我々はCrossFakeという深層学習フレームワークを提案する。
実験結果は,CorssFakeが言語間設定で有効であることを示し,また,モノリンガルおよびクロスリンガルの偽ニュース検知器よりも優れていた。
データセットはhttps://github.com/yingtongdou/crossfakeで入手できる。
関連論文リスト
- Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - Detecting Chinese Fake News on Twitter during the COVID-19 Pandemic [14.572408454393042]
新型コロナウイルス(COVID-19)の流行は、中国における偽情報、偽情報、偽ニュースの拡散が原因で、シナフォビアの世界的な急増につながっている。
本稿は、Twitterの中国語ソーシャルメディア投稿が中国に関する偽ニュースと関連しているかどうかを検知する新しい分類器の作成について報告する。
新型コロナウイルス(COVID-19)のパンデミックで、研究者が中国語の偽ニュースを研究するために、18,425のツイートで最終モデルと新しいトレーニングデータセットを提供する。
論文 参考訳(メタデータ) (2023-04-07T03:03:11Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - "COVID-19 was a FIFA conspiracy #curropt": An Investigation into the
Viral Spread of COVID-19 Misinformation [60.268682953952506]
我々は、自然言語処理モデルを用いて、誤報がCOVID-19パンデミックの進行にどのような影響を及ぼしたかを推定する。
我々は、広範囲に害をもたらす可能性のあるソーシャルメディアポストと戦うための戦略を提供する。
論文 参考訳(メタデータ) (2022-06-12T19:41:01Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - AraCOVID19-MFH: Arabic COVID-19 Multi-label Fake News and Hate Speech
Detection Dataset [0.0]
「AraCOVID19-MFH」は、アラビア・COVID-19の偽ニュースとヘイトスピーチ検出データセットを手動で注釈付けしたものである。
当社のデータセットには、10の異なるラベルで注釈付けされた10,828のアラビア語ツイートが含まれています。
ヘイトスピーチの検出、意見/ニュースの分類、方言の識別、その他多くのタスクにも使用できる。
論文 参考訳(メタデータ) (2021-05-07T09:52:44Z) - User Preference-aware Fake News Detection [61.86175081368782]
既存の偽ニュース検出アルゴリズムは、詐欺信号のニュースコンテンツをマイニングすることに焦点を当てている。
本稿では,共同コンテンツとグラフモデリングにより,ユーザの好みから様々な信号を同時にキャプチャする新しいフレームワークUPFDを提案する。
論文 参考訳(メタデータ) (2021-04-25T21:19:24Z) - Cross-SEAN: A Cross-Stitch Semi-Supervised Neural Attention Model for
COVID-19 Fake News Detection [14.771202995527315]
新型コロナウイルス関連の偽ニュースは事実よりも急速に広まっている。
偽ツイートと偽ツイートをラベル付けした最初のcovid-19twitterフェイクニュースデータセットであるctfを紹介します。
また、クロスステッチに基づくセミスーパーバイザーエンドツーエンドの神経注意モデルCross-SEANを提案する。
論文 参考訳(メタデータ) (2021-02-17T18:30:43Z) - Evaluating Deep Learning Approaches for Covid19 Fake News Detection [0.0]
データマイニングの観点から、偽ニュース検出の自動化技術を検討します。
Contraint@AAAI 2021 Covid-19 Fakeニュース検出データセットで異なる教師付きテキスト分類アルゴリズムを評価します。
Covid-19 Fakeニュース検出データセットで98.41%の最高の精度を報告する。
論文 参考訳(メタデータ) (2021-01-11T16:39:03Z) - MM-COVID: A Multilingual and Multimodal Data Repository for Combating
COVID-19 Disinformation [37.52398946169075]
このデータセットは、多言語フェイクニュースと関連する社会的コンテキストを提供する。
偽ニュースコンテンツ3981点と、英語、スペイン語、ポルトガル語、ヒンディー語、フランス語、イタリア語の信頼に値する情報7192点を収集します。
論文 参考訳(メタデータ) (2020-11-08T21:42:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。