論文の概要: MCFEND: A Multi-source Benchmark Dataset for Chinese Fake News Detection
- arxiv url: http://arxiv.org/abs/2403.09092v2
- Date: Wed, 24 Jul 2024 05:57:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-25 19:01:10.335064
- Title: MCFEND: A Multi-source Benchmark Dataset for Chinese Fake News Detection
- Title(参考訳): MCFEND:中国のフェイクニュース検出のためのマルチソースベンチマークデータセット
- Authors: Yupeng Li, Haorui He, Jin Bai, Dacheng Wen,
- Abstract要約: 純粋に1つのニュースソースで訓練された方法は、現実のシナリオにはほとんど適用できない。
MCFENDと呼ばれる中国の偽ニュース検出のための、最初のマルチソースベンチマークデータセットを構築した。
MCFENDは、ベンチマークデータセットとして、中国の偽ニュース検出アプローチを現実世界のシナリオで前進させることを目的としている。
- 参考スコア(独自算出の注目度): 5.288018460787191
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The prevalence of fake news across various online sources has had a significant influence on the public. Existing Chinese fake news detection datasets are limited to news sourced solely from Weibo. However, fake news originating from multiple sources exhibits diversity in various aspects, including its content and social context. Methods trained on purely one single news source can hardly be applicable to real-world scenarios. Our pilot experiment demonstrates that the F1 score of the state-of-the-art method that learns from a large Chinese fake news detection dataset, Weibo-21, drops significantly from 0.943 to 0.470 when the test data is changed to multi-source news data, failing to identify more than one-third of the multi-source fake news. To address this limitation, we constructed the first multi-source benchmark dataset for Chinese fake news detection, termed MCFEND, which is composed of news we collected from diverse sources such as social platforms, messaging apps, and traditional online news outlets. Notably, such news has been fact-checked by 14 authoritative fact-checking agencies worldwide. In addition, various existing Chinese fake news detection methods are thoroughly evaluated on our proposed dataset in cross-source, multi-source, and unseen source ways. MCFEND, as a benchmark dataset, aims to advance Chinese fake news detection approaches in real-world scenarios.
- Abstract(参考訳): 様々なオンラインソースにおけるフェイクニュースの普及は、大衆に大きな影響を与えている。
既存の中国の偽ニュース検出データセットは、Weiboからのみ提供されたニュースに限られている。
しかし、複数の情報源から発せられる偽ニュースは、その内容や社会的文脈など、様々な面で多様性を示す。
純粋に1つのニュースソースで訓練された方法は、現実のシナリオにはほとんど適用できない。
実験により,中国の大規模な偽ニュース検出データセットWeibo-21から学習した最先端手法のF1スコアが,テストデータがマルチソースニュースデータに変換された場合,0.943から0.470に大幅に低下し,マルチソースフェイクニュースの3分の1以上を識別できなかったことを示す。
この制限に対処するため,我々は,ソーシャルプラットフォームやメッセージングアプリ,従来のオンラインニュースメディアなど,さまざまなソースから収集したニュースで構成されたMCFENDという,中国の偽ニュース検出のための,最初のマルチソースベンチマークデータセットを構築した。
このニュースは、世界中の14の権威あるファクトチェック機関によって事実チェックされている。
さらに, 提案したデータセットに対して, クロスソース, マルチソース, 未確認ソース方式で, 既存中国の偽ニュース検出手法を徹底的に評価した。
MCFENDは、ベンチマークデータセットとして、中国の偽ニュース検出アプローチを現実世界のシナリオで前進させることを目的としている。
関連論文リスト
- Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - fakenewsbr: A Fake News Detection Platform for Brazilian Portuguese [0.6775616141339018]
本稿ではブラジルポルトガル語における偽ニュースの検出に関する総合的研究について述べる。
本稿では、TF-IDFやWord2Vecといった自然言語処理技術を活用する機械学習ベースのアプローチを提案する。
ユーザフレンドリーなWebプラットフォームである fakenewsbr.com を開発し,ニュース記事の妥当性の検証を容易にする。
論文 参考訳(メタデータ) (2023-09-20T04:10:03Z) - Unsupervised Domain-agnostic Fake News Detection using Multi-modal Weak
Signals [19.22829945777267]
本研究は,4つのモダリティで利用可能な知識をニュースレコードに埋め込んだ,教師なしフェイクニュース検出のための効果的なフレームワークを提案する。
また,既存のニュースデータセットの潜伏バイアスを最小限に抑えたニュースデータセット構築手法を提案する。
LUND-COVIDを使って提案した教師なしフレームワークをトレーニングし、大規模データセットの可能性を活用した。
論文 参考訳(メタデータ) (2023-05-18T23:49:31Z) - Nothing Stands Alone: Relational Fake News Detection with Hypergraph
Neural Networks [49.29141811578359]
本稿では,ニュース間のグループ間相互作用を表現するためにハイパーグラフを活用することを提案する。
提案手法は,ラベル付きニュースデータの小さなサブセットであっても,優れた性能を示し,高い性能を維持する。
論文 参考訳(メタデータ) (2022-12-24T00:19:32Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - User Preference-aware Fake News Detection [61.86175081368782]
既存の偽ニュース検出アルゴリズムは、詐欺信号のニュースコンテンツをマイニングすることに焦点を当てている。
本稿では,共同コンテンツとグラフモデリングにより,ユーザの好みから様々な信号を同時にキャプチャする新しいフレームワークUPFDを提案する。
論文 参考訳(メタデータ) (2021-04-25T21:19:24Z) - Lexicon generation for detecting fake news [0.0]
本稿では,トルコ語における偽ニュースの検出を容易にするためのスコアシステムを含む語彙に基づく手法を提案する。
我々は,トルコ語ニュースの新しい,大規模で,信頼性の高いデータセットを収集し,トルコ語ニュースに対する最初の偽ニュース検出辞書を構築することによって,この文献に貢献する。
論文 参考訳(メタデータ) (2020-10-16T20:39:57Z) - BanFakeNews: A Dataset for Detecting Fake News in Bangla [1.4170999534105675]
自動フェイクニュース検知システムの構築に使用できる50Kニュースの注釈付きデータセットを提案する。
我々は,Bangla偽ニュースを識別するためのNLP技術の現状を示すベンチマークシステムを開発した。
論文 参考訳(メタデータ) (2020-04-19T07:42:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。