論文の概要: An Experimental Comparison of the Most Popular Approaches to Fake News Detection
- arxiv url: http://arxiv.org/abs/2603.25501v1
- Date: Thu, 26 Mar 2026 14:39:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.338839
- Title: An Experimental Comparison of the Most Popular Approaches to Fake News Detection
- Title(参考訳): フェイクニュース検出における最も一般的なアプローチの比較
- Authors: Pietro Dell'Oglio, Alessandro Bondielli, Francesco Marcelloni, Lucia C. Passaro,
- Abstract要約: 本報告では,12種類の偽ニュース検出手法の批判的評価を行う。
それらの手法を,ジャンル,ソース,トピック,ラベル付けの合理性が異なる10の公開データセット上で評価する。
- 参考スコア(独自算出の注目度): 41.32471203510647
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In recent years, fake news detection has received increasing attention in public debate and scientific research. Despite advances in detection techniques, the production and spread of false information have become more sophisticated, driven by Large Language Models (LLMs) and the amplification power of social media. We present a critical assessment of 12 representative fake news detection approaches, spanning traditional machine learning, deep learning, transformers, and specialized cross-domain architectures. We evaluate these methods on 10 publicly available datasets differing in genre, source, topic, and labeling rationale. We address text-only English fake news detection as a binary classification task by harmonizing labels into "Real" and "Fake" to ensure a consistent evaluation protocol. We acknowledge that label semantics vary across datasets and that harmonization inevitably removes such semantic nuances. Each dataset is treated as a distinct domain. We conduct in-domain, multi-domain and cross-domain experiments to simulate real-world scenarios involving domain shift and out-of-distribution data. Fine-tuned models perform well in-domain but struggle to generalize. Cross-domain architectures can reduce this gap but are data-hungry, while LLMs offer a promising alternative through zero- and few-shot learning. Given inherent dataset confounds and possible pre-training exposure, results should be interpreted as robustness evaluations within this English, text-only protocol.
- Abstract(参考訳): 近年、フェイクニュースの検出は、公開討論や科学研究で注目を集めている。
検出技術の進歩にもかかわらず、偽情報の生成と拡散は、大規模言語モデル(LLM)とソーシャルメディアの増幅力によってより洗練されつつある。
本稿では、従来の機械学習、ディープラーニング、トランスフォーマー、特殊なクロスドメインアーキテクチャにまたがる12の代表的な偽ニュース検出アプローチについて批判的な評価を行う。
それらの手法を,ジャンル,ソース,トピック,ラベル付けの合理性が異なる10の公開データセット上で評価する。
テキストのみの英語偽ニュース検出を,ラベルを「リアル」と「フェイク」に調和させて,一貫した評価プロトコルを確保することで,バイナリ分類タスクとして扱う。
ラベルのセマンティクスはデータセットによって異なり、ハーモニゼーションは必然的にそのようなセマンティクスのニュアンスを取り除きます。
各データセットは別々のドメインとして扱われる。
ドメインシフトとアウト・オブ・ディストリビューションデータを含む現実のシナリオをシミュレートするために、ドメイン内、マルチドメイン、クロスドメインの実験を行います。
微調整されたモデルはドメイン内でよく機能するが、一般化に苦慮する。
クロスドメインアーキテクチャは、このギャップを減らすことができるが、データハングリーである一方、LLMはゼロショットと少数ショットの学習を通じて、有望な代替手段を提供する。
固有のデータセットとトレーニング前の露出を考慮に入れれば、この英語のテキストのみのプロトコルでは、結果が堅牢性評価として解釈されるべきである。
関連論文リスト
- FineFake: A Knowledge-Enriched Dataset for Fine-Grained Multi-Domain Fake News Detection [54.37159298632628]
FineFakeは、フェイクニュース検出のためのマルチドメイン知識強化ベンチマークである。
FineFakeは6つのセマンティックトピックと8つのプラットフォームにまたがる16,909のデータサンプルを含んでいる。
FineFakeプロジェクト全体がオープンソースリポジトリとして公開されている。
論文 参考訳(メタデータ) (2024-03-30T14:39:09Z) - Can Out-of-Domain data help to Learn Domain-Specific Prompts for Multimodal Misinformation Detection? [14.722270908687216]
ドメイン固有のPromptチューニングは、トレーニング中にドメイン外のデータを利用して、すべての望ましいドメインの偽ニュース検出を同時に改善する。
大規模なNewsCLIPpingとVERITEベンチマークの実験は、DPODがこの課題に対して最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2023-11-27T08:49:26Z) - Robust Domain Misinformation Detection via Multi-modal Feature Alignment [49.89164555394584]
マルチモーダルな誤情報検出のための頑健なドメインとクロスモーダルなアプローチを提案する。
テキストと視覚の共役分布を整列させることにより、ドメインシフトを低減する。
また,ドメイン一般化のアプリケーションシナリオを同時に検討するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-24T07:06:16Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - Embracing Domain Differences in Fake News: Cross-domain Fake News
Detection using Multi-modal Data [18.66426327152407]
異なるドメインの偽ニュースを検出するために、ニュースレコードにドメイン固有の知識とクロスドメインの知識を共同で保存する新しいフレームワークを提案する。
提案する偽ニュースモデルと選択的アノテーションアプローチの統合が,クロスドメインニュースデータセットの最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2021-02-11T23:31:14Z) - Transformer-based Language Model Fine-tuning Methods for COVID-19 Fake
News Detection [7.29381091750894]
偽ニュース検出のためのトランスフォーマーに基づく言語モデルの微調整手法を提案する。
まず、個々のモデルのトークン語彙を専門用語の実際の意味論のために拡張する。
最後に、普遍言語モデルRoBERTaとドメイン固有モデルCT-BERTによって抽出された予測特徴を、複数の層認識によって融合させ、微細で高レベルな特定の表現を統合する。
論文 参考訳(メタデータ) (2021-01-14T09:05:42Z) - Revisiting Mahalanobis Distance for Transformer-Based Out-of-Domain
Detection [60.88952532574564]
本稿では,ドメイン外インテント検出手法を徹底的に比較する。
意図分類のための3つの標準データセット上で,複数のコンテキストエンコーダとメソッドを効率良く評価する。
本研究の主目的は,超微調整トランスフォーマーを用いたドメイン内データエンコーダが優れた結果をもたらすことである。
論文 参考訳(メタデータ) (2021-01-11T09:10:58Z) - A Review of Single-Source Deep Unsupervised Visual Domain Adaptation [81.07994783143533]
大規模ラベル付きトレーニングデータセットにより、ディープニューラルネットワークは、幅広いベンチマークビジョンタスクを拡張できるようになった。
多くのアプリケーションにおいて、大量のラベル付きデータを取得するのは非常に高価で時間を要する。
限られたラベル付きトレーニングデータに対処するため、大規模ラベル付きソースドメインでトレーニングされたモデルを、疎ラベルまたは未ラベルのターゲットドメインに直接適用しようと試みている人も多い。
論文 参考訳(メタデータ) (2020-09-01T00:06:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。