論文の概要: Multimodal Learning for Fake News Detection in Short Videos Using Linguistically Verified Data and Heterogeneous Modality Fusion
- arxiv url: http://arxiv.org/abs/2509.15578v1
- Date: Fri, 19 Sep 2025 04:24:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:10.993865
- Title: Multimodal Learning for Fake News Detection in Short Videos Using Linguistically Verified Data and Heterogeneous Modality Fusion
- Title(参考訳): 言語学的検証データと不均質なモダリティ融合を用いた短いビデオにおけるフェイクニュース検出のためのマルチモーダル学習
- Authors: Shanghong Li, Chiam Wen Qi Ruth, Hong Xu, Fang Liu,
- Abstract要約: 現在の手法は、短いビデオコンテンツのダイナミックでマルチモーダルな性質に苦しむことが多い。
本稿では,ビデオ,音声,テキストデータを統合して,短いビデオコンテンツの信頼性を評価する新しいフレームワークであるHFNを提案する。
- 参考スコア(独自算出の注目度): 5.850574227112314
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid proliferation of short video platforms has necessitated advanced methods for detecting fake news. This need arises from the widespread influence and ease of sharing misinformation, which can lead to significant societal harm. Current methods often struggle with the dynamic and multimodal nature of short video content. This paper presents HFN, Heterogeneous Fusion Net, a novel multimodal framework that integrates video, audio, and text data to evaluate the authenticity of short video content. HFN introduces a Decision Network that dynamically adjusts modality weights during inference and a Weighted Multi-Modal Feature Fusion module to ensure robust performance even with incomplete data. Additionally, we contribute a comprehensive dataset VESV (VEracity on Short Videos) specifically designed for short video fake news detection. Experiments conducted on the FakeTT and newly collected VESV datasets demonstrate improvements of 2.71% and 4.14% in Marco F1 over state-of-the-art methods. This work establishes a robust solution capable of effectively identifying fake news in the complex landscape of short video platforms, paving the way for more reliable and comprehensive approaches in combating misinformation.
- Abstract(参考訳): ショートビデオプラットフォームの急速な普及は、フェイクニュースを検出するための高度な方法を必要としている。
このニーズは、誤った情報を共有することの広範な影響と容易さから生じ、社会に重大な害をもたらす可能性がある。
現在の手法は、短いビデオコンテンツのダイナミックでマルチモーダルな性質に苦しむことが多い。
本稿では,HFN, Heterogeneous Fusion Netを提案する。ビデオ, 音声, テキストデータを統合して, 短いビデオコンテンツの信頼性を評価する, 新たなマルチモーダルフレームワークである。
HFNは、推論中のモダリティ重みを動的に調整する決定ネットワークと、不完全なデータであっても堅牢なパフォーマンスを確保するために重み付きマルチモーダル特徴フュージョンモジュールを導入している。
さらに,ショートビデオのフェイクニュース検出に特化した包括的データセットVESV(VEracity on Short Videos)をコントリビュートする。
FakeTTと新たに収集されたVESVデータセットで実施された実験では、最先端の手法よりも2.71%と4.14%のMarco F1の改善が示されている。
この研究は、短いビデオプラットフォームの複雑な風景において、フェイクニュースを効果的に識別できる堅牢なソリューションを確立し、偽情報と戦うためのより信頼性と包括的なアプローチの道を開く。
関連論文リスト
- ARC-Hunyuan-Video-7B: Structured Video Comprehension of Real-World Shorts [56.75723197779384]
ARC-Hunyuan-Videoは、構造化理解のために視覚、音声、テキストの信号をエンドツーエンドに処理するマルチモーダルモデルである。
本モデルでは,複数粒度のタイムスタンプ付きビデオキャプションと要約,オープンなビデオ質問応答,時間的ビデオグラウンド,ビデオ推論が可能である。
論文 参考訳(メタデータ) (2025-07-28T15:52:36Z) - Enhanced Multimodal Hate Video Detection via Channel-wise and Modality-wise Fusion [7.728348842555291]
TikTokやYouTubeなどのプラットフォーム上でのビデオコンテンツが急速に普及し、情報発信が変化した。
ヘイトスピーチと戦うための大きな努力にもかかわらず、これらのビデオの検出は、しばしば暗黙的な性質のために難しいままである。
本稿では,Channel-wise and Modality-wise Fusion Mechanismを用いたマルチモーダルヘイトビデオ検出モデルCMFusionを提案する。
論文 参考訳(メタデータ) (2025-05-17T15:24:48Z) - FMNV: A Dataset of Media-Published News Videos for Fake News Detection [10.36393083923778]
FMNVは,メディア組織によるニュースビデオで構成された新作のダセットである。
我々は,メディア公開ニュースを操作することで,コンテンツを自動生成するために,Large Language Models (LLMs) を採用している。
この研究は、メディアエコシステムにおいて、インパクトの高いフェイクニュースを検出するための重要なベンチマークを確立する。
論文 参考訳(メタデータ) (2025-04-10T12:16:32Z) - External Reliable Information-enhanced Multimodal Contrastive Learning for Fake News Detection [10.575512607941839]
ERIC-FNDは、フェイクニュース検出のための情報強化型マルチモーダルコントラスト学習フレームワークである。
実験は、X(Twitter)とWeiboという、さまざまな言語で一般的に使用されている2つのデータセットで行われます。
論文 参考訳(メタデータ) (2025-03-05T02:07:38Z) - VMID: A Multimodal Fusion LLM Framework for Detecting and Identifying Misinformation of Short Videos [14.551693267228345]
本稿では,マルチモーダル情報に基づく新しいフェイクニュース検出手法を提案する。
提案フレームワークは,ビデオにマルチモーダル機能を組み込むことで,偽ニュース検出の精度と信頼性を大幅に向上させる。
論文 参考訳(メタデータ) (2024-11-15T08:20:26Z) - Bridging Information Asymmetry in Text-video Retrieval: A Data-centric Approach [56.610806615527885]
テキストビデオ検索(TVR)における重要な課題は、ビデオとテキスト間の情報非対称性である。
本稿では,このギャップを埋めるために,テキスト表現を豊かにすることで,映像コンテンツの豊かさに合わせたデータ中心のフレームワークを提案する。
本稿では,最も関連性が高く多様なクエリを識別し,計算コストを低減し,精度を向上するクエリ選択機構を提案する。
論文 参考訳(メタデータ) (2024-08-14T01:24:09Z) - AVTENet: A Human-Cognition-Inspired Audio-Visual Transformer-Based Ensemble Network for Video Deepfake Detection [49.81915942821647]
本研究では、ディープフェイクビデオを検出するために、オーディオ・ヴィジュアル・トランスフォーマー・ベースのアンサンブルネットワーク(AVTENet)を導入する。
評価には、最近リリースされたマルチモーダルオーディオビデオFakeAVCelebデータセットを使用する。
AVTENetとその変種およびいくつかの既存手法をFakeAVCelebデータセットの複数のテストセット上で評価する。
論文 参考訳(メタデータ) (2023-10-19T19:01:26Z) - Causal Video Summarizer for Video Exploration [74.27487067877047]
Causal Video Summarizer (CVS) はビデオとクエリ間の対話的な情報をキャプチャするために提案されている。
既存のマルチモーダル映像要約データセットの評価から,提案手法が有効であることを示す実験結果が得られた。
論文 参考訳(メタデータ) (2023-07-04T22:52:16Z) - Multimodal Short Video Rumor Detection System Based on Contrastive
Learning [3.4192832062683842]
中国のショートビデオプラットフォームは、フェイクニュースの拡散の場として徐々に肥大化してきた。
短いビデオの噂を区別することは、大量の情報と共有機能のために大きな課題となる。
本研究グループは,マルチモーダルな特徴融合と外部知識の統合を包含する方法論を提案する。
論文 参考訳(メタデータ) (2023-04-17T16:07:00Z) - Few-Shot Video Object Detection [70.43402912344327]
本稿では,Few-Shot Video Object Detection (FSVOD) を紹介する。
fsvod-500は500のクラスからなり、各カテゴリーにクラスバランスのビデオがある。
私達のTPNおよびTMN+は共同およびエンドツーエンドの訓練されます。
論文 参考訳(メタデータ) (2021-04-30T07:38:04Z) - VMSMO: Learning to Generate Multimodal Summary for Video-based News
Articles [63.32111010686954]
マルチモーダル出力(VMSMO)を用いたビデオベースマルチモーダル要約の課題を提案する。
このタスクの主な課題は、ビデオの時間的依存性と記事の意味を共同でモデル化することである。
本稿では,デュアルインタラクションモジュールとマルチモーダルジェネレータからなるDual-Interaction-based Multimodal Summarizer (DIMS)を提案する。
論文 参考訳(メタデータ) (2020-10-12T02:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。