論文の概要: Retrieval-Augmented Multimodal Model for Fake News Detection
- arxiv url: http://arxiv.org/abs/2604.18112v2
- Date: Wed, 29 Apr 2026 05:20:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 13:51:53.841379
- Title: Retrieval-Augmented Multimodal Model for Fake News Detection
- Title(参考訳): 偽ニュース検出のための検索強化マルチモーダルモデル
- Authors: Yiheng Li, Weihai Lu, Hanyi Yu, Yue Wang,
- Abstract要約: 偽ニュース検出(RAMM)のための検索拡張マルチモーダルモデルを提案する。
まず、Multimodal Large Language Model(MLLM)をバックボーンとして使用して、ニュースサンプルからクロスモーダルなセマンティック情報をキャプチャする。
第2に、RAMMには抽象的ナラティブアライメントモジュールが組み込まれている。
- 参考スコア(独自算出の注目度): 10.814810578830153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, multimodal multidomain fake news detection has garnered increasing attention. Nevertheless, this direction presents two significant challenges: (1) Failure to Capture Cross-Instance Narrative Consistency: existing models usually evaluate each news in isolation, fail to capture cross-instance narrative consistency, and thus struggle to address the spread of cluster based fake news driven by social media; (2) Lack of Domain Specific Knowledge for Reasoning: conventional models, which rely solely on knowledge encoded in their parameters during training, struggle to generalize to new or data-scarce domains (e.g., emerging events or niche topics). To tackle these challenges, we introduce Retrieval-Augmented Multimodal Model for Fake News Detection (RAMM). First, RAMM employs a Multimodal Large Language Model (MLLM) as its backbone to capture cross-modal semantic information from news samples. Second, RAMM incorporates an Abstract Narrative Alignment Module. This component adaptively extracts abstract narrative consistency from diverse instances across distinct domains, aggregates relevant knowledge, and thereby enables the modeling of high-level narrative information. Finally, RAMM introduces a Semantic Representation Alignment Module, which aligns the model's decision-making paradigm with that of humans - specifically, it shifts the model's reasoning process from direct inference on multimodal features to an instance-based analogical reasoning process. Extensive experimental results on three public datasets validate the efficacy of our proposed approach. Our code is available at the following link: https://github.com/li-yiheng/RAMM
- Abstract(参考訳): 近年,マルチモーダル・マルチドメイン・フェイクニュース検出が注目されている。
それにもかかわらず、この方向は2つの重要な課題を提示している: 1) クロスインスタンス・ナラティブ・一貫性の障害: 既存のモデルは、通常、それぞれのニュースを独立して評価し、クロスインスタンス・ナラティブ・一貫性を捉えることができず、ソーシャルメディアによって駆動されるクラスタベースのフェイク・ニュースの拡散に対処するのに苦労する。
これらの課題に対処するために,Fake News Detection (RAMM) のためのRetrieval-Augmented Multimodal Modelを導入する。
まず、Multimodal Large Language Model(MLLM)をバックボーンとして使用して、ニュースサンプルからクロスモーダルなセマンティック情報をキャプチャする。
第2に、RAMMには抽象的ナラティブアライメントモジュールが組み込まれている。
このコンポーネントは、異なるドメインにわたる多様なインスタンスから抽象的な物語一貫性を適応的に抽出し、関連する知識を集約し、高レベルの物語情報のモデリングを可能にする。
最後に、RAMMはSemantic Representation Alignment Moduleを導入し、モデルの意思決定パラダイムを人間のそれと整合させる。
提案手法の有効性を3つの公開データセットで検証した。
私たちのコードは以下のリンクで利用可能です。
関連論文リスト
- RASR: Retrieval-Augmented Semantic Reasoning for Fake News Video Detection [38.069086560563285]
マルチモーダルフェイクニュースビデオ検出は、オンライン情報の信頼性を維持するための重要な研究方向である。
既存の研究は、主にマルチモーダルな特徴融合表現を構築したり、事前訓練された言語モデルを利用したりすることで、コンテンツの信頼性を検証する。
本稿では,これらの制約を克服する新しいRASR(Retrieval-Augmented Semantic Reasoning)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-08T05:03:34Z) - Towards Unified Multimodal Misinformation Detection in Social Media: A Benchmark Dataset and Baseline [56.790045049514326]
詐欺の2つの主要な形態は、人造誤報とAI生成コンテンツである。
両形態の偽造を扱うためのフレームワークであるUMFDet(Unified Multimodal Fake Content Detection)を提案する。
UMFDetは、両方の誤情報型に対して堅牢で一貫したパフォーマンスを実現し、特殊ベースラインを上回っている。
論文 参考訳(メタデータ) (2025-09-30T09:26:32Z) - Discrete Diffusion in Large Language and Multimodal Models: A Survey [61.86669998363359]
離散拡散言語モデル(dLLMs)と離散拡散多モード言語モデル(dMLLMs)の体系的調査を行う。
自己回帰(AR)モデルとは異なり、dLLMsとdMLLMsはマルチトークンの並列デコーディングパラダイムを採用しており、フルアテンションとデノナイジングに基づく生成戦略を採用している。
我々は、dLLMとdMLLMの歴史的発展を辿り、基礎となる数学的枠組みを定式化し、一般的なモデリング手法を列挙し、代表モデルを分類する。
論文 参考訳(メタデータ) (2025-06-16T17:59:08Z) - Deconfounded Reasoning for Multimodal Fake News Detection via Causal Intervention [16.607714608483164]
ソーシャルメディアの急速な成長は、複数のコンテンツ形式にまたがる偽ニュースの普及につながった。
従来の単モーダル検出手法は複雑なクロスモーダル操作に対処するには不十分である。
因果干渉に基づくマルチモーダルデコン検出フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-12T09:57:43Z) - MDF: A Dynamic Fusion Model for Multi-modal Fake News Detection [0.41942958779358674]
フェイクニュース検出のためのMDFと呼ばれる新しい動的融合フレームワークを提案する。
本モデルは,(1)モーダル内不確実性をモデル化するためのマルチヘッドアテンション機構を用いた不確実性モデリングモジュールとしてのUEM,(2)DFNは2つのモーダルの重みを動的に融合させるD-Sエビデンス理論に基づく動的融合モジュールである。
論文 参考訳(メタデータ) (2024-06-28T09:24:52Z) - Sports-Traj: A Unified Trajectory Generation Model for Multi-Agent Movement in Sports [53.637837706712794]
任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。
具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを紹介する。
バスケットボールU,サッカーU,サッカーUの3つの実践的スポーツデータセットをベンチマークして評価を行った。
論文 参考訳(メタデータ) (2024-05-27T22:15:23Z) - Detecting and Grounding Multi-Modal Media Manipulation and Beyond [93.08116982163804]
マルチモーダルフェイクメディア(DGM4)の新たな研究課題について述べる。
DGM4は、マルチモーダルメディアの真正性を検出するだけでなく、操作されたコンテンツも検出することを目的としている。
本稿では,異なるモーダル間のきめ細かい相互作用を完全に捉えるために,新しい階層型マルチモーダルマニピュレーションrEasoning tRansformer(HAMMER)を提案する。
論文 参考訳(メタデータ) (2023-09-25T15:05:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。