論文の概要: Deconfounded Reasoning for Multimodal Fake News Detection via Causal Intervention
- arxiv url: http://arxiv.org/abs/2504.09163v1
- Date: Sat, 12 Apr 2025 09:57:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:49:20.989922
- Title: Deconfounded Reasoning for Multimodal Fake News Detection via Causal Intervention
- Title(参考訳): 因果干渉によるマルチモーダルフェイクニュース検出のためのデコンボリュート推論
- Authors: Moyang Liu, Kaiying Yan, Yukun Liu, Ruibo Fu, Zhengqi Wen, Xuefei Liu, Chenxing Li,
- Abstract要約: ソーシャルメディアの急速な成長は、複数のコンテンツ形式にまたがる偽ニュースの普及につながった。
従来の単モーダル検出手法は複雑なクロスモーダル操作に対処するには不十分である。
因果干渉に基づくマルチモーダルデコン検出フレームワークを提案する。
- 参考スコア(独自算出の注目度): 16.607714608483164
- License:
- Abstract: The rapid growth of social media has led to the widespread dissemination of fake news across multiple content forms, including text, images, audio, and video. Traditional unimodal detection methods fall short in addressing complex cross-modal manipulations; as a result, multimodal fake news detection has emerged as a more effective solution. However, existing multimodal approaches, especially in the context of fake news detection on social media, often overlook the confounders hidden within complex cross-modal interactions, leading models to rely on spurious statistical correlations rather than genuine causal mechanisms. In this paper, we propose the Causal Intervention-based Multimodal Deconfounded Detection (CIMDD) framework, which systematically models three types of confounders via a unified Structural Causal Model (SCM): (1) Lexical Semantic Confounder (LSC); (2) Latent Visual Confounder (LVC); (3) Dynamic Cross-Modal Coupling Confounder (DCCC). To mitigate the influence of these confounders, we specifically design three causal modules based on backdoor adjustment, frontdoor adjustment, and cross-modal joint intervention to block spurious correlations from different perspectives and achieve causal disentanglement of representations for deconfounded reasoning. Experimental results on the FakeSV and FVC datasets demonstrate that CIMDD significantly improves detection accuracy, outperforming state-of-the-art methods by 4.27% and 4.80%, respectively. Furthermore, extensive experimental results indicate that CIMDD exhibits strong generalization and robustness across diverse multimodal scenarios.
- Abstract(参考訳): ソーシャルメディアの急速な成長は、テキスト、画像、オーディオ、ビデオなど、複数のコンテンツ形式で偽ニュースが広く拡散するきっかけとなった。
従来の単一モーダル検出手法は、複雑なクロスモーダル操作に対処するには不十分であり、結果として、より効果的な解決策としてマルチモーダルフェイクニュース検出が出現した。
しかし、既存のマルチモーダルアプローチ、特にソーシャルメディアにおける偽ニュース検出の文脈では、しばしば、複雑なクロスモーダル相互作用の中に隠された共同創設者を見落とし、モデルが真の因果メカニズムではなく、急激な統計的相関に依存するようになる。
本稿では,(1)Lexical Semantic Confounder (LSC), (2) Latent Visual Confounder (LVC), (3) Dynamic Cross-Modal Coupling Confounder (DCCC) の3種類の共同設立者を体系的にモデル化する,Causal Intervention-based Multimodal Decon founded Detection (CIMDD) フレームワークを提案する。
これらの共同設立者の影響を軽減するため, バックドア調整, フロントドア調整, クロスモーダル共同介入に基づく3つの因果モジュールの設計を行った。
FakeSVとFVCのデータセット実験の結果、CIMDDは検出精度を著しく改善し、最先端の手法をそれぞれ4.27%、そして4.80%向上させた。
さらに、CIMDDは多様なマルチモーダルシナリオにまたがる強力な一般化と堅牢性を示すことを示す。
関連論文リスト
- Triple Path Enhanced Neural Architecture Search for Multimodal Fake News Detection [5.251333057002555]
本稿では,新しい3重経路拡張型ニューラルアーキテクチャ探索モデルMUSEを提案する。
MUSEには、偽ニュースを含む部分モダリティを検出するための2つの動的パスと、潜在的なマルチモーダル相関を利用する静的パスが含まれる。
実験結果から,MUSEはベースラインよりも安定した性能向上を実現することが示された。
論文 参考訳(メタデータ) (2025-01-24T12:35:36Z) - Modality Interactive Mixture-of-Experts for Fake News Detection [13.508494216511094]
フェイクニュース検出のためのModality Interactive Mixture-of-Experts(MIMoE-FND)を提案する。
MIMoE-FNDは、マルチモーダルフェイクニュース検出を強化するために設計された、新しい階層型Mixture-of-Expertsフレームワークである。
2つの言語にまたがる3つの実世界のベンチマークに対する我々のアプローチを評価し、最先端の手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2025-01-21T16:49:00Z) - Unified Multi-modal Unsupervised Representation Learning for
Skeleton-based Action Understanding [62.70450216120704]
教師なしの事前訓練は骨格に基づく行動理解において大きな成功を収めた。
我々はUmURLと呼ばれる統一マルチモーダル非教師なし表現学習フレームワークを提案する。
UmURLは効率的な早期融合戦略を利用して、マルチモーダル機能を単一ストリームで共同でエンコードする。
論文 参考訳(メタデータ) (2023-11-06T13:56:57Z) - Detecting and Grounding Multi-Modal Media Manipulation and Beyond [93.08116982163804]
マルチモーダルフェイクメディア(DGM4)の新たな研究課題について述べる。
DGM4は、マルチモーダルメディアの真正性を検出するだけでなく、操作されたコンテンツも検出することを目的としている。
本稿では,異なるモーダル間のきめ細かい相互作用を完全に捉えるために,新しい階層型マルチモーダルマニピュレーションrEasoning tRansformer(HAMMER)を提案する。
論文 参考訳(メタデータ) (2023-09-25T15:05:46Z) - Multi-Grained Multimodal Interaction Network for Entity Linking [65.30260033700338]
マルチモーダルエンティティリンクタスクは、マルチモーダル知識グラフへの曖昧な言及を解決することを目的としている。
MELタスクを解決するための新しいMulti-Grained Multimodal InteraCtion Network $textbf(MIMIC)$ frameworkを提案する。
論文 参考訳(メタデータ) (2023-07-19T02:11:19Z) - Cross-Attention is Not Enough: Incongruity-Aware Dynamic Hierarchical
Fusion for Multimodal Affect Recognition [69.32305810128994]
モダリティ間の同調性は、特に認知に影響を及ぼすマルチモーダル融合の課題となる。
本稿では,動的モダリティゲーティング(HCT-DMG)を用いた階層型クロスモーダルトランスを提案する。
HCT-DMG: 1) 従来のマルチモーダルモデルを約0.8Mパラメータで上回り、2) 不整合が認識に影響を及ぼすハードサンプルを認識し、3) 潜在レベルの非整合性をクロスモーダルアテンションで緩和する。
論文 参考訳(メタデータ) (2023-05-23T01:24:15Z) - Multi-modal Fake News Detection on Social Media via Multi-grained
Information Fusion [21.042970740577648]
偽ニュース検出のためのMMFN(Multi-fine Multi-modal Fusion Network)を提案する。
そこで我々は,トランスフォーマーを用いた事前学習モデルを用いて,テキストと画像からトークンレベルの特徴を符号化する。
マルチモーダルモジュールは、CLIPエンコーダでエンコードされた粗い機能を考慮して、きめ細かい機能をフューズする。
論文 参考訳(メタデータ) (2023-04-03T09:13:59Z) - Quantifying & Modeling Multimodal Interactions: An Information
Decomposition Framework [89.8609061423685]
本稿では,入力モーダル性と出力タスクを関連付けた冗長性,特異性,シナジーの度合いを定量化する情報理論手法を提案する。
PID推定を検証するために、PIDが知られている合成データセットと大規模マルチモーダルベンチマークの両方で広範な実験を行う。
本研究では,(1)マルチモーダルデータセット内の相互作用の定量化,(2)マルチモーダルモデルで捉えた相互作用の定量化,(3)モデル選択の原理的アプローチ,(4)実世界のケーススタディの3つにその有用性を示す。
論文 参考訳(メタデータ) (2023-02-23T18:59:05Z) - Bi-Bimodal Modality Fusion for Correlation-Controlled Multimodal
Sentiment Analysis [96.46952672172021]
Bi-Bimodal Fusion Network (BBFN) は、2対のモダリティ表現で融合を行う新しいエンドツーエンドネットワークである。
モデルは、モダリティ間の既知の情報不均衡により、2つのバイモーダルペアを入力として取る。
論文 参考訳(メタデータ) (2021-07-28T23:33:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。