論文の概要: Harmful Visual Content Manipulation Matters in Misinformation Detection Under Multimedia Scenarios
- arxiv url: http://arxiv.org/abs/2603.21054v1
- Date: Sun, 22 Mar 2026 04:37:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.211207
- Title: Harmful Visual Content Manipulation Matters in Misinformation Detection Under Multimedia Scenarios
- Title(参考訳): マルチメディアシナリオにおける誤情報検出における有害な視覚コンテンツ操作
- Authors: Bing Wang, Ximing Li, Changchun Li, Jinjin Chi, Tianze Li, Renchu Guan, Shengsheng Wang,
- Abstract要約: マルチモーダル誤情報検出(Multimodal Misinformation Detection、MMD)は、マルチモーダル誤情報検出(Multimodal Misinformation Detection、MMD)として知られる研究課題である
近年の研究では、ソーシャルメディア記事の視覚コンテンツ内の操作された特徴がMDDにとって貴重な手がかりとなることが示されている。
本研究では、視覚的コンテンツが操作されたかどうかを表す操作特徴と、これらの操作の性質を評価する意図特徴の2つの特徴を捉えて、そのようなマルチモーダルな誤情報を特定することを目的とする。
- 参考スコア(独自算出の注目度): 24.832076026977873
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Nowadays, the widespread dissemination of misinformation across numerous social media platforms has led to severe negative effects on society. To address this challenge, the automatic detection of misinformation, particularly under multimedia scenarios, has gained significant attention from both academic and industrial communities, leading to the emergence of a research task known as Multimodal Misinformation Detection (MMD). Typically, current MMD approaches focus on capturing the semantic relationships and inconsistency between various modalities but often overlook certain critical indicators within multimodal content. Recent research has shown that manipulated features within visual content in social media articles serve as valuable clues for MMD. Meanwhile, we argue that the potential intentions behind the manipulation, e.g., harmful and harmless, also matter in MMD. Therefore, in this study, we aim to identify such multimodal misinformation by capturing two types of features: manipulation features, which represent if visual content has been manipulated, and intention features, which assess the nature of these manipulations, distinguishing between harmful and harmless intentions. Unfortunately, the manipulation and intention labels that supervise these features to be discriminative are unknown. To address this, we introduce two weakly supervised indicators as substitutes by incorporating supplementary datasets focused on image manipulation detection and framing two different classification tasks as positive and unlabeled learning issues. With this framework, we introduce an innovative MMD approach, titled Harmful Visual Content Manipulation Matters in MMD (HAVC-M4 D). Comprehensive experiments conducted on four prevalent MMD datasets indicate that HAVC-M4 D significantly and consistently enhances the performance of existing MMD methods.
- Abstract(参考訳): 今日では、多くのソーシャルメディアプラットフォームで誤情報の普及が社会に深刻な悪影響を及ぼしている。
この課題に対処するため、特にマルチメディアシナリオにおける誤情報の自動検出は、学術的・産業的にも大きな注目を集め、MMD(Multimodal Misinformation Detection)と呼ばれる研究課題が出現した。
一般的に、現在のMDDアプローチは、様々なモダリティ間の意味的関係と矛盾を捉えることに重点を置いているが、しばしばマルチモーダルコンテンツ内の特定の重要な指標を見落としている。
近年の研究では、ソーシャルメディア記事の視覚コンテンツ内の操作された特徴がMDDにとって貴重な手がかりとなることが示されている。
一方、MDDでは、手術の背後にある潜在的な意図、例えば有害で無害な意図も重要であると論じる。
そこで本研究では,視覚的内容が操作されたかどうかを表す操作特徴と,これらの操作の性質を評価する意図特徴とを,有害な意図と無害な意図とを区別することで,このようなマルチモーダルな誤情報を特定することを目的とする。
残念ながら、これらの特徴を識別するために監督する操作と意図のラベルは、不明である。
そこで本稿では,イメージ操作検出に焦点をあてた補足データセットを導入し,2つの分類タスクを肯定的かつ未ラベルの学習課題としてフレーミングすることで,2つの弱教師付き指標を代用として導入する。
本フレームワークでは,Hamful Visual Content Manipulation Matters in MMD (HAVC-M4 D) という,革新的なMDD手法を導入する。
4つの一般的なMDDデータセットで実施された総合的な実験は、HAVC-M4 Dが既存のMDD手法の性能を大幅に向上することを示している。
関連論文リスト
- Towards Unified Multimodal Misinformation Detection in Social Media: A Benchmark Dataset and Baseline [56.790045049514326]
詐欺の2つの主要な形態は、人造誤報とAI生成コンテンツである。
両形態の偽造を扱うためのフレームワークであるUMFDet(Unified Multimodal Fake Content Detection)を提案する。
UMFDetは、両方の誤情報型に対して堅牢で一貫したパフォーマンスを実現し、特殊ベースラインを上回っている。
論文 参考訳(メタデータ) (2025-09-30T09:26:32Z) - Beyond Artificial Misalignment: Detecting and Grounding Semantic-Coordinated Multimodal Manipulations [56.816929931908824]
マルチモーダルデータにおける意味的協調操作の検出の先駆者となった。
本稿では,RamDG(Retrieval-Augmented Manipulation Detection and Grounding)フレームワークを提案する。
我々のフレームワークは既存の手法よりも優れており、SAMMの精度は最先端の手法に比べて2.06%高い。
論文 参考訳(メタデータ) (2025-09-16T04:18:48Z) - Remember Past, Anticipate Future: Learning Continual Multimodal Misinformation Detectors [32.97594412075928]
マルチモーダル誤情報検出(MMD)は、誤情報を自動的に識別するコミュニティで活発なトピックとなっている。
従来のMDD法はオフラインデータの収集による検出器の監視に重点を置いていた。
新たなイベントが常に出現し、オフラインデータ上でトレーニングされたMDDモデルは、一貫して時代遅れで非効率になる。
論文 参考訳(メタデータ) (2025-07-08T12:38:19Z) - Detecting Misinformation in Multimedia Content through Cross-Modal Entity Consistency: A Dual Learning Approach [10.376378437321437]
クロスモーダルなエンティティの整合性を利用して、ビデオコンテンツから誤情報を検出するためのマルチメディア誤情報検出フレームワークを提案する。
以上の結果から,MultiMDは最先端のベースラインモデルより優れていることが示された。
論文 参考訳(メタデータ) (2024-08-16T16:14:36Z) - Harmfully Manipulated Images Matter in Multimodal Misinformation Detection [22.236455110413264]
MMD(Multimodal Misinformation Detection)は、学術・産業コミュニティから注目を集めている。
我々は,MDD(HAMI-M3D)における新たなHAMI-M3D法,すなわちハーモリー・マニピュレーション・イメージ・マターを提案する。
3つのベンチマークデータセットにわたる大規模な実験は、HAMI-M3Dが任意のMDDベースラインのパフォーマンスを一貫して改善できることを実証することができる。
論文 参考訳(メタデータ) (2024-07-27T07:16:07Z) - Detecting and Grounding Multi-Modal Media Manipulation and Beyond [93.08116982163804]
マルチモーダルフェイクメディア(DGM4)の新たな研究課題について述べる。
DGM4は、マルチモーダルメディアの真正性を検出するだけでなく、操作されたコンテンツも検出することを目的としている。
本稿では,異なるモーダル間のきめ細かい相互作用を完全に捉えるために,新しい階層型マルチモーダルマニピュレーションrEasoning tRansformer(HAMMER)を提案する。
論文 参考訳(メタデータ) (2023-09-25T15:05:46Z) - Inconsistent Matters: A Knowledge-guided Dual-consistency Network for
Multi-modal Rumor Detection [53.48346699224921]
マルチメディアコンテンツによる噂を検出するために,知識誘導型二元整合ネットワークを提案する。
2つの一貫性検出ツールを使用して、クロスモーダルレベルとコンテント知識レベルの不整合を同時にキャプチャする。
また、異なる視覚的モダリティ条件下で頑健なマルチモーダル表現学習を可能にする。
論文 参考訳(メタデータ) (2023-06-03T15:32:20Z) - Detecting and Grounding Multi-Modal Media Manipulation [32.34908534582532]
マルチモーダルフェイクメディア(DGM4)の新たな研究課題について述べる。
DGM4は、マルチモーダルメディアの真正性を検出するだけでなく、操作されたコンテンツも検出することを目的としている。
本稿では,異なるモーダル間のきめ細かい相互作用を完全に捉えるために,新しい階層型マルチモーダルマニピュレーションrEasoning tRansformer(HAMMER)を提案する。
論文 参考訳(メタデータ) (2023-04-05T16:20:40Z) - Few-Shot Fine-Grained Action Recognition via Bidirectional Attention and
Contrastive Meta-Learning [51.03781020616402]
現実世界のアプリケーションで特定のアクション理解の需要が高まっているため、きめ細かいアクション認識が注目を集めている。
そこで本研究では,各クラスに付与されるサンプル数だけを用いて,新規なきめ細かい動作を認識することを目的とした,数発のきめ細かな動作認識問題を提案する。
粒度の粗い動作では進展があったが、既存の数発の認識手法では、粒度の細かい動作を扱う2つの問題に遭遇する。
論文 参考訳(メタデータ) (2021-08-15T02:21:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。