論文の概要: DeepfakeBench-MM: A Comprehensive Benchmark for Multimodal Deepfake Detection
- arxiv url: http://arxiv.org/abs/2510.22622v1
- Date: Sun, 26 Oct 2025 10:40:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.300792
- Title: DeepfakeBench-MM: A Comprehensive Benchmark for Multimodal Deepfake Detection
- Title(参考訳): DeepfakeBench-MM:マルチモーダルディープフェイク検出のための総合ベンチマーク
- Authors: Kangran Zhao, Yupeng Chen, Xiaoyu Zhang, Yize Chen, Weinan Guan, Baicheng Chen, Chengzhe Sun, Soumyya Kanti Datta, Qingshan Liu, Siwei Lyu, Baoyuan Wu,
- Abstract要約: 先進的な生成AIモデルの誤用は、偽化データの拡散をもたらした。
Mega-MMDFはマルチモーダルディープフェイク検出のための大規模で多種多様で高品質なデータセットである。
DeepfakeBench-MMは、マルチモーダルディープフェイク検出のための最初の統一ベンチマークである。
- 参考スコア(独自算出の注目度): 52.13851094326683
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The misuse of advanced generative AI models has resulted in the widespread proliferation of falsified data, particularly forged human-centric audiovisual content, which poses substantial societal risks (e.g., financial fraud and social instability). In response to this growing threat, several works have preliminarily explored countermeasures. However, the lack of sufficient and diverse training data, along with the absence of a standardized benchmark, hinder deeper exploration. To address this challenge, we first build Mega-MMDF, a large-scale, diverse, and high-quality dataset for multimodal deepfake detection. Specifically, we employ 21 forgery pipelines through the combination of 10 audio forgery methods, 12 visual forgery methods, and 6 audio-driven face reenactment methods. Mega-MMDF currently contains 0.1 million real samples and 1.1 million forged samples, making it one of the largest and most diverse multimodal deepfake datasets, with plans for continuous expansion. Building on it, we present DeepfakeBench-MM, the first unified benchmark for multimodal deepfake detection. It establishes standardized protocols across the entire detection pipeline and serves as a versatile platform for evaluating existing methods as well as exploring novel approaches. DeepfakeBench-MM currently supports 5 datasets and 11 multimodal deepfake detectors. Furthermore, our comprehensive evaluations and in-depth analyses uncover several key findings from multiple perspectives (e.g., augmentation, stacked forgery). We believe that DeepfakeBench-MM, together with our large-scale Mega-MMDF, will serve as foundational infrastructures for advancing multimodal deepfake detection.
- Abstract(参考訳): 先進的な生成AIモデルの誤用は、偽造されたデータ、特に偽造された人間中心のオーディオヴィジュアルコンテンツが広範に拡散し、社会的なリスク(例えば、金融詐欺や社会的不安定性)を引き起こしている。
この脅威に応えて、いくつかの研究が早期に対策を検討している。
しかし、十分な、多様なトレーニングデータが欠如していることと、標準化されたベンチマークが欠如していることは、より深い調査を妨げる。
この課題に対処するために,我々はまず,大規模で多様な,高品質なマルチモーダルディープフェイク検出データセットであるMega-MMDFを構築した。
具体的には、音声フォージェリーメソッド10、視覚フォージェリーメソッド12、および6つの音声駆動顔再現メソッドを組み合わせることで、21のフォージェリーパイプラインを採用する。
Mega-MMDFは現在、0.1万個の実サンプルと1100万個の偽造サンプルを含んでおり、連続的な拡張を計画しており、最大かつ最も多様なマルチモーダルディープフェイクデータセットの1つである。
この上に構築されたDeepfakeBench-MMは,マルチモーダルディープフェイク検出のための最初の統一ベンチマークである。
検出パイプライン全体にわたって標準化されたプロトコルを確立し、既存のメソッドの評価や新しいアプローチの探索のための汎用的なプラットフォームとして機能する。
DeepfakeBench-MMは現在、5つのデータセットと11のマルチモーダルディープフェイク検出器をサポートしている。
さらに, 総合的な評価と詳細な分析により, 複数の視点(例えば, 増強, 積み重ね偽造など)からいくつかの重要な知見が得られた。
We believe that DeepfakeBench-MM, with our large-scale Mega-MMDF will be foundational infrastructures for progress multimodal Deepfake detection。
関連論文リスト
- DFBench: Benchmarking Deepfake Image Detection Capability of Large Multimodal Models [43.86847047796023]
現在のディープフェイク検出方法は、生成モデルやコンテンツの多様性に制限のあるデータセットに依存することが多い。
textbfDFBenchは大規模なDeepFakeベンチマークで、リアル、AI編集、AI生成コンテンツにわたって54万のイメージが提供されている。
我々は,複数のLMMから合成された確率戦略を利用して,ディープフェイク検出のための混合エージェントであるtextbfMoA-DFを提案する。
論文 参考訳(メタデータ) (2025-06-03T15:45:41Z) - Can Multi-modal (reasoning) LLMs work as deepfake detectors? [6.36797761822772]
我々は、複数のデータセットにわたる従来のディープフェイク検出手法に対して、最新の12のマルチモーダルLCMをベンチマークする。
以上の結果から,最高のマルチモーダルLCMはゼロショットで有望な一般化能力を持つ競争性能を達成できることが示唆された。
本研究では,将来のディープフェイク検出フレームワークにマルチモーダル推論を統合する可能性を強調した。
論文 参考訳(メタデータ) (2025-03-25T21:47:29Z) - Deepfake Media Generation and Detection in the Generative AI Era: A Survey and Outlook [101.30779332427217]
本研究は,近年の現場開発を含むディープフェイク発生・検出技術について調査する。
偽コンテンツの変更や生成に使用する手順に従って,様々な種類のディープフェイクを識別する。
我々は,分布外コンテンツに基づくディープフェイク検出のための新しいマルチモーダル・ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-11-29T08:29:25Z) - Contextual Cross-Modal Attention for Audio-Visual Deepfake Detection and Localization [3.9440964696313485]
デジタル時代には、ディープフェイクや合成メディアの出現は、社会的・政治的整合性に対する重大な脅威となる。
オーディオ視覚のようなマルチモーダル操作に基づくディープフェイクは、より現実的であり、より大きな脅威をもたらす。
本稿では,音声・視覚的ディープフェイク検出にコンテキスト情報を活用する,リカレントニューラルネットワーク(RNN)に基づく新しいマルチモーダルアテンションフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-02T18:45:01Z) - DF40: Toward Next-Generation Deepfake Detection [62.073997142001424]
既存の研究は、ある特定のデータセットで検出器をトレーニングし、他の一般的なディープフェイクデータセットでテストすることで、トップノーチ検出アルゴリズムとモデルを識別する。
しかし、これらの「勝者」は現実の世界に潜む無数の現実的で多様なディープフェイクに取り組むために真に応用できるのだろうか?
我々は,40の異なるディープフェイク技術からなるDF40という,高度に多様なディープフェイク検出データセットを構築した。
論文 参考訳(メタデータ) (2024-06-19T12:35:02Z) - A Continual Deepfake Detection Benchmark: Dataset, Methods, and
Essentials [97.69553832500547]
本稿では, 既知の生成モデルと未知の生成モデルの両方から, 新たなディープフェイク集合に対する連続的なディープフェイク検出ベンチマーク(CDDB)を提案する。
本研究では,連続的なディープラーニング検出問題に対して,連続的な視覚認識で一般的に使用される多クラス漸進学習手法を適応するために,複数のアプローチを利用する。
論文 参考訳(メタデータ) (2022-05-11T13:07:19Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。