論文の概要: TalkingHeadBench: A Multi-Modal Benchmark & Analysis of Talking-Head DeepFake Detection
- arxiv url: http://arxiv.org/abs/2505.24866v1
- Date: Fri, 30 May 2025 17:59:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:53.125501
- Title: TalkingHeadBench: A Multi-Modal Benchmark & Analysis of Talking-Head DeepFake Detection
- Title(参考訳): TalkingHeadBench:トーキングヘッドディープフェイク検出のマルチモーダルベンチマークと解析
- Authors: Xinqi Xiong, Prakrut Patel, Qingyuan Fan, Amisha Wadhwa, Sarathy Selvam, Xiao Guo, Luchao Qi, Xiaoming Liu, Roni Sengupta,
- Abstract要約: TalkingHeadBenchはディープフェイクのトーキングヘッド検出のためのベンチマークだ。
私たちのデータセットには、主要な学術モデルと商業モデルによって合成されたディープフェイクが含まれています。
一般的な障害モードや検出可能なバイアスを明らかにするために,Grad-CAM視覚化を用いてエラー解析を行う。
- 参考スコア(独自算出の注目度): 8.166056418369125
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid advancement of talking-head deepfake generation fueled by advanced generative models has elevated the realism of synthetic videos to a level that poses substantial risks in domains such as media, politics, and finance. However, current benchmarks for deepfake talking-head detection fail to reflect this progress, relying on outdated generators and offering limited insight into model robustness and generalization. We introduce TalkingHeadBench, a comprehensive multi-model multi-generator benchmark and curated dataset designed to evaluate the performance of state-of-the-art detectors on the most advanced generators. Our dataset includes deepfakes synthesized by leading academic and commercial models and features carefully constructed protocols to assess generalization under distribution shifts in identity and generator characteristics. We benchmark a diverse set of existing detection methods, including CNNs, vision transformers, and temporal models, and analyze their robustness and generalization capabilities. In addition, we provide error analysis using Grad-CAM visualizations to expose common failure modes and detector biases. TalkingHeadBench is hosted on https://huggingface.co/datasets/luchaoqi/TalkingHeadBench with open access to all data splits and protocols. Our benchmark aims to accelerate research towards more robust and generalizable detection models in the face of rapidly evolving generative techniques.
- Abstract(参考訳): 先進的な生成モデルによって刺激された対話型ディープフェイク生成の急速な進歩は、合成ビデオのリアリズムを、メディアや政治、金融といった分野において重大なリスクをもたらすレベルに引き上げている。
しかし、現在のディープフェイク音声ヘッド検出のベンチマークはこの進歩を反映せず、時代遅れのジェネレータに依存し、モデルの堅牢性と一般化に関する限られた洞察を提供する。
TalkingHeadBenchは、最も先進的な発電機における最先端検出器の性能を評価するために設計された、総合的なマルチモデルマルチジェネレータベンチマークとキュレートデータセットである。
本データセットは,学術的および商業的モデルによって合成されたディープフェイクを包含し,アイデンティティとジェネレータ特性の分布シフト下での一般化を評価するために,慎重に構築されたプロトコルを特徴付ける。
我々は、CNN、視覚変換器、時間モデルなど、既存の検出手法の多様なセットをベンチマークし、その堅牢性と一般化能力を解析する。
また,Grad-CAM視覚化を用いたエラー解析を行い,一般的な障害モードや検出バイアスを明らかにする。
TalkingHeadBenchはhttps://huggingface.co/datasets/luchaoqi/TalkingHeadBenchにホストされている。
我々のベンチマークは、急速に進化する生成技術に直面した、より堅牢で一般化可能な検出モデルに向けた研究を加速することを目的としている。
関連論文リスト
- Robust AI-Generated Face Detection with Imbalanced Data [10.360215701635674]
現在のディープフェイク検出技術は、ローカルアーティファクトに焦点を当てたCNNベースの手法から、CLIPのようなビジョントランスフォーマーやマルチモーダルモデルを使ったより高度なアプローチへと進化してきた。
近年の進歩にもかかわらず、最先端のディープフェイク検出器は、新しい生成モデルからの分布シフトを扱う上で大きな課題に直面している。
動的損失再重み付けとランキングに基づく最適化を組み合わせたフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-04T17:02:10Z) - AI-GenBench: A New Ongoing Benchmark for AI-Generated Image Detection [9.540547388707987]
Ai-GenBenchは、現実のシナリオにおけるAI生成イメージの堅牢な検出の必要性に対処するために設計された、新しいベンチマークである。
Ai-GenBenchは、明確な評価ルールと制御された拡張戦略を確立することにより、検出方法とスケーラブルなソリューションの有意義な比較を可能にする。
論文 参考訳(メタデータ) (2025-04-29T15:41:13Z) - HFMF: Hierarchical Fusion Meets Multi-Stream Models for Deepfake Detection [4.908389661988192]
HFMFは総合的な2段階のディープフェイク検出フレームワークである。
視覚変換器と畳み込みネットを階層的特徴融合機構を通じて統合する。
私たちのアーキテクチャは、多様なデータセットベンチマークで優れたパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2025-01-10T00:20:29Z) - Adaptive Meta-Learning for Robust Deepfake Detection: A Multi-Agent Framework to Data Drift and Model Generalization [6.589206192038365]
本稿では,タスク固有適応型サンプル合成と整合性正規化を用いた対角的メタ学習アルゴリズムを提案する。
これにより、モデルの堅牢性と一般化の両方が促進される。
実験結果は、モデルが様々なデータセットにわたって一貫した性能を示し、比較したモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2024-11-12T19:55:07Z) - Leveraging Mixture of Experts for Improved Speech Deepfake Detection [53.69740463004446]
スピーチのディープフェイクは、個人のセキュリティとコンテンツの信頼性に重大な脅威をもたらす。
本研究では,Mixture of Expertsアーキテクチャを用いた音声深度検出性能の向上のための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-24T13:24:03Z) - GM-DF: Generalized Multi-Scenario Deepfake Detection [49.072106087564144]
既存の偽造検出は、通常、単一のドメインでのトレーニングモデルのパラダイムに従う。
本稿では,複数の顔偽造検出データセットを共同で訓練した場合のディープフェイク検出モデルの一般化能力について詳しく検討する。
論文 参考訳(メタデータ) (2024-06-28T17:42:08Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - Firearm Detection via Convolutional Neural Networks: Comparing a
Semantic Segmentation Model Against End-to-End Solutions [68.8204255655161]
武器の脅威検出とライブビデオからの攻撃的な行動は、潜在的に致命的な事故の迅速検出と予防に使用できる。
これを実現する一つの方法は、人工知能と、特に画像分析のための機械学習を使用することです。
従来のモノリシックなエンド・ツー・エンドのディープラーニングモデルと、セマンティクスセグメンテーションによって火花を検知する単純なニューラルネットワークのアンサンブルに基づく前述したモデルを比較した。
論文 参考訳(メタデータ) (2020-12-17T15:19:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。