論文の概要: Improving Generalization in Deepfake Detection with Face Foundation Models and Metric Learning
- arxiv url: http://arxiv.org/abs/2508.19730v1
- Date: Wed, 27 Aug 2025 09:46:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.581945
- Title: Improving Generalization in Deepfake Detection with Face Foundation Models and Metric Learning
- Title(参考訳): ファウンデーションモデルによるディープフェイク検出の一般化とメトリック学習
- Authors: Stelios Mylonas, Symeon Papadopoulos,
- Abstract要約: 本稿では、強力な一般化を伴う堅牢なビデオディープフェイク検出フレームワークを提案する。
本手法は,実顔データに基づく自己教師型モデルであるFSFM上に構築されている。
トレーニング中に三重項損失の変種を組み込み、実際のサンプルと偽のサンプルの間により分離可能な埋め込みを生成するようモデルに誘導する。
- 参考スコア(独自算出の注目度): 11.097006771680896
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing realism and accessibility of deepfakes have raised critical concerns about media authenticity and information integrity. Despite recent advances, deepfake detection models often struggle to generalize beyond their training distributions, particularly when applied to media content found in the wild. In this work, we present a robust video deepfake detection framework with strong generalization that takes advantage of the rich facial representations learned by face foundation models. Our method is built on top of FSFM, a self-supervised model trained on real face data, and is further fine-tuned using an ensemble of deepfake datasets spanning both face-swapping and face-reenactment manipulations. To enhance discriminative power, we incorporate triplet loss variants during training, guiding the model to produce more separable embeddings between real and fake samples. Additionally, we explore attribution-based supervision schemes, where deepfakes are categorized by manipulation type or source dataset, to assess their impact on generalization. Extensive experiments across diverse evaluation benchmarks demonstrate the effectiveness of our approach, especially in challenging real-world scenarios.
- Abstract(参考訳): ディープフェイクの現実性やアクセシビリティの向上は、メディアの信頼性と情報の整合性に対する批判的な懸念を引き起こしている。
近年の進歩にもかかわらず、ディープフェイク検出モデルは、特に野生で見つかったメディアコンテンツに適用した場合、トレーニング分布を超えた一般化に苦慮することが多い。
本研究では,顔基礎モデルによって学習された豊かな顔表現を活かした,強力な一般化を伴う堅牢なビデオディープフェイク検出フレームワークを提案する。
本手法は,実顔データに基づく自己教師型モデルであるFSFM上に構築され,顔洗面と顔再現操作の両方にまたがるディープフェイクデータセットのアンサンブルを用いて,さらに微調整を行う。
識別力を高めるため,トレーニング中に三重項損失の変種を組み込んで,実検体と偽検体の間でより分離可能な埋め込みを生成する。
さらに、属性に基づく監視手法について検討し、ディープフェイクを操作タイプまたはソースデータセットによって分類し、それらの一般化への影響を評価する。
様々な評価ベンチマークにわたる大規模な実験は、特に現実世界のシナリオにおいて、我々のアプローチの有効性を実証している。
関連論文リスト
- FAME: A Lightweight Spatio-Temporal Network for Model Attribution of Face-Swap Deepfakes [9.462613446025001]
フェイスフェイクのDeepfakeビデオは、デジタルセキュリティ、プライバシー、メディアの整合性へのリスクが高まる。
FAMEは、異なる顔生成モデルに特有の微妙なアーティファクトをキャプチャするために設計されたフレームワークである。
結果は、FAMEが既存のメソッドを精度と実行時の両方で一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-06-13T05:47:09Z) - Detecting Localized Deepfake Manipulations Using Action Unit-Guided Video Representations [4.449835214520726]
ディープフェイク技術は、実際のビデオと合成ビデオのギャップを狭め、プライバシーとセキュリティの深刻な懸念を生じさせている。
この研究は、ディープフェイクビデオにおける局所的な編集を一般化するために明示的に設計された最初の検出手法を示す。
提案手法は,現在の最先端検出法よりも精度が20%向上する。
論文 参考訳(メタデータ) (2025-03-28T03:49:00Z) - Semantics-Oriented Multitask Learning for DeepFake Detection: A Joint Embedding Approach [77.65459419417533]
本稿では,セマンティクス指向のDeepFake検出タスクをサポートする自動データセット拡張手法を提案する。
また,顔画像とラベル(テキストによる記述で示される)を併用して予測を行う。
提案手法は,DeepFake検出の一般化性を向上し,人間の理解可能な説明を提供することで,ある程度のモデル解釈を行う。
論文 参考訳(メタデータ) (2024-08-29T07:11:50Z) - UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。
我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文 参考訳(メタデータ) (2024-07-26T20:51:54Z) - Towards More General Video-based Deepfake Detection through Facial Component Guided Adaptation for Foundation Model [16.69101880602321]
一般化ビデオに基づくDeepfake検出のためのサイドネットワークベースのデコーダを提案する。
また、空間学習の一般化性を高めるために、FCG(Facial Component Guidance)を導入する。
提案手法は,Deepfakeデータセットに挑戦する上で有望な一般化性を示す。
論文 参考訳(メタデータ) (2024-04-08T14:58:52Z) - Real Face Foundation Representation Learning for Generalized Deepfake
Detection [74.4691295738097]
ディープフェイク技術の出現は、個人のプライバシーと公共の安全に脅威をもたらすため、社会的な問題となっている。
十分な偽の顔を集めることはほぼ不可能であり、既存の検出器があらゆる種類の操作に一般化することは困難である。
本稿では,大規模な実顔データセットから一般表現を学習することを目的としたリアルフェイスファウンデーション表現学習(RFFR)を提案する。
論文 参考訳(メタデータ) (2023-03-15T08:27:56Z) - Deep Convolutional Pooling Transformer for Deepfake Detection [54.10864860009834]
本研究では,局所的・グローバル的に決定的な画像特徴を取り入れた深部畳み込み変換器を提案する。
具体的には,抽出した特徴を充実させ,有効性を高めるために,畳み込みプーリングと再アテンションを適用した。
提案手法は、内部実験と相互データセット実験の両方において、最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2022-09-12T15:05:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。