論文の概要: DeepShield: Fortifying Deepfake Video Detection with Local and Global Forgery Analysis
- arxiv url: http://arxiv.org/abs/2510.25237v1
- Date: Wed, 29 Oct 2025 07:35:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:45.202332
- Title: DeepShield: Fortifying Deepfake Video Detection with Local and Global Forgery Analysis
- Title(参考訳): DeepShield: ローカルおよびグローバルフォージェリ分析によるディープフェイクビデオ検出の強化
- Authors: Yinqi Cai, Jichang Li, Zhaolun Li, Weikai Chen, Rushi Lan, Xi Xie, Xiaonan Luo, Guanbin Li,
- Abstract要約: ローカルな感度とグローバルな一般化のバランスを保ち、目に見えない偽造品間の堅牢性を改善するディープフェイク検出フレームワークであるDeepShieldを紹介する。
DeepShieldは、時間的アーティファクトモデリングとパッチ単位での監視を適用して、グローバルモデルでしばしば見過ごされる微細な不整合をキャプチャする。
- 参考スコア(独自算出の注目度): 59.8324489002129
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in deep generative models have made it easier to manipulate face videos, raising significant concerns about their potential misuse for fraud and misinformation. Existing detectors often perform well in in-domain scenarios but fail to generalize across diverse manipulation techniques due to their reliance on forgery-specific artifacts. In this work, we introduce DeepShield, a novel deepfake detection framework that balances local sensitivity and global generalization to improve robustness across unseen forgeries. DeepShield enhances the CLIP-ViT encoder through two key components: Local Patch Guidance (LPG) and Global Forgery Diversification (GFD). LPG applies spatiotemporal artifact modeling and patch-wise supervision to capture fine-grained inconsistencies often overlooked by global models. GFD introduces domain feature augmentation, leveraging domain-bridging and boundary-expanding feature generation to synthesize diverse forgeries, mitigating overfitting and enhancing cross-domain adaptability. Through the integration of novel local and global analysis for deepfake detection, DeepShield outperforms state-of-the-art methods in cross-dataset and cross-manipulation evaluations, achieving superior robustness against unseen deepfake attacks.
- Abstract(参考訳): 近年の深層生成モデルの発展により、顔ビデオの操作が容易になり、詐欺や誤情報に対する誤用の可能性についての懸念が高まっている。
既存の検出器はドメイン内のシナリオでよく機能するが、偽造特有の人工物に依存しているため、様々な操作技術にまたがる一般化に失敗する。
本研究では,局所感度とグローバルな一般化のバランスを保ち,目に見えない偽造物間の堅牢性を改善する新しいディープフェイク検出フレームワークであるDeepShieldを紹介する。
DeepShieldは、Local Patch Guidance(LPG)とGlobal Forgery Diversification(GFD)という2つの重要なコンポーネントを通じてCLIP-ViTエンコーダを強化している。
LPGは時空間的アーティファクトモデリングとパッチ単位での監視を適用し、大域的なモデルでしばしば見落とされがちな微細な不整合を捉える。
GFDはドメイン機能拡張を導入し、ドメインブリッジとバウンダリ拡張の機能生成を活用して、さまざまなフォージェリーを合成し、オーバーフィッティングを緩和し、ドメイン間の適合性を向上する。
ディープフェイク検出のための新たなローカルおよびグローバル分析の統合により、DeepShieldは、クロスデータセットおよびクロスマニピュレーション評価において最先端の手法より優れ、目に見えないディープフェイク攻撃に対して優れた堅牢性を達成する。
関連論文リスト
- RoGA: Towards Generalizable Deepfake Detection through Robust Gradient Alignment [13.327130030147565]
一般化勾配更新とEMM勾配更新を一致させる新しい学習目標を提案する。
鍵となる革新は、モデルパラメータへの摂動の適用であり、ドメイン間の上昇点を整列させることである。
複数の挑戦的なディープフェイク検出データセットの実験結果から、勾配アライメント戦略が最先端の領域一般化技術より優れていることが示された。
論文 参考訳(メタデータ) (2025-05-27T03:02:21Z) - Towards Open-world Generalized Deepfake Detection: General Feature Extraction via Unsupervised Domain Adaptation [15.737902253508235]
ソーシャルプラットフォームには大量のラベルのない合成データと本物のデータが溢れている。
オープンワールドのシナリオでは、ラベルなしデータの量はラベル付きデータよりもはるかに多い。
我々は,既存の手法の一般化能力を向上させるために,新しいオープンワールドディープフェイク検出一般化訓練戦略(OWG-DS)を提案する。
論文 参考訳(メタデータ) (2025-05-18T10:12:12Z) - Cross-Branch Orthogonality for Improved Generalization in Face Deepfake Detection [43.2796409299818]
ディープフェイクは法執行機関や一般大衆にとって迷惑になっている。
既存のディープフェイク検出器は、ディープフェイク生成のペースの改善に追随するのに苦労している。
本稿では,粗い空間情報,意味情報,それらの相互作用を活用する新しい戦略を提案する。
論文 参考訳(メタデータ) (2025-05-08T01:49:53Z) - Robust AI-Generated Face Detection with Imbalanced Data [10.360215701635674]
現在のディープフェイク検出技術は、ローカルアーティファクトに焦点を当てたCNNベースの手法から、CLIPのようなビジョントランスフォーマーやマルチモーダルモデルを使ったより高度なアプローチへと進化してきた。
近年の進歩にもかかわらず、最先端のディープフェイク検出器は、新しい生成モデルからの分布シフトを扱う上で大きな課題に直面している。
動的損失再重み付けとランキングに基づく最適化を組み合わせたフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-04T17:02:10Z) - Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach [69.01456182499486]
textbfBR-Genは、さまざまなシーン認識アノテーションを備えた15万のローカル鍛造イメージの大規模なデータセットである。
textbfNFA-ViTはノイズ誘導フォージェリ増幅ビジョン変換器で、ローカライズされたフォージェリの検出を強化する。
論文 参考訳(メタデータ) (2025-04-16T09:57:23Z) - Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - Contrastive Pseudo Learning for Open-World DeepFake Attribution [67.58954345538547]
オープンワールド・ディープフェイク (OW-DFA) と呼ばれる新しいベンチマークを導入する。
OW-DFAタスクにおけるコントラスト擬似学習(Contrastive Pseudo Learning, CPL)と呼ばれる新しいフレームワークを提案する。1)グローバル・ローカル投票モジュールを導入し、異なる操作領域の偽顔の特徴的アライメントを誘導し、2)信頼に基づくソフト擬似ラベル戦略を設計し、類似の手法による非ラベル集合における擬似雑音の軽減を図る。
論文 参考訳(メタデータ) (2023-09-20T08:29:22Z) - Cross-Domain Local Characteristic Enhanced Deepfake Video Detection [18.430287055542315]
ディープフェイク検出はセキュリティ上の懸念から注目を集めている。
多くの検出器は、目に見えない操作を検出する際に正確な結果を得ることができない。
そこで我々は,より一般的なディープフェイクビデオ検出のための新しいパイプラインであるクロスドメインローカルフォレスティクスを提案する。
論文 参考訳(メタデータ) (2022-11-07T07:44:09Z) - Delving into Sequential Patches for Deepfake Detection [64.19468088546743]
近年の顔偽造技術は、ほとんど追跡不可能なディープフェイクビデオを生み出しており、悪意のある意図で活用することができる。
従来の研究では、ディープフェイク法にまたがる一般化を追求する上で、局所的な低レベルな手がかりと時間的情報の重要性が指摘されてきた。
本稿では,局所的・時間的変換をベースとしたDeepfake Detectionフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-06T16:46:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。