論文の概要: A Multi-Domain Feature Fusion Framework for Generalizable Deepfake Detection Across Different Generators
- arxiv url: http://arxiv.org/abs/2606.14230v1
- Date: Fri, 12 Jun 2026 08:12:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.81558
- Title: A Multi-Domain Feature Fusion Framework for Generalizable Deepfake Detection Across Different Generators
- Title(参考訳): 異なる発電機間での一般化可能なディープフェイク検出のためのマルチドメイン特徴融合フレームワーク
- Authors: Amna Amjid, Sana Qadir, Mehwish Fatima, Raja Khurram Shahzad,
- Abstract要約: 本稿では,SGFF-Netと呼ばれるマルチドメインのディープフェイク検出フレームワークを提案する。
空間、勾配、DWTに基づく周波数表現を二重残差学習アーキテクチャに統合する。
データセット内評価において98.95%の精度を実現し、クロスモデルとクロスパラダイムの両方での性能を向上させる。
- 参考スコア(独自算出の注目度): 1.8499314936771558
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deepfakes are artificially generated images, audio, or videos that threaten privacy, security, and information integrity. Detecting such content is crucial for countering disinformation, as the latest models generate highly realistic content. While spatial- or frequency-based approaches achieve good detection rates on Generative Adversarial Networks (GANs)-based generated deepfakes, they often struggle with recent diffusion model-generated images. In particular, existing approaches rarely exploit complementary multi-domain representations or systematically evaluate cross-generator robustness. To address these challenges, we propose a multi-domain deepfake detection framework called SGFF-Net (Spatial-Gradient-Frequency Fusion Network) that integrates spatial, gradient, and DWT (Discrete Wavelet Transform)-based frequency representations within a dual residual learning architecture. Experimental results show that the SGFF-Net achieves 98.95\% accuracy in intra-dataset evaluation and improves performance in both cross-model (70.46\%) and cross-paradigm (69.94\%) settings. Incorporating multi-source training and data augmentation further enhances robustness, increasing accuracy from 70.46\% to 79.80\% in cross-model evaluation, from 69\% to 78\% in cross-paradigm evaluation, and from 61.50\% to 75.80\% on real-world data. Unlike single-domain detectors, the SGFF-Net learns complementary forensic cues across spatial, gradient, and wavelet-frequency domains, resulting in greater robustness under cross-generator and cross-paradigm evaluation. The results further show that combining multi-domain representations with data diversity and augmentation substantially improves generalization, providing practical insights for developing more reliable deepfake detection systems.
- Abstract(参考訳): Deepfakesは、プライバシ、セキュリティ、情報の整合性を脅かす、人工的に生成された画像、オーディオ、ビデオだ。
このようなコンテンツを検出することは、最新のモデルが非常にリアルなコンテンツを生成するため、偽情報に対抗するために不可欠である。
空間的あるいは周波数的アプローチは、GAN(Generative Adversarial Networks)ベースの生成したディープフェイクに対して良好な検出率を達成するが、近年の拡散モデル生成画像と競合することが多い。
特に、既存のアプローチでは、補完的なマルチドメイン表現を利用することはめったにない。
これらの課題に対処するために,空間,勾配,DWT(Discrete Wavelet Transform)に基づく周波数表現を統合したSGFF-Net(Spatial-Gradient-Frequency Fusion Network)と呼ばれるマルチドメインディープフェイク検出フレームワークを提案する。
実験結果から,SGFF-Netはデータセット内評価において98.95 %の精度を実現し,クロスモデル (70.46 %) とクロスパラダイム (69.94 %) の両方の性能向上を図っている。
マルチソーストレーニングとデータ拡張の併用により、より堅牢性が向上し、クロスモデル評価では70.46\%から79.80\%、クロスパラダイム評価では69\%から78\%、実世界のデータでは61.50\%から75.80\%に精度が向上する。
単一ドメイン検出器とは異なり、SGFF-Netは空間、勾配、ウェーブレット周波数領域の相補的な法医学的手がかりを学習し、クロスジェネレータおよびクロスパラダイム評価の下でより堅牢性を高める。
さらに,マルチドメイン表現とデータ多様性と拡張性を組み合わせることで,一般化が大幅に向上し,より信頼性の高い深度検出システムを構築するための実用的な知見が得られた。
関連論文リスト
- Multi-modal Deepfake Detection and Localization with FPN-Transformer [21.022230340898556]
FPN変換器(Feature Pyramid-Transformer)に基づくマルチモーダルディープフェイク検出およびローカライゼーションフレームワークを提案する。
マルチスケールな特徴ピラミッドは、R-TLMブロックと局所的な注意機構によって構築され、コンテキスト間の時間的依存関係の結合解析を可能にする。
我々は,IJCAI'25 DDL-AVベンチマークの試験セットに対するアプローチを評価し,最終スコア0.7535で良好な性能を示した。
論文 参考訳(メタデータ) (2025-11-11T09:33:39Z) - SFANet: Spatial-Frequency Attention Network for Deepfake Detection [6.387788094718588]
より優れた検出精度とロバスト性を実現するための新しいアンサンブルフレームワークを提案する。
提案手法は,革新的なデータ分割,シーケンシャルトレーニング,周波数分割,パッチベースの注意,顔分割技術を導入している。
本モデルはDFWild-Cupデータセットでテストした場合,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-10-06T09:35:57Z) - Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。
既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。
本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文 参考訳(メタデータ) (2025-08-07T11:14:16Z) - CAE-Net: Generalized Deepfake Image Detection using Convolution and Attention Mechanisms with Spatial and Frequency Domain Features [0.6700983301090583]
クラス不均衡に対処し,アンサンブルベースのアーキテクチャであるemphCAE-Netを考案した。
私たちのアーキテクチャは、畳み込みと注目に基づくアンサンブルネットワークで構成されており、3つの異なるニューラルネットワークアーキテクチャを採用している。
EfficientNet B0アーキテクチャは90.79%、ConvNeXtアーキテクチャは89.49%、DeiTアーキテクチャは89.32%である。
論文 参考訳(メタデータ) (2025-02-15T06:02:11Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。