論文の概要: On Improving Robustness of Deepfake Image Detectors
- arxiv url: http://arxiv.org/abs/2606.02797v2
- Date: Thu, 04 Jun 2026 16:47:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 19:21:33.095484
- Title: On Improving Robustness of Deepfake Image Detectors
- Title(参考訳): ディープフェイク画像検出器のロバスト性向上について
- Authors: Abu Taib Mohammed Shahjahan, Mohammad Mannan, Abdessamad Ben Hamza, Amr Youssef,
- Abstract要約: 3つの相補的な設計原則を統合する統一的なフレームワークを提案する。
敵攻撃は主に低次統計と視覚的意味論に基づいて行われる。
提案手法は, アーキテクチャ的に多様である6つの検出器間のロバスト性を一貫して改善する。
- 参考スコア(独自算出の注目度): 5.7418146925786795
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid advancement of Generative AI has introduced remarkable opportunities while simultaneously raising critical concerns regarding content authenticity. While recent work has increasingly focused on improving the generalization of deepfake detectors across unseen generative models, their robustness against adversarial attacks remains limited. In particular, Abdullah et al. (IEEE SP 2024) evaluated eight detectors and demonstrated that most of them exhibit significant performance degradation under adversarial attacks. We also observed the same phenomenon by testing seven most recent state-of-the-art detectors. To address this problem, we propose a unified framework that integrates three complementary design principles without relying on adversarial training data: (i) higher-order statistical modeling in the frequency domain via Discrete Cosine Transform (DCT)-based moment pooling up to fourth order, (ii) content-agnostic feature representations derived from noise residuals, and (iii) cross-scene generalization enforced through patch-level semantic disruption. A key insight underpinning our approach is that adversarial attacks primarily operate on low-order statistics and visual semantics, leaving higher-order residual-frequency characteristics, particularly kurtosis, largely unconstrained. Extensive experiments demonstrate that our method consistently improves robustness across six architecturally diverse detectors. Notably, we achieve up to 88.9% reduction in recall degradation on current adversarial benchmarks, and improve the best-performing recent detector (Yang et al., IEEE CVPR 2025) from 81.9% to 97.15% accuracy under attack. Overall, our method provides a principled, architecture-agnostic approach for improving deepfake detection robustness against current attacks.
- Abstract(参考訳): 生成AIの急速な進歩は、コンテンツの信頼性に関する重要な懸念を同時に提起すると同時に、驚くべき機会をもたらした。
最近の研究は、目に見えない生成モデルにまたがるディープフェイク検出器の一般化に焦点が当てられているが、敵の攻撃に対する堅牢性はまだ限られている。
特に、Abdullah et al (IEEE SP 2024) は8つの検出器を評価し、そのほとんどは敵の攻撃によって著しい性能低下を示すことを示した。
我々はまた、最新の7つの最先端検出器をテストすることで、同じ現象を観測した。
この問題に対処するために、敵のトレーニングデータに頼ることなく、3つの相補的な設計原則を統合する統一的なフレームワークを提案する。
(i)離散コサイン変換(DCT)を用いた周波数領域の高次統計モデリング(第4次)
二 雑音残差から派生した内容に依存しない特徴表現及び
(iii)パッチレベルのセマンティック・ディスラプションを通したクロスシーンの一般化。
我々のアプローチを裏付ける重要な洞察は、敵の攻撃は主に低次統計学と視覚的意味論に基づいており、高次残留周波数特性、特にクルトーシスは、ほとんど拘束されていないことである。
広範囲な実験により,本手法は6つのアーキテクチャ的多種多様な検出器間のロバスト性を一貫して改善することが示された。
特に、現在の逆数ベンチマークにおけるリコール劣化の最大88.9%の低減を実現し、最も優れた最近の検出器(Yang et al , IEEE CVPR 2025)を攻撃中の81.9%から97.15%の精度で改善した。
全体として,本手法は,現在の攻撃に対するディープフェイク検出の堅牢性を改善するために,原則的,アーキテクチャに依存しないアプローチを提供する。
関連論文リスト
- Fragile Reconstruction: Adversarial Vulnerability of Reconstruction-Based Detectors for Diffusion-Generated Images [32.470971087318695]
本研究は,4つの異なる生成バックボーンモデルにおける3つの代表検出器の対向ロバスト性について,系統的評価を行った。
我々は、ホワイトボックスシナリオにおける敵攻撃を構築し、十分に訓練された全ての検出器の性能を低下させる。
また、ある検出器に対する攻撃を他の検出器に転送することもでき、検出器に対する敵攻撃もブラックボックスの設定で構築できることを示す。
論文 参考訳(メタデータ) (2026-04-14T14:17:51Z) - ThreatFormer-IDS: Robust Transformer Intrusion Detection with Zero-Day Generalization and Explainable Attribution [0.0]
IoTおよび産業ネットワークの侵入検出には、進化するトラフィックと限定されたラベルの下で信頼性を維持しながら、低い偽陽性率で稀な攻撃を検出できるモデルが必要である。
本研究では,トランスフォーマーをベースとしたシーケンシャルモデリングフレームワークThreatFormer-IDSを提案する。
時系列評価を備えたToN IoTベンチマークでは、ThreatFormer-IDSがAUCROC 0.994、AUC-PR 0.956、Recall@1%FPR 0.910を達成した。
論文 参考訳(メタデータ) (2026-02-26T23:20:42Z) - BadCLIP++: Stealthy and Persistent Backdoors in Multimodal Contrastive Learning [73.46118996284888]
マルチモーダル・コントラスト学習モデルに対するバックドア攻撃の研究は、ステルスネスと永続性という2つの大きな課題に直面している。
両課題に対処する統合フレームワークであるBadCLIP++を提案する。
ステルスネスのために,タスク関連領域付近に知覚不可能なパターンを埋め込むセマンティックフュージョンQRマイクロトリガーを導入する。
持続性については、半径縮小とセントロイドアライメントによるトリガ埋め込みを安定化する。
論文 参考訳(メタデータ) (2026-02-19T08:31:16Z) - Towards Adversarial Training under Hyperspectral Images [26.728505144408217]
敵の攻撃に対する最も効果的な防御の1つとして広く認識されているハイパースペクトル領域に敵の訓練を導入する。
対向雑音や非滑らかな対向音は、重要なスペクトル意味情報を歪め、あるいは取り除くことができる。
スペクトル情報の多様性を高め、空間的滑らかさを確保することで、AT-RAはハイパースペクトル画像のスペクトル意味を保存し、修正する。
論文 参考訳(メタデータ) (2025-10-01T15:19:39Z) - CAMME: Adaptive Deepfake Image Detection with Multi-Modal Cross-Attention [4.359154048799454]
マルチヘッド・クロスアテンション機構を用いて,視覚,テキスト,周波数領域の機能を統合するフレームワークであるCAMMEを提案する。
実験では、CAMMEは最先端の手法よりも優れており、自然のシーンでは12.56%、顔のディープフェイクでは13.25%改善している。
論文 参考訳(メタデータ) (2025-05-23T15:39:07Z) - Robust VAEs via Generating Process of Noise Augmented Data [9.366139389037489]
本稿では,原データと雑音増大データ間の潜時空間のばらつきを規則化し,ロバスト性を高める新しい枠組みを提案する。
実験により,ロバスト拡張変分オートエンコーダ(RAVEN)と呼ばれるこの手法は,対向入力に対して優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2024-07-26T09:55:34Z) - FaultGuard: A Generative Approach to Resilient Fault Prediction in Smart Electrical Grids [53.2306792009435]
FaultGuardは、障害タイプとゾーン分類のための最初のフレームワークであり、敵攻撃に耐性がある。
本稿では,ロバスト性を高めるために,低複雑性故障予測モデルとオンライン逆行訓練手法を提案する。
本モデルでは,耐故障予測ベンチマークの最先端を最大0.958の精度で上回っている。
論文 参考訳(メタデータ) (2024-03-26T08:51:23Z) - Spatial-Frequency Discriminability for Revealing Adversarial Perturbations [53.279716307171604]
敵の摂動に対するディープニューラルネットワークの脆弱性は、コンピュータビジョンコミュニティで広く認識されている。
現在のアルゴリズムは、通常、自然および敵対的なデータの識別的分解を通じて、敵のパターンを検出する。
空間周波数Krawtchouk分解に基づく識別検出器を提案する。
論文 参考訳(メタデータ) (2023-05-18T10:18:59Z) - Model-Agnostic Meta-Attack: Towards Reliable Evaluation of Adversarial
Robustness [53.094682754683255]
モデル非依存型メタアタック(MAMA)アプローチにより,より強力な攻撃アルゴリズムを自動検出する。
本手法は、繰り返しニューラルネットワークによってパラメータ化された逆攻撃を学習する。
本研究では,未知の防御を攻撃した場合の学習能力を向上させるために,モデルに依存しない訓練アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-13T13:54:24Z) - Temporal Sparse Adversarial Attack on Sequence-based Gait Recognition [56.844587127848854]
このような攻撃に対して,最先端の歩行認識モデルが脆弱であることを示す。
生成した対向ネットワークに基づくアーキテクチャを用いて、対向的な高品質な歩行シルエットやビデオフレームを意味的に生成する。
実験結果から, フレームの1分の1しか攻撃されない場合, 対象モデルの精度は劇的に低下することがわかった。
論文 参考訳(メタデータ) (2020-02-22T10:08:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。