論文の概要: Diffusion-Guided Adversarial Perturbation Injection for Generalizable Defense Against Facial Manipulations
- arxiv url: http://arxiv.org/abs/2604.01635v1
- Date: Thu, 02 Apr 2026 05:24:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.373103
- Title: Diffusion-Guided Adversarial Perturbation Injection for Generalizable Defense Against Facial Manipulations
- Title(参考訳): 顔面マニピュレーションに対する汎用的防御のための拡散誘導逆行性摂動注入法
- Authors: Yue Li, Linying Xue, Kaiqing Lin, Hanyu Quan, Dongdong Lin, Hui Tian, Hongxia Wang, Bin Wang,
- Abstract要約: GANと拡散モデルは、顔深度操作の現実性と制御性を著しく改善した。
プロアクティブディフェンスは、操作が行われる前に画像に敵の摂動を注入することで、この脅威に対処しようとする。
本稿では,AdvErsarial 顔画像がアイデンティティ・シールドのために生成される最初の拡散誘導パラダイムである AEGIS を提案する。
- 参考スコア(独自算出の注目度): 19.56252464382153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in GAN and diffusion models have significantly improved the realism and controllability of facial deepfake manipulation, raising serious concerns regarding privacy, security, and identity misuse. Proactive defenses attempt to counter this threat by injecting adversarial perturbations into images before manipulation takes place. However, existing approaches remain limited in effectiveness due to suboptimal perturbation injection strategies and are typically designed under white-box assumptions, targeting only simple GAN-based attribute editing. These constraints hinder their applicability in practical real-world scenarios. In this paper, we propose AEGIS, the first diffusion-guided paradigm in which the AdvErsarial facial images are Generated for Identity Shielding. We observe that the limited defense capability of existing approaches stems from the peak-clipping constraint, where perturbations are forcibly truncated due to a fixed $L_\infty$-bounded. To overcome this limitation, instead of directly modifying pixels, AEGIS injects adversarial perturbations into the latent space along the DDIM denoising trajectory, thereby decoupling the perturbation magnitude from pixel-level constraints and allowing perturbations to adaptively amplify where most effective. The extensible design of AEGIS allows the defense to be expanded from purely white-box use to also support black-box scenarios through a gradient-estimation strategy. Extensive experiments across GAN and diffusion-based deepfake generators show that AEGIS consistently delivers strong defense effectiveness while maintaining high perceptual quality. In white-box settings, it achieves robust manipulation disruption, whereas in black-box settings, it demonstrates strong cross-model transferability.
- Abstract(参考訳): GANと拡散モデルの最近の進歩は、顔のディープフェイク操作の現実性と制御性を著しく改善し、プライバシー、セキュリティ、アイデンティティの誤用に関する深刻な懸念を提起している。
プロアクティブディフェンスは、操作が行われる前に画像に敵の摂動を注入することで、この脅威に対処しようとする。
しかし、既存のアプローチは、最適摂動注入戦略により有効性に制限されており、通常、単純なGANベースの属性編集のみを対象として、ホワイトボックスの仮定で設計されている。
これらの制約は現実のシナリオにおける適用性を妨げます。
本稿では,AdvErsarial 顔画像がアイデンティティ・シールドのために生成される最初の拡散誘導パラダイムである AEGIS を提案する。
既存のアプローチの限られた防御能力は、固定された$L_\infty$-boundedにより摂動が強制的に停止されるピーククリッピング制約に由来する。
この制限を克服するために、AEGISはピクセルを直接修正するのではなく、DDIMの軌道に沿って潜伏空間に逆方向の摂動を注入することで、ピクセルレベルの制約から摂動の大きさを分離し、摂動を適応的に増幅することができる。
AEGISの拡張可能な設計により、防御を純粋なホワイトボックスの使用から拡張し、勾配推定戦略を通じてブラックボックスシナリオをサポートすることができる。
GANおよび拡散型ディープフェイクジェネレータの広範囲にわたる実験により、AIGISは高い知覚品質を維持しながら、常に強力な防御効果を発揮することが示された。
ホワイトボックス設定では、堅牢な操作操作の中断を実現するが、ブラックボックス設定では、強いモデル間の転送可能性を示す。
関連論文リスト
- Guided Diffusion-based Generation of Adversarial Objects for Real-World Monocular Depth Estimation Attacks [16.675478032732567]
本研究は, 自然主義的, シーン一貫性のある対向オブジェクトを生成する, 学習不要な生成的対向攻撃フレームワークを導入する。
提案手法は, 既存の攻撃に対して, 有効性, ステルス性, 物理的展開性を著しく上回っている。
論文 参考訳(メタデータ) (2025-12-30T09:41:41Z) - An h-space Based Adversarial Attack for Protection Against Few-shot Personalization [5.357486699062561]
本稿では,H空間に基づく摂動を抑えるために,敵の攻撃を利用するHAADという新しいアンチ・カストマイゼーション手法を提案する。
より効率的な変種HAAD-KVを導入し、h-空間のKVパラメータのみに基づいて摂動を構成する。
その単純さにもかかわらず、我々の手法は最先端の敵攻撃よりも優れており、その効果が浮き彫りになっている。
論文 参考訳(メタデータ) (2025-07-23T14:43:22Z) - Improving Black-Box Generative Attacks via Generator Semantic Consistency [51.470649503929344]
ジェネレーティブアタックは テスト時に 1つのフォワードパスで 敵の例を生成する
初期ジェネレータの中間機能をEMA教師に整列させることで意味的整合性を実現する。
我々のアプローチは、ブラックボックス転送の一貫性を保ちながら、既存のジェネレーティブアタックにシームレスに統合することができる。
論文 参考訳(メタデータ) (2025-06-23T02:35:09Z) - FaceShield: Defending Facial Image against Deepfake Threats [11.78218702283404]
FaceShieldは拡散モデル(DM)が生み出すディープフェイクをターゲットとした能動的防御手法である
提案手法は3つの主要要素からなる: (i) DMの注意機構を操作し, 認知過程において保護された顔の特徴を排除し, (ii) 顔の特徴抽出モデルをターゲットとし, 対向的摂動の堅牢性を高める, (iii) ガウス的ぼかしとローパスフィルタリング技術を用いてJPEG圧縮に対する頑健性を高めつつ, 知覚能力を向上させる。
論文 参考訳(メタデータ) (2024-12-13T07:20:35Z) - Adv-Diffusion: Imperceptible Adversarial Face Identity Attack via Latent
Diffusion Model [61.53213964333474]
本稿では,生の画素空間ではなく,潜在空間における非知覚的対角的アイデンティティ摂動を生成できる統一的なフレームワークAdv-Diffusionを提案する。
具体的には,周囲のセマンティックな摂動を生成するために,個人性に敏感な条件付き拡散生成モデルを提案する。
設計された適応強度に基づく対向摂動アルゴリズムは、攻撃の伝達性とステルス性の両方を確保することができる。
論文 参考訳(メタデータ) (2023-12-18T15:25:23Z) - LEAT: Towards Robust Deepfake Disruption in Real-World Scenarios via
Latent Ensemble Attack [11.764601181046496]
生成モデルによって作成された悪意のある視覚コンテンツであるディープフェイクは、社会にますます有害な脅威をもたらす。
近年のディープフェイクの損傷を積極的に軽減するために, 逆方向の摂動を用いてディープフェイクモデルの出力を妨害する研究が進められている。
そこで本研究では,Latent Ensemble ATtack (LEAT) と呼ばれる簡易かつ効果的なディスラプション手法を提案する。
論文 参考訳(メタデータ) (2023-07-04T07:00:37Z) - Ada3Diff: Defending against 3D Adversarial Point Clouds via Adaptive
Diffusion [70.60038549155485]
ディープ3Dポイントクラウドモデルは敵攻撃に敏感であり、自律運転のような安全クリティカルなアプリケーションに脅威をもたらす。
本稿では,適応強度推定器と拡散モデルを用いて,プリスタンデータ分布を再構築できる新しい歪み認識型防衛フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-29T14:32:43Z) - Discriminator-Free Generative Adversarial Attack [87.71852388383242]
生成的ベースの敵攻撃は、この制限を取り除くことができる。
ASymmetric Saliency-based Auto-Encoder (SSAE) は摂動を生成する。
SSAEが生成した敵の例は、広く使われているモデルを崩壊させるだけでなく、優れた視覚的品質を実現する。
論文 参考訳(メタデータ) (2021-07-20T01:55:21Z) - A Perceptual Distortion Reduction Framework for Adversarial Perturbation
Generation [58.6157191438473]
2つの観点からこの問題に対処するための知覚的歪み低減フレームワークを提案する。
知覚的歪みの制約を提案し,それを敵攻撃の客観的機能に追加し,知覚的歪みと攻撃成功率を共同で最適化する。
論文 参考訳(メタデータ) (2021-05-01T15:08:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。