論文の概要: Adv-TGD: Adversarial Text-Guided Diffusion for Face Recognition Impersonation Attacks
- arxiv url: http://arxiv.org/abs/2606.11615v2
- Date: Tue, 16 Jun 2026 23:04:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 13:57:35.015672
- Title: Adv-TGD: Adversarial Text-Guided Diffusion for Face Recognition Impersonation Attacks
- Title(参考訳): Adv-TGD: 顔認証におけるテキスト誘導拡散
- Authors: Omid Ahmadieh, Nima Karimian,
- Abstract要約: 本稿では,ジェネレーティブ・アタック・フレームワークであるAdv-TGDを提案する。
ターゲットのアイデンティティを偽装し、顔認識システムを欺くことができる光現実的な顔を合成する。
Adv-TGDは、IR152、IRSE50、MobileFace、FaceNetで平均攻撃成功率(ASR)が85.90%に達する。
- 参考スコア(独自算出の注目度): 2.1485350418225244
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The widespread adoption of face recognition (FR) technologies raises serious privacy concerns, as facial data can be exploited without consent. To address this challenge, we propose Adv-TGD, a generative adversarial attack framework that synthesizes photorealistic faces capable of impersonating target identities and deceiving face recognition systems. Built upon Stable Diffusion v2.1, Adv-TGD performs per-sample LoRA fine-tuning conditioned on concise textual prompts to generate natural yet adversarially manipulated identities. Unlike conventional identity attack approaches, our method optimizes lightweight cross-attention adapters for each source-target pair within a fixed-timestep denoising process. Latent blending is constrained by a face-local heatmap mask to ensure spatially precise identity manipulation while preserving non-sensitive regions. We introduce a composite objective that integrates masked epsilon-MSE reconstruction, thresholded identity divergence in FR embedding space, directional feature alignment, and source-similarity suppression to balance adversarial attack and visual realism. Optionally, LLaVA-generated attribute prompts enhance fine-grained semantic details without reintroducing identity cues. Under the black-box evaluation protocol, Adv-TGD attains an average attack success rate (ASR) of 85.90% across IR152, IRSE50, MobileFace, and FaceNet, surpassing the semantic SOTA baseline Adv-CPG by 6.25 points, the diffusion-based makeup method DiffAIM by 3 points, and the noise-based P3-Mask by 16 points. Despite its strong attack efficacy, Adv-TGD preserves high visual fidelity (PSNR = 28.18 dB, SSIM = 0.981). Furthermore, we demonstrate the flexibility of our framework by successfully extending it to in-the-wild datasets (LADN), general object classification (ImageNet), and transformer-based diffusion models (FLUX.1).
- Abstract(参考訳): 顔認識(FR)技術の普及により、顔認識データが同意なく活用されるため、深刻なプライバシー上の懸念が生じる。
この課題に対処するために、ターゲットのアイデンティティを偽装し、顔認識システムを欺くことができるフォトリアリスティック顔を合成する生成的対向攻撃フレームワークAdv-TGDを提案する。
安定拡散 v2.1 に基づいて、Adv-TGD は簡潔なテキストプロンプトに基づくサンプルごとのLORA微調整を実行し、自然に反抗的に操作されたIDを生成する。
従来のアイデンティティアタック手法とは異なり,本手法では,固定時間段階のデノナイズプロセスにおいて,各ソースとターゲットのペアに対して,軽量なクロスアテンションアダプタを最適化する。
潜水ブレンディングは、非感性領域を保持しながら空間的に正確なアイデンティティ操作を確保するために、面局所ヒートマップマスクによって拘束される。
本研究では,マスク付きエプシロン-MSE再構成,FR埋め込み空間におけるしきい値の偏差,指向性特徴アライメント,ソース類似性抑制を統合して,対向攻撃と視覚リアリズムのバランスをとる複合目標を提案する。
オプションとして、LLaVA生成属性は、アイデンティティーキューを再導入することなく、きめ細かなセマンティック詳細を促進させる。
ブラックボックス評価プロトコルの下で、Adv-TGDはIR152、IRSE50、MobileFace、FaceNetで平均攻撃成功率85.90%に達し、意味的なSOTAベースラインAdv-CPGを6.25ポイント、拡散ベースのメイクメソッドDiffAIMを3ポイント、ノイズベースのP3-Maskを16ポイント超えた。
強力な攻撃効果にもかかわらず、Adv-TGDは高い視力を維持する(PSNR = 28.18 dB、SSIM = 0.981)。
さらに,このフレームワークの柔軟性を,組込みデータセット(LADN),汎用オブジェクト分類(ImageNet),トランスフォーマーベース拡散モデル(FLUX.1)に拡張することで実証する。
関連論文リスト
- Face inpainting with Identity Preserving Latent Diffusion Models [10.348748950921667]
ID-ControlNetは、潜伏拡散モデルに基づいて構築された、ID保存のフェイスペイントフレームワークである。
我々は、生成した顔とターゲットの識別表現とのアライメントを明確に強制する、アイデンティティ一貫性と三重項損失トレーニング戦略を導入する。
論文 参考訳(メタデータ) (2026-05-15T23:19:43Z) - SIDeR: Semantic Identity Decoupling for Unrestricted Face Privacy [53.75084833636302]
本稿では,非制限顔プライバシー保護のためのセマンティックデカップリング駆動フレームワークSIDeRを提案する。
SIDeRは、顔画像をマシン認識可能な識別特徴ベクトルと視覚的に知覚可能なセマンティックな外観成分に分解する。
認証されたアクセスのために、SIDeRは正しいパスワードが提供されるときに元の形式に復元できる。
論文 参考訳(メタデータ) (2026-02-04T19:30:48Z) - A Dual-Branch CNN for Robust Detection of AI-Generated Facial Forgeries [4.313893060699182]
顔偽造技術は、AIセキュリティ、デジタルメディアの完全性、および公的な信頼に重大な脅威をもたらす。
顔偽造検出のための新しい二分岐畳み込みニューラルネットワークを提案する。
4つの代表法から生成された鍛造画像を含むDiFFベンチマークを用いて,本モデルの評価を行った。
論文 参考訳(メタデータ) (2025-10-28T17:06:40Z) - Diffusion-based Adversarial Identity Manipulation for Facial Privacy Protection [14.797807196805607]
顔認識は、ソーシャルネットワーク上での不正な監視とユーザー追跡によって、深刻なプライバシー上の懸念を引き起こしている。
既存のプライバシーを強化する方法は、顔のプライバシーを保護する自然な顔画像を生成するのに失敗する。
そこで我々はDiffAIMを提案し、悪意のあるFRシステムに対して自然かつ高度に伝達可能な対向顔を生成する。
論文 参考訳(メタデータ) (2025-04-30T13:49:59Z) - ID$^3$: Identity-Preserving-yet-Diversified Diffusion Models for Synthetic Face Recognition [60.15830516741776]
合成顔認識(SFR)は、実際の顔データの分布を模倣するデータセットを生成することを目的としている。
拡散燃料SFRモデルであるtextID3$を紹介します。
textID3$はID保存損失を利用して、多様だがアイデンティティに一貫性のある顔の外観を生成する。
論文 参考訳(メタデータ) (2024-09-26T06:46:40Z) - Adv-Diffusion: Imperceptible Adversarial Face Identity Attack via Latent
Diffusion Model [61.53213964333474]
本稿では,生の画素空間ではなく,潜在空間における非知覚的対角的アイデンティティ摂動を生成できる統一的なフレームワークAdv-Diffusionを提案する。
具体的には,周囲のセマンティックな摂動を生成するために,個人性に敏感な条件付き拡散生成モデルを提案する。
設計された適応強度に基づく対向摂動アルゴリズムは、攻撃の伝達性とステルス性の両方を確保することができる。
論文 参考訳(メタデータ) (2023-12-18T15:25:23Z) - Attribute-Guided Encryption with Facial Texture Masking [64.77548539959501]
本稿では,顔認識システムからユーザを保護するために,顔テクスチャマスキングを用いた属性ガイド暗号化を提案する。
提案手法は,最先端の手法よりも自然な画像を生成する。
論文 参考訳(メタデータ) (2023-05-22T23:50:43Z) - Dual Spoof Disentanglement Generation for Face Anti-spoofing with Depth
Uncertainty Learning [54.15303628138665]
フェース・アンチ・スプーフィング(FAS)は、顔認識システムが提示攻撃を防ぐ上で重要な役割を担っている。
既存のフェース・アンチ・スプーフィング・データセットは、アイデンティティと重要なばらつきが不十分なため、多様性を欠いている。
我々は「生成によるアンチ・スプーフィング」によりこの問題に対処するデュアル・スポット・ディアンタングメント・ジェネレーション・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-01T15:36:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。