論文の概要: Universal Adversarial Purification with DDIM Metric Loss for Stable Diffusion
- arxiv url: http://arxiv.org/abs/2601.07253v1
- Date: Mon, 12 Jan 2026 06:45:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.250124
- Title: Universal Adversarial Purification with DDIM Metric Loss for Stable Diffusion
- Title(参考訳): 安定拡散のためのDDIM量損失を用いた普遍的対向浄化法
- Authors: Li Zheng, Liangbin Xie, Jiantao Zhou, He YiMin,
- Abstract要約: 敵の浄化は、汚染されたデータから敵のノイズを取り除くことによって、有望な解決策を提供する。
既存の浄化方法はSD固有の敵戦略に対処できない。
SDモデルを対象とした敵攻撃を防御する新しいフレームワークであるUDAP(Universal Diffusion Adversarial Purification)を提案する。
- 参考スコア(独自算出の注目度): 17.61613744087501
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stable Diffusion (SD) often produces degraded outputs when the training dataset contains adversarial noise. Adversarial purification offers a promising solution by removing adversarial noise from contaminated data. However, existing purification methods are primarily designed for classification tasks and fail to address SD-specific adversarial strategies, such as attacks targeting the VAE encoder, UNet denoiser, or both. To address the gap in SD security, we propose Universal Diffusion Adversarial Purification (UDAP), a novel framework tailored for defending adversarial attacks targeting SD models. UDAP leverages the distinct reconstruction behaviors of clean and adversarial images during Denoising Diffusion Implicit Models (DDIM) inversion to optimize the purification process. By minimizing the DDIM metric loss, UDAP can effectively remove adversarial noise. Additionally, we introduce a dynamic epoch adjustment strategy that adapts optimization iterations based on reconstruction errors, significantly improving efficiency without sacrificing purification quality. Experiments demonstrate UDAP's robustness against diverse adversarial methods, including PID (VAE-targeted), Anti-DreamBooth (UNet-targeted), MIST (hybrid), and robustness-enhanced variants like Anti-Diffusion (Anti-DF) and MetaCloak. UDAP also generalizes well across SD versions and text prompts, showcasing its practical applicability in real-world scenarios.
- Abstract(参考訳): 安定拡散(SD)は、トレーニングデータセットが逆方向のノイズを含む場合、しばしば劣化した出力を生成する。
敵の浄化は、汚染されたデータから敵のノイズを取り除くことによって、有望な解決策を提供する。
しかし、既存の浄化方法は、主に分類タスクのために設計されており、VAEエンコーダ、UNet denoiser、またはその両方をターゲットにした攻撃のようなSD固有の敵戦略に対処できない。
SDのセキュリティのギャップに対処するために,SDモデルを対象とした敵攻撃を防御する新しいフレームワークであるユニバーサル拡散逆浄化(UDAP)を提案する。
UDAPは, DIM(Denoising Diffusion Implicit Models)インバージョン中のクリーン画像と逆画像の異なる再構成挙動を利用して, 浄化過程を最適化する。
DDIM測定損失を最小限にすることで、UDAPは敵の雑音を効果的に除去することができる。
さらに,再構成誤差に基づいて最適化繰り返しを適応し,浄化品質を犠牲にすることなく効率を大幅に向上する動的エポック調整手法を導入する。
PID (VAE-targeted)、Anti-DreamBooth (UNet-targeted)、MIST (hybrid)、Anti-DF (Anti-DF) やMetaCloak (MetaCloak) など、様々な敵の手法に対するUDAPの堅牢性を示す実験がある。
UDAPはまた、SDバージョンやテキストプロンプトを多用し、現実のシナリオにおける実用性を示している。
関連論文リスト
- DBLP: Noise Bridge Consistency Distillation For Efficient And Reliable Adversarial Purification [3.8870795921263723]
拡散ブリッジ蒸留法 (DBLP) は, 対向浄化のための新規かつ効率的な拡散ベースフレームワークである。
DBLPは、堅牢な精度、優れた画像品質、約0.2秒の推論時間を実現し、リアルタイムの対向的浄化に向けた重要なステップとなる。
論文 参考訳(メタデータ) (2025-08-01T11:47:36Z) - Restoration Score Distillation: From Corrupted Diffusion Pretraining to One-Step High-Quality Generation [82.39763984380625]
Score Distillation (DSD) の原理的一般化である textitRestoration Score Distillation (RSD) を提案する。
RSDは、ぼやけた画像、不完全画像、低解像度画像など、広範囲の汚職タイプに対応している。
自然と科学の両方のデータセットの様々な復元作業において、教師モデルを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-19T17:21:03Z) - Adversarial Purification by Consistency-aware Latent Space Optimization on Data Manifolds [48.37843602248313]
ディープニューラルネットワーク(DNN)は、クリーンデータに知覚不能な摂動を加えることで作られた敵のサンプルに対して脆弱であり、誤った危険な予測につながる可能性がある。
本稿では、事前学習された一貫性モデルの潜在空間内のベクトルを最適化し、クリーンなデータを復元するためのサンプルを生成する、一貫性モデルに基づく適応的パーフィケーション(CMAP)を提案する。
CMAPは、高い自然な精度を維持しながら、強力な敵攻撃に対する堅牢性を著しく向上させる。
論文 参考訳(メタデータ) (2024-12-11T14:14:02Z) - Classifier Guidance Enhances Diffusion-based Adversarial Purification by Preserving Predictive Information [75.36597470578724]
敵の浄化は、敵の攻撃からニューラルネットワークを守るための有望なアプローチの1つである。
分類器決定境界から遠ざかって, 清浄するgUided Purification (COUP)アルゴリズムを提案する。
実験結果から, COUPは強力な攻撃法でより優れた対向的堅牢性が得られることが示された。
論文 参考訳(メタデータ) (2024-08-12T02:48:00Z) - Towards Understanding the Robustness of Diffusion-Based Purification: A Stochastic Perspective [65.10019978876863]
拡散性浄化(DBP)は、敵の攻撃に対する効果的な防御機構として出現している。
本稿では,DBPプロセスの本質性がロバスト性を駆動する主要な要因であることを示す。
論文 参考訳(メタデータ) (2024-04-22T16:10:38Z) - Universal Adversarial Defense in Remote Sensing Based on Pre-trained Denoising Diffusion Models [17.283914361697818]
深部ニューラルネットワーク(DNN)は、地球観測のための多数のAIアプリケーション(AI4EO)において重要なソリューションとして注目されている。
本稿では、リモートセンシング画像(UAD-RS)における新しいユニバーサル・ディフェンス・アプローチを提案する。
論文 参考訳(メタデータ) (2023-07-31T17:21:23Z) - Guided Diffusion Model for Adversarial Purification [103.4596751105955]
敵攻撃は、様々なアルゴリズムやフレームワークでディープニューラルネットワーク(DNN)を妨害する。
本稿では,GDMP ( Guided diffusion model for purification) と呼ばれる新しい精製法を提案する。
様々なデータセットにわたる包括的実験において,提案したGDMPは,敵対的攻撃によって引き起こされた摂動を浅い範囲に減少させることを示した。
論文 参考訳(メタデータ) (2022-05-30T10:11:15Z) - Diffusion Models for Adversarial Purification [69.1882221038846]
対人浄化(Adrial purification)とは、生成モデルを用いて敵の摂動を除去する防衛方法の分類である。
そこで我々は,拡散モデルを用いたDiffPureを提案する。
提案手法は,現在の対人訓練および対人浄化方法よりも優れ,最先端の成果を達成する。
論文 参考訳(メタデータ) (2022-05-16T06:03:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。