論文の概要: Instant Adversarial Purification with Adversarial Consistency Distillation
- arxiv url: http://arxiv.org/abs/2408.17064v3
- Date: Fri, 21 Mar 2025 13:58:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-24 14:54:44.753633
- Title: Instant Adversarial Purification with Adversarial Consistency Distillation
- Title(参考訳): 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳
- Authors: Chun Tong Lei, Hon Ming Yam, Zhongliang Guo, Yifei Qian, Chun Pong Lau,
- Abstract要約: One Step Control Purification (OSCP) は、単一の神経機能評価において頑健な敵の浄化を実現する新しい防御フレームワークである。
ImageNetの実験結果はOSCPの優れた性能を示し、74.19%の防衛成功率を達成し、純度は0.1秒に過ぎなかった。
- 参考スコア(独自算出の注目度): 1.3165428727965363
- License:
- Abstract: Neural networks have revolutionized numerous fields with their exceptional performance, yet they remain susceptible to adversarial attacks through subtle perturbations. While diffusion-based purification methods like DiffPure offer promising defense mechanisms, their computational overhead presents a significant practical limitation. In this paper, we introduce One Step Control Purification (OSCP), a novel defense framework that achieves robust adversarial purification in a single Neural Function Evaluation (NFE) within diffusion models. We propose Gaussian Adversarial Noise Distillation (GAND) as the distillation objective and Controlled Adversarial Purification (CAP) as the inference pipeline, which makes OSCP demonstrate remarkable efficiency while maintaining defense efficacy. Our proposed GAND addresses a fundamental tension between consistency distillation and adversarial perturbation, bridging the gap between natural and adversarial manifolds in the latent space, while remaining computationally efficient through Parameter-Efficient Fine-Tuning (PEFT) methods such as LoRA, eliminating the high computational budget request from full parameter fine-tuning. The CAP guides the purification process through the unlearnable edge detection operator calculated by the input image as an extra prompt, effectively preventing the purified images from deviating from their original appearance when large purification steps are used. Our experimental results on ImageNet showcase OSCP's superior performance, achieving a 74.19% defense success rate with merely 0.1s per purification -- a 100-fold speedup compared to conventional approaches.
- Abstract(参考訳): ニューラルネットワークはその例外的な性能で多くの分野に革命をもたらしたが、微妙な摂動によって敵の攻撃を受けやすいままである。
DiffPureのような拡散処理による浄化手法は防御機構を期待できるが、その計算オーバーヘッドは重大な実用的限界を示す。
本稿では,拡散モデル内の単一神経機能評価(NFE)において,堅牢な対向的浄化を実現する新しい防御フレームワークであるOne Step Control Purification(OSCP)を紹介する。
本稿では, 蒸留目的としてガウス適応ノイズ蒸留(GAND), 推論パイプラインとして制御逆浄化(CAP)を提案し, 防御効果を維持しながらOSCPが顕著な効率性を示した。
提案したGANDは,LRAのようなパラメータ効率のよい細調整(PEFT)手法により計算効率を保ちながら,不整合蒸留と逆方向の摂動の基本的な張力に対処し,全パラメータの微調整から高い計算予算要求を排除した。
CAPは、入力画像によって算出された未開きエッジ検出演算子を介して、余分なプロンプトとして浄化過程を導出し、大きな浄化工程を使用する場合に、精製された画像が元の外観から逸脱することを効果的に防止する。
ImageNetの実験結果は、OSCPの優れた性能を示し、74.19%の防衛成功率、精製当たり0.1秒という従来のアプローチと比べて100倍のスピードアップを達成した。
関連論文リスト
- FADA: Fast Diffusion Avatar Synthesis with Mixed-Supervised Multi-CFG Distillation [55.424665700339695]
拡散に基づく音声駆動型アバター手法は近年,高忠実で鮮明で表現力のある結果に注目されている。
拡散モデルの様々な蒸留技術が開発されているにもかかわらず, 自然拡散蒸留法では良好な結果が得られないことがわかった。
本稿では,FADA (Fast Diffusion Avatar Synthesis with Mixed-Supervised Multi-CFG Distillation) を提案する。
論文 参考訳(メタデータ) (2024-12-22T08:19:22Z) - LoRID: Low-Rank Iterative Diffusion for Adversarial Purification [3.735798190358]
本研究は拡散に基づく浄化法に関する情報理論的な考察である。
内在的浄化誤差の低い対向摂動を除去する新しい低ランク反復拡散浄化法であるLoRIDを導入する。
LoRIDは、ホワイトボックスとブラックボックスの設定の両方で、CIFAR-10/100、CelebA-HQ、ImageNetデータセットで優れた堅牢性を実現する。
論文 参考訳(メタデータ) (2024-09-12T17:51:25Z) - Classifier Guidance Enhances Diffusion-based Adversarial Purification by Preserving Predictive Information [75.36597470578724]
敵の浄化は、敵の攻撃からニューラルネットワークを守るための有望なアプローチの1つである。
分類器決定境界から遠ざかって, 清浄するgUided Purification (COUP)アルゴリズムを提案する。
実験結果から, COUPは強力な攻撃法でより優れた対向的堅牢性が得られることが示された。
論文 参考訳(メタデータ) (2024-08-12T02:48:00Z) - Consistency Purification: Effective and Efficient Diffusion Purification towards Certified Robustness [28.09748997491938]
本報告では, 従来よりも効率効率の良い優れた浄化器である一貫性浄化について紹介する。
整合性モデルはPF-ODEから抽出した一段階生成モデルであり、単一のネットワーク評価で1次元の純化画像を生成することができる。
総合的な実験により,我々の整合性浄化フレームワークは,ベースライン法と比較して,最先端の信頼性の高いロバスト性と効率性を実現していることが示された。
論文 参考訳(メタデータ) (2024-06-30T08:34:35Z) - Distilling Diffusion Models into Conditional GANs [90.76040478677609]
複雑な多段階拡散モデルを1段階条件付きGAN学生モデルに蒸留する。
E-LatentLPIPSは,拡散モデルの潜在空間で直接動作する知覚的損失である。
我々は, 最先端の1ステップ拡散蒸留モデルよりも優れた1ステップ発生器を実証した。
論文 参考訳(メタデータ) (2024-05-09T17:59:40Z) - MimicDiffusion: Purifying Adversarial Perturbation via Mimicking Clean
Diffusion Model [8.695439655048634]
拡散に基づく逆方向の浄化は、拡散モデルを用いて敵方向の攻撃に対してクリーンな画像を生成することに焦点を当てる。
そこで我々は,拡散モデルの生成過程を直接近似し,クリーンな画像を入力としてミミディフュージョン(MimicDiffusion)を提案する。
3つの画像データセットの実験により、MimicDiffusionは最先端のベースラインよりも大幅にパフォーマンスが向上していることが示された。
論文 参考訳(メタデータ) (2023-12-08T02:32:47Z) - Purify++: Improving Diffusion-Purification with Advanced Diffusion
Models and Control of Randomness [22.87882885963586]
敵攻撃に対する防御はAIの安全性にとって重要である。
敵の浄化は、敵の攻撃を適切な前処理で防御するアプローチのファミリーである。
そこで我々は,新たな拡散浄化アルゴリズムであるPurify++を提案する。
論文 参考訳(メタデータ) (2023-10-28T17:18:38Z) - Guided Diffusion Model for Adversarial Purification [103.4596751105955]
敵攻撃は、様々なアルゴリズムやフレームワークでディープニューラルネットワーク(DNN)を妨害する。
本稿では,GDMP ( Guided diffusion model for purification) と呼ばれる新しい精製法を提案する。
様々なデータセットにわたる包括的実験において,提案したGDMPは,敵対的攻撃によって引き起こされた摂動を浅い範囲に減少させることを示した。
論文 参考訳(メタデータ) (2022-05-30T10:11:15Z) - Diffusion Models for Adversarial Purification [69.1882221038846]
対人浄化(Adrial purification)とは、生成モデルを用いて敵の摂動を除去する防衛方法の分類である。
そこで我々は,拡散モデルを用いたDiffPureを提案する。
提案手法は,現在の対人訓練および対人浄化方法よりも優れ,最先端の成果を達成する。
論文 参考訳(メタデータ) (2022-05-16T06:03:00Z) - Adversarial purification with Score-based generative models [56.88185136509654]
本稿では,DSM(Denoising Score-Matching)を訓練したEMMに基づく新しい逆浄化法を提案する。
本稿では,画像にランダムノイズを注入する簡易で効果的なランダム化浄化手法を提案する。
精製法は様々な攻撃に対して堅牢であり,その最先端性能を示す。
論文 参考訳(メタデータ) (2021-06-11T04:35:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。