論文の概要: Instant Adversarial Purification with Adversarial Consistency Distillation
- arxiv url: http://arxiv.org/abs/2408.17064v3
- Date: Fri, 21 Mar 2025 13:58:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-24 15:40:09.722675
- Title: Instant Adversarial Purification with Adversarial Consistency Distillation
- Title(参考訳): 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳 対訳
- Authors: Chun Tong Lei, Hon Ming Yam, Zhongliang Guo, Yifei Qian, Chun Pong Lau,
- Abstract要約: One Step Control Purification (OSCP) は、単一の神経機能評価において頑健な敵の浄化を実現する新しい防御フレームワークである。
ImageNetの実験結果はOSCPの優れた性能を示し、74.19%の防衛成功率を達成し、純度は0.1秒に過ぎなかった。
- 参考スコア(独自算出の注目度): 1.3165428727965363
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural networks have revolutionized numerous fields with their exceptional performance, yet they remain susceptible to adversarial attacks through subtle perturbations. While diffusion-based purification methods like DiffPure offer promising defense mechanisms, their computational overhead presents a significant practical limitation. In this paper, we introduce One Step Control Purification (OSCP), a novel defense framework that achieves robust adversarial purification in a single Neural Function Evaluation (NFE) within diffusion models. We propose Gaussian Adversarial Noise Distillation (GAND) as the distillation objective and Controlled Adversarial Purification (CAP) as the inference pipeline, which makes OSCP demonstrate remarkable efficiency while maintaining defense efficacy. Our proposed GAND addresses a fundamental tension between consistency distillation and adversarial perturbation, bridging the gap between natural and adversarial manifolds in the latent space, while remaining computationally efficient through Parameter-Efficient Fine-Tuning (PEFT) methods such as LoRA, eliminating the high computational budget request from full parameter fine-tuning. The CAP guides the purification process through the unlearnable edge detection operator calculated by the input image as an extra prompt, effectively preventing the purified images from deviating from their original appearance when large purification steps are used. Our experimental results on ImageNet showcase OSCP's superior performance, achieving a 74.19% defense success rate with merely 0.1s per purification -- a 100-fold speedup compared to conventional approaches.
- Abstract(参考訳): ニューラルネットワークはその例外的な性能で多くの分野に革命をもたらしたが、微妙な摂動によって敵の攻撃を受けやすいままである。
DiffPureのような拡散処理による浄化手法は防御機構を期待できるが、その計算オーバーヘッドは重大な実用的限界を示す。
本稿では,拡散モデル内の単一神経機能評価(NFE)において,堅牢な対向的浄化を実現する新しい防御フレームワークであるOne Step Control Purification(OSCP)を紹介する。
本稿では, 蒸留目的としてガウス適応ノイズ蒸留(GAND), 推論パイプラインとして制御逆浄化(CAP)を提案し, 防御効果を維持しながらOSCPが顕著な効率性を示した。
提案したGANDは,LRAのようなパラメータ効率のよい細調整(PEFT)手法により計算効率を保ちながら,不整合蒸留と逆方向の摂動の基本的な張力に対処し,全パラメータの微調整から高い計算予算要求を排除した。
CAPは、入力画像によって算出された未開きエッジ検出演算子を介して、余分なプロンプトとして浄化過程を導出し、大きな浄化工程を使用する場合に、精製された画像が元の外観から逸脱することを効果的に防止する。
ImageNetの実験結果は、OSCPの優れた性能を示し、74.19%の防衛成功率、精製当たり0.1秒という従来のアプローチと比べて100倍のスピードアップを達成した。
関連論文リスト
- Divide and Conquer: Heterogeneous Noise Integration for Diffusion-based Adversarial Purification [75.09791002021947]
既存の浄化法は,前向き拡散過程を通じて一定のノイズを発生させ,その後に逆の処理を行い,クリーンな例を回復させることによって,対向的摂動を妨害することを目的としている。
この方法は、前処理の均一な操作が、対向的摂動と闘いながら通常のピクセルを損なうため、根本的な欠陥がある。
ニューラルネットワークの解釈可能性に基づく異種浄化戦略を提案する。
本手法は,被写体モデルが注目する特定の画素に対して高強度雑音を決定的に印加する一方,残りの画素は低強度雑音のみを被写体とする。
論文 参考訳(メタデータ) (2025-03-03T11:00:25Z) - LoRID: Low-Rank Iterative Diffusion for Adversarial Purification [3.735798190358]
本研究は拡散に基づく浄化法に関する情報理論的な考察である。
内在的浄化誤差の低い対向摂動を除去する新しい低ランク反復拡散浄化法であるLoRIDを導入する。
LoRIDは、ホワイトボックスとブラックボックスの設定の両方で、CIFAR-10/100、CelebA-HQ、ImageNetデータセットで優れた堅牢性を実現する。
論文 参考訳(メタデータ) (2024-09-12T17:51:25Z) - Classifier Guidance Enhances Diffusion-based Adversarial Purification by Preserving Predictive Information [75.36597470578724]
敵の浄化は、敵の攻撃からニューラルネットワークを守るための有望なアプローチの1つである。
分類器決定境界から遠ざかって, 清浄するgUided Purification (COUP)アルゴリズムを提案する。
実験結果から, COUPは強力な攻撃法でより優れた対向的堅牢性が得られることが示された。
論文 参考訳(メタデータ) (2024-08-12T02:48:00Z) - Consistency Purification: Effective and Efficient Diffusion Purification towards Certified Robustness [28.09748997491938]
本報告では, 従来よりも効率効率の良い優れた浄化器である一貫性浄化について紹介する。
整合性モデルはPF-ODEから抽出した一段階生成モデルであり、単一のネットワーク評価で1次元の純化画像を生成することができる。
総合的な実験により,我々の整合性浄化フレームワークは,ベースライン法と比較して,最先端の信頼性の高いロバスト性と効率性を実現していることが示された。
論文 参考訳(メタデータ) (2024-06-30T08:34:35Z) - Distilling Diffusion Models into Conditional GANs [90.76040478677609]
複雑な多段階拡散モデルを1段階条件付きGAN学生モデルに蒸留する。
E-LatentLPIPSは,拡散モデルの潜在空間で直接動作する知覚的損失である。
我々は, 最先端の1ステップ拡散蒸留モデルよりも優れた1ステップ発生器を実証した。
論文 参考訳(メタデータ) (2024-05-09T17:59:40Z) - Towards Understanding the Robustness of Diffusion-Based Purification: A Stochastic Perspective [65.10019978876863]
拡散性浄化(DBP)は、敵の攻撃に対する効果的な防御機構として出現している。
本稿では,DBPプロセスの本質性がロバスト性を駆動する主要な要因であることを示す。
論文 参考訳(メタデータ) (2024-04-22T16:10:38Z) - MimicDiffusion: Purifying Adversarial Perturbation via Mimicking Clean
Diffusion Model [8.695439655048634]
拡散に基づく逆方向の浄化は、拡散モデルを用いて敵方向の攻撃に対してクリーンな画像を生成することに焦点を当てる。
そこで我々は,拡散モデルの生成過程を直接近似し,クリーンな画像を入力としてミミディフュージョン(MimicDiffusion)を提案する。
3つの画像データセットの実験により、MimicDiffusionは最先端のベースラインよりも大幅にパフォーマンスが向上していることが示された。
論文 参考訳(メタデータ) (2023-12-08T02:32:47Z) - Purify++: Improving Diffusion-Purification with Advanced Diffusion
Models and Control of Randomness [22.87882885963586]
敵攻撃に対する防御はAIの安全性にとって重要である。
敵の浄化は、敵の攻撃を適切な前処理で防御するアプローチのファミリーである。
そこで我々は,新たな拡散浄化アルゴリズムであるPurify++を提案する。
論文 参考訳(メタデータ) (2023-10-28T17:18:38Z) - DiffAttack: Evasion Attacks Against Diffusion-Based Adversarial
Purification [63.65630243675792]
拡散に基づく浄化防御は拡散モデルを利用して、敵の例の人工摂動を除去する。
近年の研究では、先進的な攻撃でさえ、そのような防御を効果的に破壊できないことが示されている。
拡散型浄化防衛を効果的かつ効率的に行うための統合フレームワークDiffAttackを提案する。
論文 参考訳(メタデータ) (2023-10-27T15:17:50Z) - Noise-Free Score Distillation [78.79226724549456]
ノイズフリースコア蒸留(NFSD)プロセスは、オリジナルのSDSフレームワークに最小限の変更を必要とする。
我々は,CFG尺度を用いて,事前学習したテキスト・画像拡散モデルのより効果的な蒸留を行う。
論文 参考訳(メタデータ) (2023-10-26T17:12:26Z) - Enhancing Adversarial Robustness via Score-Based Optimization [22.87882885963586]
敵対的攻撃は、わずかな摂動を導入することによって、ディープニューラルネットワーク分類器を誤認する可能性がある。
ScoreOptと呼ばれる新しい対向防御方式を導入し、テスト時に対向サンプルを最適化する。
実験の結果,本手法は性能とロバスト性の両方において,既存の敵防御よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-07-10T03:59:42Z) - Guided Diffusion Model for Adversarial Purification [103.4596751105955]
敵攻撃は、様々なアルゴリズムやフレームワークでディープニューラルネットワーク(DNN)を妨害する。
本稿では,GDMP ( Guided diffusion model for purification) と呼ばれる新しい精製法を提案する。
様々なデータセットにわたる包括的実験において,提案したGDMPは,敵対的攻撃によって引き起こされた摂動を浅い範囲に減少させることを示した。
論文 参考訳(メタデータ) (2022-05-30T10:11:15Z) - Diffusion Models for Adversarial Purification [69.1882221038846]
対人浄化(Adrial purification)とは、生成モデルを用いて敵の摂動を除去する防衛方法の分類である。
そこで我々は,拡散モデルを用いたDiffPureを提案する。
提案手法は,現在の対人訓練および対人浄化方法よりも優れ,最先端の成果を達成する。
論文 参考訳(メタデータ) (2022-05-16T06:03:00Z) - Adversarial purification with Score-based generative models [56.88185136509654]
本稿では,DSM(Denoising Score-Matching)を訓練したEMMに基づく新しい逆浄化法を提案する。
本稿では,画像にランダムノイズを注入する簡易で効果的なランダム化浄化手法を提案する。
精製法は様々な攻撃に対して堅牢であり,その最先端性能を示す。
論文 参考訳(メタデータ) (2021-06-11T04:35:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。