Fugu-MT 論文翻訳(概要): Carefully Blending Adversarial Training and Purification Improves Adversarial Robustness

論文の概要: Carefully Blending Adversarial Training and Purification Improves Adversarial Robustness

arxiv url: http://arxiv.org/abs/2306.06081v4
Date: Thu, 23 May 2024 04:01:22 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-26 21:22:37.378935
Title: Carefully Blending Adversarial Training and Purification Improves Adversarial Robustness
Title（参考訳）: 逆行性学習と浄化が逆行性ロバスト性を改善する
Authors: Emanuele Ballarin, Alessio Ansuini, Luca Bortolussi,
Abstract要約: CARSOは、防御のために考案された適応的なエンドツーエンドのホワイトボックス攻撃から自身を守ることができる。提案手法はCIFAR-10, CIFAR-100, TinyImageNet-200の最先端技術により改善されている。
参考スコア（独自算出の注目度）: 1.2289361708127877
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: In this work, we propose a novel adversarial defence mechanism for image classification - CARSO - blending the paradigms of adversarial training and adversarial purification in a synergistic robustness-enhancing way. The method builds upon an adversarially-trained classifier, and learns to map its internal representation associated with a potentially perturbed input onto a distribution of tentative clean reconstructions. Multiple samples from such distribution are classified by the same adversarially-trained model, and an aggregation of its outputs finally constitutes the robust prediction of interest. Experimental evaluation by a well-established benchmark of strong adaptive attacks, across different image datasets, shows that CARSO is able to defend itself against adaptive end-to-end white-box attacks devised for stochastic defences. Paying a modest clean accuracy toll, our method improves by a significant margin the state-of-the-art for CIFAR-10, CIFAR-100, and TinyImageNet-200 $\ell_\infty$ robust classification accuracy against AutoAttack. Code, and instructions to obtain pre-trained models are available at https://github.com/emaballarin/CARSO .
Abstract（参考訳）: 本研究では,画像分類のための新たな対角防御機構であるCARSOを提案する。この手法は、逆向きに訓練された分類器の上に構築され、潜在的に摂動された入力に関連する内部表現を暫定的なクリーンな再構成の分布にマッピングすることを学ぶ。このような分布から得られた複数のサンプルは、同じ逆向きに訓練されたモデルによって分類され、その出力の集約が最終的に関心の頑健な予測を構成する。 CARSOは、確率的防御のために考案された適応的なエンドツーエンドのホワイトボックス攻撃から自身を守ることができることを示している。 CIFAR-10, CIFAR-100, TinyImageNet-200 $\ell_\infty$ robust classification accuracy against AutoAttack。トレーニング済みのモデルを取得するためのコードと命令はhttps://github.com/emaballarin/CARSO で公開されている。

関連論文リスト

A Robust Adversarial Ensemble with Causal (Feature Interaction) Interpretations for Image Classification [9.945272787814941]
本稿では,識別的特徴と生成的モデルを組み合わせた深層アンサンブルモデルを提案する。提案手法は,特徴抽出のためのボトムレベル事前学習型識別ネットワークと,逆入力分布をモデル化したトップレベル生成型分類ネットワークを統合する。
論文参考訳（メタデータ） (2024-12-28T05:06:20Z)
New Paradigm of Adversarial Training: Breaking Inherent Trade-Off between Accuracy and Robustness via Dummy Classes [11.694880978089852]
対人訓練(AT)は、DNNの堅牢性を高める最も効果的な方法の1つである。既存のAT手法は、対向的堅牢性とクリーンな精度の間の本質的にのトレードオフに悩まされる。そこで本研究では,各オリジナルクラスに対してダミークラスを追加することで,新たなATパラダイムを提案する。
論文参考訳（メタデータ） (2024-10-16T15:36:10Z)
Classifier Guidance Enhances Diffusion-based Adversarial Purification by Preserving Predictive Information [75.36597470578724]
敵の浄化は、敵の攻撃からニューラルネットワークを守るための有望なアプローチの1つである。分類器決定境界から遠ざかって, 清浄するgUided Purification (COUP)アルゴリズムを提案する。実験結果から, COUPは強力な攻撃法でより優れた対向的堅牢性が得られることが示された。
論文参考訳（メタデータ） (2024-08-12T02:48:00Z)
ZeroPur: Succinct Training-Free Adversarial Purification [52.963392510839284]
敵の粛清は、様々な目に見えない敵の攻撃を防御できる防衛計算手法の一種である。我々は、ZeroPurと呼ばれる、逆画像の浄化を更なる訓練なしに簡単な逆画像浄化法を提案する。
論文参考訳（メタデータ） (2024-06-05T10:58:15Z)
FACTUAL: A Novel Framework for Contrastive Learning Based Robust SAR Image Classification [10.911464455072391]
FACTUALは、逆行訓練と堅牢なSAR分類のためのコントラストラーニングフレームワークである。本モデルでは, 洗浄試料の99.7%, 摂動試料の89.6%の精度が得られた。
論文参考訳（メタデータ） (2024-04-04T06:20:22Z)
Pre-trained Model Guided Fine-Tuning for Zero-Shot Adversarial Robustness [52.9493817508055]
我々は,モデルがゼロショットの逆方向のロバスト性を高めるために,事前訓練されたモデル誘導逆方向の微調整(PMG-AFT)を提案する。私たちのアプローチは、平均8.72%のクリーンな精度を継続的に改善します。
論文参考訳（メタデータ） (2024-01-09T04:33:03Z)
Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文参考訳（メタデータ） (2023-12-27T09:03:43Z)
Resisting Adversarial Attacks in Deep Neural Networks using Diverse Decision Boundaries [12.312877365123267]
深層学習システムは、人間の目には認識できないが、モデルが誤分類される可能性がある、人工的な敵の例に弱い。我々は,オリジナルモデルに対する多様な決定境界を持つディフェンダーモデルを構築するための,アンサンブルに基づく新しいソリューションを開発した。我々は、MNIST、CIFAR-10、CIFAR-100といった標準画像分類データセットを用いて、最先端の敵攻撃に対する広範な実験を行った。
論文参考訳（メタデータ） (2022-08-18T08:19:26Z)
Diffusion Models for Adversarial Purification [69.1882221038846]
対人浄化(Adrial purification)とは、生成モデルを用いて敵の摂動を除去する防衛方法の分類である。そこで我々は,拡散モデルを用いたDiffPureを提案する。提案手法は,現在の対人訓練および対人浄化方法よりも優れ,最先端の成果を達成する。
論文参考訳（メタデータ） (2022-05-16T06:03:00Z)
Robustness through Cognitive Dissociation Mitigation in Contrastive Adversarial Training [2.538209532048867]
本稿では,新たなニューラルネットワークトレーニングフレームワークを提案する。本稿では,データ拡張と対向的摂動の両面に一貫性のある特徴表現を学習することで,敵攻撃に対するモデルロバスト性を改善することを提案する。我々は,CIFAR-10データセットを用いて,教師付きおよび自己教師付き対向学習法よりも頑健な精度とクリーンな精度を両立させる手法を検証する。
論文参考訳（メタデータ） (2022-03-16T21:41:27Z)
PARL: Enhancing Diversity of Ensemble Networks to Resist Adversarial Attacks via Pairwise Adversarially Robust Loss Function [13.417003144007156]
敵の攻撃は転送可能性の原理に依存する傾向があります敵攻撃に対するアンサンブル法は、敵の例が複数の分類器を誤解させる可能性が低いことを示す。最近のアンサンブル法は、より強い敵に弱いか、エンドツーエンドの評価が欠如していることが示されている。
論文参考訳（メタデータ） (2021-12-09T14:26:13Z)
Towards A Conceptually Simple Defensive Approach for Few-shot classifiers Against Adversarial Support Samples [107.38834819682315]
本研究は,数発の分類器を敵攻撃から守るための概念的簡便なアプローチについて検討する。本稿では,自己相似性とフィルタリングの概念を用いた簡易な攻撃非依存検出法を提案する。ミニイメージネット(MI)とCUBデータセットの攻撃検出性能は良好である。
論文参考訳（メタデータ） (2021-10-24T05:46:03Z)
Robustness-via-Synthesis: Robust Training with Generative Adversarial Perturbations [10.140147080535224]
先制攻撃による敵の訓練は、今日の敵の摂動に対する最も効果的な防御の1つである。本研究では, 逆方向の摂動を自動的にランダムなベクトルから生成ネットワークを用いて合成する頑健な学習アルゴリズムを提案する。実験結果から, 提案手法は様々な勾配に基づく, 生成的ロバストトレーニング手法により, 同等のロバスト性が得られることがわかった。
論文参考訳（メタデータ） (2021-08-22T13:15:24Z)
Adaptive Feature Alignment for Adversarial Training [56.17654691470554]
CNNは通常、敵攻撃に対して脆弱であり、セキュリティに敏感なアプリケーションに脅威をもたらす。任意の攻撃強度の特徴を生成するための適応的特徴アライメント(AFA)を提案する。本手法は任意の攻撃強度の特徴を自動的に整列するように訓練されている。
論文参考訳（メタデータ） (2021-05-31T17:01:05Z)
Combating Adversaries with Anti-Adversaries [118.70141983415445]
特に、我々の層は、逆の層とは反対の方向に入力摂動を生成します。我々は,我々の階層と名目および頑健に訓練されたモデルを組み合わせることで,我々のアプローチの有効性を検証する。我々の対向層は、クリーンな精度でコストを伴わずにモデルロバスト性を著しく向上させる。
論文参考訳（メタデータ） (2021-03-26T09:36:59Z)
How Robust are Randomized Smoothing based Defenses to Data Poisoning? [66.80663779176979]
我々は、トレーニングデータの品質の重要性を強調する堅牢な機械学習モデルに対して、これまで認識されていなかった脅威を提示します。本稿では,二段階最適化に基づく新たなデータ中毒攻撃法を提案し,ロバストな分類器のロバスト性を保証する。我々の攻撃は、被害者が最先端のロバストな訓練方法を用いて、ゼロからモデルを訓練しても効果的である。
論文参考訳（メタデータ） (2020-12-02T15:30:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。