Fugu-MT 論文翻訳(概要): Practical Evaluation of Adversarial Robustness via Adaptive Auto Attack

論文の概要: Practical Evaluation of Adversarial Robustness via Adaptive Auto Attack

arxiv url: http://arxiv.org/abs/2203.05154v1
Date: Thu, 10 Mar 2022 04:53:54 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-11 14:35:49.281092
Title: Practical Evaluation of Adversarial Robustness via Adaptive Auto Attack
Title（参考訳）: 適応的オートアタックによる対向ロバスト性の評価
Authors: Ye Liu, Yaya Cheng, Lianli Gao, Xianglong Liu, Qilong Zhang, Jingkuan Song
Abstract要約: 実用的な評価手法は、便利な(パラメータフリー)、効率的な(イテレーションの少ない)、信頼性を持つべきである。本稿では,パラメータフリーな適応オートアタック (A$3$) 評価手法を提案する。
参考スコア（独自算出の注目度）: 96.50202709922698
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Defense models against adversarial attacks have grown significantly, but the lack of practical evaluation methods has hindered progress. Evaluation can be defined as looking for defense models' lower bound of robustness given a budget number of iterations and a test dataset. A practical evaluation method should be convenient (i.e., parameter-free), efficient (i.e., fewer iterations) and reliable (i.e., approaching the lower bound of robustness). Towards this target, we propose a parameter-free Adaptive Auto Attack (A$^3$) evaluation method which addresses the efficiency and reliability in a test-time-training fashion. Specifically, by observing that adversarial examples to a specific defense model follow some regularities in their starting points, we design an Adaptive Direction Initialization strategy to speed up the evaluation. Furthermore, to approach the lower bound of robustness under the budget number of iterations, we propose an online statistics-based discarding strategy that automatically identifies and abandons hard-to-attack images. Extensive experiments demonstrate the effectiveness of our A$^3$. Particularly, we apply A$^3$ to nearly 50 widely-used defense models. By consuming much fewer iterations than existing methods, i.e., $1/10$ on average (10$\times$ speed up), we achieve lower robust accuracy in all cases. Notably, we won $\textbf{first place}$ out of 1681 teams in CVPR 2021 White-box Adversarial Attacks on Defense Models competitions with this method. Code is available at: $\href{https://github.com/liuye6666/adaptive_auto_attack}{https://github.com/liuye6666/adaptive\_auto\_attack}$
Abstract（参考訳）: 敵攻撃に対する防衛モデルは著しく成長しているが、実用的評価方法の欠如は進歩を妨げている。評価は、予算の反復数とテストデータセットを考えると、防衛モデルのロバスト性の下限を求めるものとして定義できる。実用的な評価方法は便利(パラメータフリー)、効率的(イテレーションが少ない)、信頼性(ロバスト性の下限に近づく)である。この目標に向けて,テスト時間学習の効率と信頼性に対処したパラメータフリー適応オートアタック(a$^3$)評価手法を提案する。具体的には、特定の防御モデルに対する敵の例が開始点のいくつかの規則に従うことを観察することで、評価を高速化するために適応方向初期化戦略を設計する。さらに, 繰り返し回数の少ないロバスト性の下限に近づくために, オンライン統計ベースの廃棄戦略を提案し, 攻撃困難な画像を自動的に識別し, 放棄する。大規模な実験は、我々のA$^3$の有効性を示す。特に、A$^3$を50近い広く使われている防衛モデルに適用する。既存のメソッドよりもずっと少ないイテレーション、すなわち平均で1/10ドル(10$\times$ speed up)を消費することで、すべてのケースでロバストな精度が低下します。特に、cvpr 2021で1681チームから$\textbf{first place}$を獲得しました。コードは、$\href{https://github.com/liuye6666/adaptive_auto_attack}{https://github.com/liuye6666/adaptive\_auto\_attack}$で入手できる。

関連論文リスト

AegisLLM: Scaling Agentic Systems for Self-Reflective Defense in LLM Security [74.22452069013289]
AegisLLMは、敵の攻撃や情報漏洩に対する協調的なマルチエージェント防御である。テスト時のエージェント推論システムのスケーリングは,モデルの有用性を損なうことなく,ロバスト性を大幅に向上させることを示す。アンラーニングやジェイルブレイクを含む主要な脅威シナリオに対する総合的な評価は、AegisLLMの有効性を示している。
論文参考訳（メタデータ） (2025-04-29T17:36:05Z)
Self-Evaluation as a Defense Against Adversarial Attacks on LLMs [20.79833694266861]
自己評価を生かした LLM に対する敵攻撃に対する防御策を導入する。本手法では, モデル微調整を必要とせず, 生成モデルの入力と出力を評価するために, 事前学習モデルを用いる。提案手法の有効性を解析し, 各種設定で評価器を攻撃しようとする試みを含む。
論文参考訳（メタデータ） (2024-07-03T16:03:42Z)
AttackBench: Evaluating Gradient-based Attacks for Adversarial Examples [26.37278338032268]
アドリシャルな例は、通常、勾配ベースの攻撃に最適化される。それぞれ異なる実験装置を用いて前任者を上回る性能を発揮する。これは過度に最適化され、偏見のある評価を提供する。
論文参考訳（メタデータ） (2024-04-30T11:19:05Z)
Alternating Objectives Generates Stronger PGD-Based Adversarial Attacks [78.2700757742992]
Projected Gradient Descent (PGD) は、そのような敵を生成するための最も効果的で概念的にシンプルなアルゴリズムの1つである。この主張を合成データの例で実験的に検証し、提案手法を25の$ell_infty$-robustモデルと3つのデータセットで評価した。私たちの最強の敵攻撃は、AutoAttackアンサンブルのすべてのホワイトボックスコンポーネントより優れています。
論文参考訳（メタデータ） (2022-12-15T17:44:31Z)
A Large-scale Multiple-objective Method for Black-box Attack against Object Detection [70.00150794625053]
我々は、真正の確率を最小化し、偽正の確率を最大化し、より多くの偽正の物体が新しい真正の有界箱を作らないようにする。我々は、GARSDCと呼ばれるランダム・サブセット選択とディバイド・アンド・コンカーによる標準的な遺伝的アルゴリズムを拡張し、効率を大幅に改善する。最先端攻撃法と比較して、GARSDCはmAPでは平均12.0、広範囲な実験ではクエリでは約1000倍減少する。
論文参考訳（メタデータ） (2022-09-16T08:36:42Z)
A Multi-objective Memetic Algorithm for Auto Adversarial Attack Optimization Design [1.9100854225243937]
良く設計された敵防衛戦略は、敵の例に対するディープラーニングモデルの堅牢性を改善することができる。防御モデルを考えると、計算負担が少なく、ロバストな精度の低い効率的な敵攻撃を更に活用する必要がある。本稿では,防衛モデルに対する準最適攻撃の自動探索を実現する自動対向攻撃最適化設計のための多目的メメティックアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-08-15T03:03:05Z)
Model-Agnostic Meta-Attack: Towards Reliable Evaluation of Adversarial Robustness [53.094682754683255]
モデル非依存型メタアタック(MAMA)アプローチにより,より強力な攻撃アルゴリズムを自動検出する。本手法は、繰り返しニューラルネットワークによってパラメータ化された逆攻撃を学習する。本研究では,未知の防御を攻撃した場合の学習能力を向上させるために,モデルに依存しない訓練アルゴリズムを開発した。
論文参考訳（メタデータ） (2021-10-13T13:54:24Z)
Composite Adversarial Attacks [57.293211764569996]
敵対攻撃は、機械学習(ML)モデルを欺くための技術です。本論文では,攻撃アルゴリズムの最適組み合わせを自動的に探索するための複合攻撃法(Composite Adrial Attack,CAA)を提案する。 CAAは11の防衛でトップ10の攻撃を破り、時間の経過は少ない。
論文参考訳（メタデータ） (2020-12-10T03:21:16Z)
Attack Agnostic Adversarial Defense via Visual Imperceptible Bound [70.72413095698961]
本研究の目的は、目視攻撃と目視攻撃の両方に対して一定の範囲内で堅牢な防衛モデルを設計することである。提案するディフェンスモデルは,MNIST,CIFAR-10,Tiny ImageNetデータベース上で評価される。提案アルゴリズムは攻撃非依存であり,攻撃アルゴリズムの知識を必要としない。
論文参考訳（メタデータ） (2020-10-25T23:14:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。