論文の概要: Memory Efficient Full-gradient Attacks (MEFA) Framework for Adversarial Defense Evaluations
- arxiv url: http://arxiv.org/abs/2605.06357v1
- Date: Thu, 07 May 2026 14:35:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.911157
- Title: Memory Efficient Full-gradient Attacks (MEFA) Framework for Adversarial Defense Evaluations
- Title(参考訳): 敵防衛評価のためのメモリ効率のよい全段階攻撃(MEFA)フレームワーク
- Authors: Yuan Du, Mitchel Hill, HanQin Cai,
- Abstract要約: 勾配チェックポインティングは、長い軌道を通した正確なエンドツーエンドの計算勾配を実践する。
以前の評価では、メモリの制約によりバックプロパゲーションが近似されることが多い。
精製防御のためのメモリ効率の高いフルグレード評価フレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.970407342993016
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work studies the robust evaluation of iterative stochastic purification defenses under white-box adversarial attacks. Our key technical insight is that gradient checkpointing makes exact end-to-end gradient computation through long purification trajectories practical by trading additional recomputation for substantially lower memory usage. This enables full-gradient adaptive attacks against diffusion- and Langevin-based purification defenses, where prior evaluations often resort to approximate backpropagation due to memory constraints. These approximations can weaken the attack signal and risk overestimating robustness. In parallel, stochasticity in iterative purification is frequently under-controlled, even though different purification trajectories can substantially change reported robustness metrics. Building on this insight, we introduce a memory-efficient full-gradient evaluation framework for stochastic purification defenses. The framework combines checkpointed backpropagation with evaluation protocols that control stochastic variability, thereby reducing memory bottlenecks while preserving exact gradients. We evaluate diffusion-based purification and Langevin sampling with Energy-Based Models (EBMs), demonstrating that full-gradient attacks uncover vulnerabilities missed by approximate-gradient evaluations. Our framework yields stronger state-of-the-art $\ell_{\infty}$ and $\ell_{2}$ white-box attacks and further supports probing out-of-distribution robustness. Overall, our results show that exact-gradient evaluation is essential for reliable benchmarking of iterative stochastic defenses.
- Abstract(参考訳): 本研究では,ホワイトボックス攻撃下での反復的確率的浄化防御の堅牢性評価について検討した。
我々の重要な技術的洞察は、勾配チェックポインティングは、メモリ使用量を大幅に減らすために余分な再計算をすることで、長い浄化軌道を通した正確なエンドツーエンドの勾配計算を実践するということである。
これにより、拡散およびランゲヴィンに基づく浄化防御に対する完全な適応攻撃が可能となり、前回の評価ではメモリ制約による近似バックプロパゲーションを利用することが多い。
これらの近似は攻撃信号を弱め、ロバスト性を過大評価するリスクを負う。
平行して、反復浄化の確率性は、報告された堅牢性指標を著しく変化させる可能性があるが、しばしば過度に制御されている。
この知見に基づいて,確率的浄化防衛のためのメモリ効率の高いフルグレート評価フレームワークを提案する。
このフレームワークは、チェックポイントバックプロパゲーションと確率的変動を制御する評価プロトコルを組み合わせることで、正確な勾配を維持しながらメモリボトルネックを低減する。
我々は,Energy-Based Models (EBMs) を用いた拡散型浄化とランゲヴィンサンプリングを評価し,ほぼ段階的な評価によって欠落した脆弱性を明らかにする。
我々のフレームワークは、より強力な最先端の$\ell_{\infty}$と$\ell_{2}$ホワイトボックスアタックをもたらし、さらにアウト・オブ・ディストリビューション・ロバストネスの探索をサポートする。
以上より,反復的確率的防御の信頼性評価には,厳密な段階的評価が不可欠であることが示唆された。
関連論文リスト
- Gradient Structure Estimation under Label-Only Oracles via Spectral Sensitivity [37.729118253160145]
我々は,既存の手動攻撃の幅広い範囲を,真の損失勾配の兆候を暗黙的に近似するものとして解釈できることを示す統一理論的な視点を開発する。
この第一原理の理解に動機づけられた我々は、ゼロクエリの周波数領域初期化とパターン駆動最適化(PDO)戦略を組み合わせた新たな攻撃フレームワークを提案する。
我々は、CIFAR-10、ImageNet、ObjectNetに関する広範な実験を通じて、我々のフレームワークを実証的に検証し、標準および敵対的に訓練されたモデル、商用API、CLIPベースのモデルをカバーする。
論文 参考訳(メタデータ) (2026-01-17T02:47:47Z) - CS-GBA: A Critical Sample-based Gradient-guided Backdoor Attack for Offline Reinforcement Learning [7.5200963577855875]
オフライン強化学習(RL)は、静的データセットからのポリシー最適化を可能にするが、バックドア攻撃に対して本質的に脆弱である。
我々は,厳格な予算の下で高い盗難と破壊性を達成すべく,CS-GBA(Critical Sample-based Gradient-Guided Backdoor Attack)を提案する。
論文 参考訳(メタデータ) (2026-01-15T13:57:52Z) - The Eminence in Shadow: Exploiting Feature Boundary Ambiguity for Robust Backdoor Attacks [51.468144272905135]
深層ニューラルネットワーク(DNN)は、バックドア攻撃に対して脆弱なままでも重要なアプリケーションを支える。
バックドア攻撃を標的とした理論的解析を行い,不均質なモデル操作を実現するための疎い決定境界に着目した。
エミネンス(Eminence)は、理論的な保証と固有なステルス特性を持つ、説明可能で堅牢なブラックボックスバックドアフレームワークである。
論文 参考訳(メタデータ) (2025-12-11T08:09:07Z) - Towards Model Resistant to Transferable Adversarial Examples via Trigger Activation [95.3977252782181]
知覚不能な摂動によって特徴づけられる敵対的な例は、彼らの予測を誤解させることで、ディープニューラルネットワークに重大な脅威をもたらす。
本稿では,移動可能な敵例(TAE)に対して,より効率的かつ効果的に堅牢性を高めることを目的とした,新たなトレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2025-04-20T09:07:10Z) - PuriDefense: Randomized Local Implicit Adversarial Purification for Defending Black-box Query-based Attacks [17.613736258543096]
ブラックボックスクエリベースの攻撃は機械学習・アズ・ア・サービス(ML)システムに脅威を与える。
低レベルの推論コストで軽量な浄化モデルのアンサンブルでランダムなパッチワイズ処理を施した効率的な防御機構であるPuriDefenseを提案する。
我々の理論的分析は、ランダム性を浄化に組み込むことで、クエリベースの攻撃の収束を遅くすることを示唆している。
論文 参考訳(メタデータ) (2024-01-19T09:54:23Z) - DiffAttack: Evasion Attacks Against Diffusion-Based Adversarial
Purification [63.65630243675792]
拡散に基づく浄化防御は拡散モデルを利用して、敵の例の人工摂動を除去する。
近年の研究では、先進的な攻撃でさえ、そのような防御を効果的に破壊できないことが示されている。
拡散型浄化防衛を効果的かつ効率的に行うための統合フレームワークDiffAttackを提案する。
論文 参考訳(メタデータ) (2023-10-27T15:17:50Z) - RECESS Vaccine for Federated Learning: Proactive Defense Against Model Poisoning Attacks [20.55681622921858]
モデル中毒は、フェデレートラーニング(FL)の適用を著しく阻害する
本研究では,モデル中毒に対するRECESSという新しいプロアクティブ・ディフェンスを提案する。
各イテレーションをスコアする従来の方法とは異なり、RECESSはクライアントのパフォーマンス相関を複数のイテレーションで考慮し、信頼スコアを見積もる。
論文 参考訳(メタデータ) (2023-10-09T06:09:01Z) - On Practical Aspects of Aggregation Defenses against Data Poisoning
Attacks [58.718697580177356]
悪意のあるトレーニングサンプルを持つディープラーニングモデルに対する攻撃は、データ中毒として知られている。
データ中毒に対する防衛戦略の最近の進歩は、認証された毒性の堅牢性を達成するためのアグリゲーション・スキームの有効性を強調している。
ここでは、Deep Partition Aggregation(ディープ・パーティション・アグリゲーション・アグリゲーション)、代表的アグリゲーション・ディフェンス(アグリゲーション・ディフェンス)に焦点を当て、効率、性能、堅牢性など、その実践的側面を評価する。
論文 参考訳(メタデータ) (2023-06-28T17:59:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。