論文の概要: Concept-Based Masking: A Patch-Agnostic Defense Against Adversarial Patch Attacks
- arxiv url: http://arxiv.org/abs/2510.04245v1
- Date: Sun, 05 Oct 2025 15:26:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.542184
- Title: Concept-Based Masking: A Patch-Agnostic Defense Against Adversarial Patch Attacks
- Title(参考訳): 概念に基づくマスキング: 敵対的パッチ攻撃に対するパッチ非依存の防御
- Authors: Ayushi Mehrotra, Derek Peng, Dipkamal Bhusal, Nidhi Rastogi,
- Abstract要約: アドリアパッチ攻撃はディープラーニングモデルに現実的な脅威をもたらす。
本稿では,最も影響力のある概念アクティベーションベクトルを識別・抑制するために,概念に基づく説明を活用するパッチ非依存の防御法を提案する。
- 参考スコア(独自算出の注目度): 2.449909275410288
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adversarial patch attacks pose a practical threat to deep learning models by forcing targeted misclassifications through localized perturbations, often realized in the physical world. Existing defenses typically assume prior knowledge of patch size or location, limiting their applicability. In this work, we propose a patch-agnostic defense that leverages concept-based explanations to identify and suppress the most influential concept activation vectors, thereby neutralizing patch effects without explicit detection. Evaluated on Imagenette with a ResNet-50, our method achieves higher robust and clean accuracy than the state-of-the-art PatchCleanser, while maintaining strong performance across varying patch sizes and locations. Our results highlight the promise of combining interpretability with robustness and suggest concept-driven defenses as a scalable strategy for securing machine learning models against adversarial patch attacks.
- Abstract(参考訳): 逆パッチ攻撃は、しばしば物理的な世界で実現される局所的な摂動を通じて標的の誤分類を強制することで、ディープラーニングモデルに実践的な脅威をもたらす。
既存の防御は、通常、パッチのサイズや位置に関する事前の知識を前提としており、適用可能性を制限する。
本研究では、概念に基づく説明を利用して最も影響力のある概念アクティベーションベクトルを特定し、抑制し、明示的な検出なしにパッチ効果を中和するパッチ非依存防衛法を提案する。
ResNet-50でImagenetteを評価した結果,パッチサイズやロケーションの多種多様なパフォーマンスを維持しつつ,最先端のPatchCleanserよりも堅牢でクリーンな精度を実現した。
この結果から,解析可能性とロバスト性を組み合わせることの約束を強調し,敵パッチ攻撃に対する機械学習モデルをセキュアにするためのスケーラブルな戦略として,概念駆動型防御を提案する。
関連論文リスト
- BadCLIP: Dual-Embedding Guided Backdoor Attack on Multimodal Contrastive
Learning [85.2564206440109]
本報告では,防衛後においてもバックドア攻撃が有効であり続けるという現実的なシナリオにおける脅威を明らかにする。
バックドア検出や細調整防御のモデル化に抵抗性のあるemphtoolnsアタックを導入する。
論文 参考訳(メタデータ) (2023-11-20T02:21:49Z) - Task-agnostic Defense against Adversarial Patch Attacks [25.15948648034204]
対向パッチは、指定された局所領域内に対向画素を注入することにより、誤誘導ニューラルネットワークを攻撃する。
我々は、ホワイトボックスの敵パッチに対するタスク非依存の防御であるPatchZeroを提示する。
本手法は, 良性性能の劣化を伴わずに, SOTAの頑健な精度を実現する。
論文 参考訳(メタデータ) (2022-07-05T03:49:08Z) - Defending Object Detectors against Patch Attacks with Out-of-Distribution Smoothing [21.174037250133622]
本稿では,敵対パッチの除去を目的としたアプローチの特性を特徴付けるOODSmootherを紹介する。
このフレームワークは、1)既存のオブジェクト検出器に対するパッチアタックを壊す新しいアダプティブアタック、2)セマンティックプリミティブを利用する新しいディフェンスアプローチであるSemPriorを設計するのに役立つ。
SemPriorだけでは40%増、既存の防衛と組み合わせれば60%増だ。
論文 参考訳(メタデータ) (2022-05-18T15:20:18Z) - Segment and Complete: Defending Object Detectors against Adversarial
Patch Attacks with Robust Patch Detection [142.24869736769432]
敵のパッチ攻撃は最先端の物体検出器に深刻な脅威をもたらす。
パッチ攻撃に対して物体検出器を防御するフレームワークであるSegment and Complete Defense (SAC)を提案する。
SACは、物理的パッチ攻撃の標的攻撃成功率を著しく低減できることを示す。
論文 参考訳(メタデータ) (2021-12-08T19:18:48Z) - Robustness Out of the Box: Compositional Representations Naturally
Defend Against Black-Box Patch Attacks [11.429509031463892]
パッチベースの敵攻撃は、誤分類を引き起こす入力に知覚できるが局所的な変化をもたらす。
本研究では,ブラックボックスパッチ攻撃に対する2つの対策について検討する。
敵の訓練は、最先端の位置最適化パッチ攻撃に対する効果が限られていることが判明した。
論文 参考訳(メタデータ) (2020-12-01T15:04:23Z) - PatchGuard: A Provably Robust Defense against Adversarial Patches via
Small Receptive Fields and Masking [46.03749650789915]
画像の制限領域内の画素を任意に修正することで、機械学習モデルの誤分類を誘発することを目的としている。
そこで我々はPatchGuardという汎用防衛フレームワークを提案する。このフレームワークは、局所的な敵パッチに対して高い清潔さを維持しつつ、高い堅牢性を達成できる。
論文 参考訳(メタデータ) (2020-05-17T03:38:34Z) - Adversarial Training against Location-Optimized Adversarial Patches [84.96938953835249]
反対のパッチ: 明らかに見えますが 反対に作られた長方形のパッチです
まず、画像内の位置を積極的に最適化しながら、相手パッチを得るための実践的なアプローチを考案する。
CIFAR10とGTSRBでは,これらの位置最適化された対向パッチに対して対向トレーニングを適用し,ロバスト性を著しく向上した。
論文 参考訳(メタデータ) (2020-05-05T16:17:00Z) - Certified Defenses for Adversarial Patches [72.65524549598126]
敵パッチ攻撃は、現実世界のコンピュータビジョンシステムに対する最も実用的な脅威モデルの一つである。
本稿では,パッチアタックに対する認証と実証的防御について検討する。
論文 参考訳(メタデータ) (2020-03-14T19:57:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。