論文の概要: One Stone, Two Birds: Enhancing Adversarial Defense Through the Lens of Distributional Discrepancy
- arxiv url: http://arxiv.org/abs/2503.02169v2
- Date: Fri, 06 Jun 2025 12:10:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:42.875818
- Title: One Stone, Two Birds: Enhancing Adversarial Defense Through the Lens of Distributional Discrepancy
- Title(参考訳): 1羽, 2羽の鳥:分布差レンズによる敵防衛の強化
- Authors: Jiacheng Zhang, Benjamin I. P. Rubinstein, Jingfeng Zhang, Feng Liu,
- Abstract要約: 統計的逆データ検出(SADD)は、次のバッチが逆データ例(AE)を含むかどうかを検出する
本稿では,DAD(Distributal-discrepancy-based Adversarial Defense)という2段階の対角防御手法を提案する。
- 参考スコア(独自算出の注目度): 30.502354813427523
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Statistical adversarial data detection (SADD) detects whether an upcoming batch contains adversarial examples (AEs) by measuring the distributional discrepancies between clean examples (CEs) and AEs. In this paper, we explore the strength of SADD-based methods by theoretically showing that minimizing distributional discrepancy can help reduce the expected loss on AEs. Despite these advantages, SADD-based methods have a potential limitation: they discard inputs that are detected as AEs, leading to the loss of useful information within those inputs. To address this limitation, we propose a two-pronged adversarial defense method, named Distributional-discrepancy-based Adversarial Defense (DAD). In the training phase, DAD first optimizes the test power of the maximum mean discrepancy (MMD) to derive MMD-OPT, which is a stone that kills two birds. MMD-OPT first serves as a guiding signal to minimize the distributional discrepancy between CEs and AEs to train a denoiser. Then, it serves as a discriminator to differentiate CEs and AEs during inference. Overall, in the inference stage, DAD consists of a two-pronged process: (1) directly feeding the detected CEs into the classifier, and (2) removing noise from the detected AEs by the distributional-discrepancy-based denoiser. Extensive experiments show that DAD outperforms current state-of-the-art (SOTA) defense methods by simultaneously improving clean and robust accuracy on CIFAR-10 and ImageNet-1K against adaptive white-box attacks. Codes are publicly available at: https://github.com/tmlr-group/DAD.
- Abstract(参考訳): 統計的逆データ検出(SADD)は、クリーンな例(CE)とAEの分布差を測定することにより、次のバッチが逆データ(AE)を含むかどうかを検出する。
本稿では,SADDに基づく手法の強度を理論的に検討し,分布差の最小化がAEの損失を減少させることを示す。
これらの利点にもかかわらず、SADDベースの手法には潜在的な制限があり、AEsとして検出される入力を破棄し、それらの入力内で有用な情報が失われる。
本研究では,この制限に対処するため,DAD (Dis Distributional-discrepancy-based Adversarial Defense) という2段階の対向防衛手法を提案する。
訓練段階において、DADはまず最大平均誤差(MMD)のテストパワーを最適化し、2羽の鳥を殺す石であるMDD-OPTを誘導する。
MMD-OPTは、まずCEとAE間の分布差を最小限に抑えるための誘導シグナルとして機能し、デノイザーを訓練する。
そして、推論中にCEとAEを区別する識別器として機能する。
総合的に、DADは、(1)検出されたCEを直接分類器に供給し、(2)分布依存性に基づくデノイザにより検出されたAEからノイズを除去する2つの過程からなる。
大規模な実験により、DADはCIFAR-10およびImageNet-1Kにおける適応的ホワイトボックス攻撃に対するクリーンでロバストな精度を同時に向上させることにより、現在のSOTA(State-of-the-art)防御手法よりも優れていることが示された。
コードは、https://github.com/tmlr-group/DAD.comで公開されている。
関連論文リスト
- Improved Diffusion-based Generative Model with Better Adversarial Robustness [65.38540020916432]
拡散確率モデル(DPM)は、生成タスクにおいて大きな成功を収めた。
デノナイジングプロセスでは、入力データ分布はトレーニングと推論の段階によって異なる。
論文 参考訳(メタデータ) (2025-02-24T12:29:16Z) - Beyond Perceptual Distances: Rethinking Disparity Assessment for Out-of-Distribution Detection with Diffusion Models [28.96695036746856]
Out-of-Distribution (OoD) 検出は、与えられたサンプルが分類器アンダープロテクションのトレーニング分布からのものであるかどうかを正当化することを目的としている。
DMベースの手法は、この分野に新たな洞察をもたらすが、未調査のままである。
本研究は、DM法における最先端検出性能を広範囲にわたる実験で実証した。
論文 参考訳(メタデータ) (2024-09-16T08:50:47Z) - Hard Adversarial Example Mining for Improving Robust Fairness [18.02943802341582]
敵対的トレーニング(AT)は、敵対的事例(AE)に対するディープニューラルネットワーク(DNN)の堅牢性を改善するための最先端技術として広く考えられている。
近年の研究では、敵に訓練されたモデルは不公平な問題を起こしやすく、適用性が制限されていることが明らかになっている。
この問題を軽減するために,適応型ハード・アドバイザリの例である Mining.HAM を用いて,単純かつ効果的なフレームワーク HAM を提案する。
論文 参考訳(メタデータ) (2023-08-03T15:33:24Z) - Continual Detection Transformer for Incremental Object Detection [154.8345288298059]
インクリメンタルオブジェクト検出(IOD)は、新しいオブジェクトカテゴリに対するアノテーションを備えた、フェーズ内のオブジェクト検出をトレーニングすることを目的としている。
他の段階的な設定として、IODは破滅的な忘れがちであり、知識蒸留(KD)や模範再生(ER)といった技術によってしばしば対処される。
本稿では,この文脈でKDとERを効果的に活用できるトランスフォーマーベースのIODを提案する。
論文 参考訳(メタデータ) (2023-04-06T14:38:40Z) - MSS-PAE: Saving Autoencoder-based Outlier Detection from Unexpected Reconstruction [25.60381244912307]
オートエンコーダ(AE)は、固有の学習能力のため、機械学習タスクに一般的に使用される。
AEをベースとした手法は、異常判定と予期せぬ外乱の復元結果の問題に直面し、外乱検出(OD)の性能を制限している。
提案手法は、ODにおけるAEの発展を促進する可能性がある。
論文 参考訳(メタデータ) (2023-04-03T04:01:29Z) - ADPS: Asymmetric Distillation Post-Segmentation for Image Anomaly
Detection [75.68023968735523]
知識蒸留に基づく異常検出 (KDAD) 法は, 異常領域を検出し, セグメント化するために, 教師学生のパラダイムに頼っている。
非対称蒸留ポストセグメンテーション(ADPS)と呼ばれる革新的なアプローチを提案する。
我々のADPSは、教師-学生ネットワークの入力と同じイメージの異なる形態の非対称蒸留パラダイムを採用している。
ADPSは,MVTec ADとKolektorSDD2データセットで平均精度(AP)を9%,20%向上させることを示した。
論文 参考訳(メタデータ) (2022-10-19T12:04:47Z) - Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。
実験結果から,これらの手法が直面する課題を分析した。
本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文 参考訳(メタデータ) (2022-03-23T07:33:37Z) - Improved Certified Defenses against Data Poisoning with (Deterministic)
Finite Aggregation [122.83280749890078]
本報告では, 一般中毒に対する予防的対策として, フィニット・アグリゲーション(Finite Aggregation)を提案する。
トレーニングセットを直接非結合部分集合に分割するDPAとは対照的に、我々の方法はまず、トレーニングセットをより小さな非結合部分集合に分割する。
我々は、決定論的および集約的認証された防御設計をブリッジして、我々の方法の代替的な見解を提供する。
論文 参考訳(メタデータ) (2022-02-05T20:08:58Z) - Mitigating the Mutual Error Amplification for Semi-Supervised Object
Detection [92.52505195585925]
擬似ラベルの修正機構を導入し,相互誤りの増幅を緩和するクロス・インストラクション(CT)手法を提案する。
他の検出器からの予測を直接擬似ラベルとして扱う既存の相互指導法とは対照的に,我々はラベル修正モジュール(LRM)を提案する。
論文 参考訳(メタデータ) (2022-01-26T03:34:57Z) - MixDefense: A Defense-in-Depth Framework for Adversarial Example
Detection Based on Statistical and Semantic Analysis [14.313178290347293]
AE検出のための多層ディフェンス・イン・ディープス・フレームワーク(MixDefense)を提案する。
入力から抽出した雑音の特徴を利用して、自然画像と改ざん画像の統計的差異を抽出し、AE検出を行う。
提案したMixDefenseソリューションは,既存のAE検出技術よりもかなり優れていることを示す。
論文 参考訳(メタデータ) (2021-04-20T15:57:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。