論文の概要: DDAD: A Two-pronged Adversarial Defense Based on Distributional Discrepancy
- arxiv url: http://arxiv.org/abs/2503.02169v1
- Date: Tue, 04 Mar 2025 01:16:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:19:43.592914
- Title: DDAD: A Two-pronged Adversarial Defense Based on Distributional Discrepancy
- Title(参考訳): DDAD:分散離散性に基づく二方向対向防御
- Authors: Jiacheng Zhang, Benjamin I. P. Rubinstein, Jingfeng Zhang, Feng Liu,
- Abstract要約: 統計的逆データ検出(SADD)は、次のバッチが逆データ例(AE)を含むかどうかを検出する
本稿では,分布差の最小化がAEの損失低減に有効であることを示す。
DDAD(Distributal-Discrepancy-based Adversarial Defense)という対角防御法を提案する。
- 参考スコア(独自算出の注目度): 30.502354813427523
- License:
- Abstract: Statistical adversarial data detection (SADD) detects whether an upcoming batch contains adversarial examples (AEs) by measuring the distributional discrepancies between clean examples (CEs) and AEs. In this paper, we reveal the potential strength of SADD-based methods by theoretically showing that minimizing distributional discrepancy can help reduce the expected loss on AEs. Nevertheless, despite these advantages, SADD-based methods have a potential limitation: they discard inputs that are detected as AEs, leading to the loss of clean information within those inputs. To address this limitation, we propose a two-pronged adversarial defense method, named Distributional-Discrepancy-based Adversarial Defense (DDAD). In the training phase, DDAD first optimizes the test power of the maximum mean discrepancy (MMD) to derive MMD-OPT, and then trains a denoiser by minimizing the MMD-OPT between CEs and AEs. In the inference phase, DDAD first leverages MMD-OPT to differentiate CEs and AEs, and then applies a two-pronged process: (1) directly feeding the detected CEs into the classifier, and (2) removing noise from the detected AEs by the distributional-discrepancy-based denoiser. Extensive experiments show that DDAD outperforms current state-of-the-art (SOTA) defense methods by notably improving clean and robust accuracy on CIFAR-10 and ImageNet-1K against adaptive white-box attacks.
- Abstract(参考訳): 統計的逆データ検出(SADD)は、クリーンな例(CE)とAEの分布差を測定することにより、次のバッチが逆データ(AE)を含むかどうかを検出する。
本稿では,AEsの損失低減に寄与する分布差の最小化を理論的に示すことによって,SADD法の可能性を明らかにする。
しかしながら、これらの利点にもかかわらず、SADDベースの手法には潜在的な制限があり、AEsとして検出される入力を破棄し、それらの入力内でクリーンな情報が失われる。
この制限に対処するため,DAD (Dis Distributional-Discrepancy-based Adversarial Defense) という2段階の対角防御手法を提案する。
訓練段階では、DDADはまず最大平均誤差(MMD)のテストパワーを最適化してMDD-OPTを導出し、次にCEとAE間のMDD-OPTを最小化してデノイザーを訓練する。
推測段階では、DDADはまずMDD-OPTを利用してCEとAEを区別し、(1)検出されたCEを直接分類器に供給し、(2)検出されたAEからのノイズを分布分解性に基づく分解器で除去する。
DDADは、CIFAR-10およびImageNet-1Kの適応的ホワイトボックス攻撃に対するクリーンでロバストな精度を向上させることで、現在のSOTA(State-of-the-art)防御手法よりも優れていることを示す。
関連論文リスト
- Beyond Perceptual Distances: Rethinking Disparity Assessment for Out-of-Distribution Detection with Diffusion Models [28.96695036746856]
Out-of-Distribution (OoD) 検出は、与えられたサンプルが分類器アンダープロテクションのトレーニング分布からのものであるかどうかを正当化することを目的としている。
DMベースの手法は、この分野に新たな洞察をもたらすが、未調査のままである。
本研究は、DM法における最先端検出性能を広範囲にわたる実験で実証した。
論文 参考訳(メタデータ) (2024-09-16T08:50:47Z) - Towards Understanding the Robustness of Diffusion-Based Purification: A Stochastic Perspective [65.10019978876863]
拡散性浄化(DBP)は、敵の攻撃に対する効果的な防御機構として出現している。
本稿では、DBPプロセスの本質が、その堅牢性の主要な要因であると主張している。
論文 参考訳(メタデータ) (2024-04-22T16:10:38Z) - Contrastive Bi-Projector for Unsupervised Domain Adaption [0.0]
コントラッシブ・バイプロジェクタ(CBP)に基づく新しい非教師なし領域適応法(UDA)を提案する。
ここでCBPUDAと呼ばれ、特徴抽出器(FE)を効果的に促進し、分類とドメイン適応のための曖昧な特徴の生成を減らす。
実験結果から, CBPUDAは従来のUDA法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-08-14T09:06:21Z) - Hard Adversarial Example Mining for Improving Robust Fairness [18.02943802341582]
敵対的トレーニング(AT)は、敵対的事例(AE)に対するディープニューラルネットワーク(DNN)の堅牢性を改善するための最先端技術として広く考えられている。
近年の研究では、敵に訓練されたモデルは不公平な問題を起こしやすく、適用性が制限されていることが明らかになっている。
この問題を軽減するために,適応型ハード・アドバイザリの例である Mining.HAM を用いて,単純かつ効果的なフレームワーク HAM を提案する。
論文 参考訳(メタデータ) (2023-08-03T15:33:24Z) - Continual Detection Transformer for Incremental Object Detection [154.8345288298059]
インクリメンタルオブジェクト検出(IOD)は、新しいオブジェクトカテゴリに対するアノテーションを備えた、フェーズ内のオブジェクト検出をトレーニングすることを目的としている。
他の段階的な設定として、IODは破滅的な忘れがちであり、知識蒸留(KD)や模範再生(ER)といった技術によってしばしば対処される。
本稿では,この文脈でKDとERを効果的に活用できるトランスフォーマーベースのIODを提案する。
論文 参考訳(メタデータ) (2023-04-06T14:38:40Z) - MSS-PAE: Saving Autoencoder-based Outlier Detection from Unexpected Reconstruction [25.60381244912307]
オートエンコーダ(AE)は、固有の学習能力のため、機械学習タスクに一般的に使用される。
AEをベースとした手法は、異常判定と予期せぬ外乱の復元結果の問題に直面し、外乱検出(OD)の性能を制限している。
提案手法は、ODにおけるAEの発展を促進する可能性がある。
論文 参考訳(メタデータ) (2023-04-03T04:01:29Z) - ADPS: Asymmetric Distillation Post-Segmentation for Image Anomaly
Detection [75.68023968735523]
知識蒸留に基づく異常検出 (KDAD) 法は, 異常領域を検出し, セグメント化するために, 教師学生のパラダイムに頼っている。
非対称蒸留ポストセグメンテーション(ADPS)と呼ばれる革新的なアプローチを提案する。
我々のADPSは、教師-学生ネットワークの入力と同じイメージの異なる形態の非対称蒸留パラダイムを採用している。
ADPSは,MVTec ADとKolektorSDD2データセットで平均精度(AP)を9%,20%向上させることを示した。
論文 参考訳(メタデータ) (2022-10-19T12:04:47Z) - Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。
実験結果から,これらの手法が直面する課題を分析した。
本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文 参考訳(メタデータ) (2022-03-23T07:33:37Z) - Improved Certified Defenses against Data Poisoning with (Deterministic)
Finite Aggregation [122.83280749890078]
本報告では, 一般中毒に対する予防的対策として, フィニット・アグリゲーション(Finite Aggregation)を提案する。
トレーニングセットを直接非結合部分集合に分割するDPAとは対照的に、我々の方法はまず、トレーニングセットをより小さな非結合部分集合に分割する。
我々は、決定論的および集約的認証された防御設計をブリッジして、我々の方法の代替的な見解を提供する。
論文 参考訳(メタデータ) (2022-02-05T20:08:58Z) - Mitigating the Mutual Error Amplification for Semi-Supervised Object
Detection [92.52505195585925]
擬似ラベルの修正機構を導入し,相互誤りの増幅を緩和するクロス・インストラクション(CT)手法を提案する。
他の検出器からの予測を直接擬似ラベルとして扱う既存の相互指導法とは対照的に,我々はラベル修正モジュール(LRM)を提案する。
論文 参考訳(メタデータ) (2022-01-26T03:34:57Z) - MixDefense: A Defense-in-Depth Framework for Adversarial Example
Detection Based on Statistical and Semantic Analysis [14.313178290347293]
AE検出のための多層ディフェンス・イン・ディープス・フレームワーク(MixDefense)を提案する。
入力から抽出した雑音の特徴を利用して、自然画像と改ざん画像の統計的差異を抽出し、AE検出を行う。
提案したMixDefenseソリューションは,既存のAE検出技術よりもかなり優れていることを示す。
論文 参考訳(メタデータ) (2021-04-20T15:57:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。