論文の概要: EAD: an ensemble approach to detect adversarial examples from the hidden
features of deep neural networks
- arxiv url: http://arxiv.org/abs/2111.12631v2
- Date: Thu, 25 Nov 2021 11:24:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-29 12:42:27.300211
- Title: EAD: an ensemble approach to detect adversarial examples from the hidden
features of deep neural networks
- Title(参考訳): EAD:ディープニューラルネットワークの隠れた特徴から敵のサンプルを検出するアンサンブルアプローチ
- Authors: Francesco Craighero, Fabrizio Angaroni, Fabio Stella, Chiara Damiani,
Marco Antoniotti, Alex Graudenzi
- Abstract要約: 本稿では,敵のサンプルを識別するためのアンサンブル逆検出器 (EAD) を提案する。
EADは、事前訓練されたディープニューラルネットワーク(DNN)の内部表現における入力インスタンスの異なる特性を利用する複数の検出器を組み合わせる。
EAD が AUROC と AUPR で最良であることを示す。
- 参考スコア(独自算出の注目度): 1.3212032015497979
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the key challenges in Deep Learning is the definition of effective
strategies for the detection of adversarial examples. To this end, we propose a
novel approach named Ensemble Adversarial Detector (EAD) for the identification
of adversarial examples, in a standard multiclass classification scenario. EAD
combines multiple detectors that exploit distinct properties of the input
instances in the internal representation of a pre-trained Deep Neural Network
(DNN). Specifically, EAD integrates the state-of-the-art detectors based on
Mahalanobis distance and on Local Intrinsic Dimensionality (LID) with a newly
introduced method based on One-class Support Vector Machines (OSVMs). Although
all constituting methods assume that the greater the distance of a test
instance from the set of correctly classified training instances, the higher
its probability to be an adversarial example, they differ in the way such
distance is computed. In order to exploit the effectiveness of the different
methods in capturing distinct properties of data distributions and,
accordingly, efficiently tackle the trade-off between generalization and
overfitting, EAD employs detector-specific distance scores as features of a
logistic regression classifier, after independent hyperparameters optimization.
We evaluated the EAD approach on distinct datasets (CIFAR-10, CIFAR-100 and
SVHN) and models (ResNet and DenseNet) and with regard to four adversarial
attacks (FGSM, BIM, DeepFool and CW), also by comparing with competing
approaches. Overall, we show that EAD achieves the best AUROC and AUPR in the
large majority of the settings and comparable performance in the others. The
improvement over the state-of-the-art, and the possibility to easily extend EAD
to include any arbitrary set of detectors, pave the way to a widespread
adoption of ensemble approaches in the broad field of adversarial example
detection.
- Abstract(参考訳): ディープラーニングにおける重要な課題の1つは、敵の例を検出する効果的な戦略の定義である。
そこで本研究では,標準的なマルチクラス分類シナリオにおいて,敵のサンプルを識別する新しい手法であるEnsemble Adversarial Detector (EAD)を提案する。
EADは、事前訓練されたディープニューラルネットワーク(DNN)の内部表現において入力インスタンスの異なる特性を利用する複数の検出器を組み合わせる。
具体的には、マハラノビス距離と局所固有次元(LID)に基づく最先端検出器と、ワンクラスサポートベクトルマシン(OSVM)に基づく新しい手法を統合する。
すべての構成法は、正しく分類されたトレーニングインスタンスの集合からテストインスタンスの距離が大きいほど、逆の例になる確率が高いと仮定しているが、それらの距離の計算方法が異なる。
データ分布の異なる特性を抽出し、一般化とオーバーフィッティングのトレードオフに効果的に取り組むために、EDAは独立なハイパーパラメータ最適化の後、ロジスティック回帰分類器の特徴として検出器特異的距離スコアを用いる。
本研究では,異なるデータセット (CIFAR-10, CIFAR-100, SVHN) とモデル (ResNet, DenseNet) に対するEDAアプローチと,FGSM, BIM, DeepFool, CW) と競合するアプローチとの比較を行った。
全体として、eadは設定の大部分で最高のaurocとauprを達成し、他の部分で同等のパフォーマンスを実現しています。
最先端よりも改善され、EDDを任意の検出器の集合を含むように容易に拡張できる可能性があり、幅広い敵のサンプル検出分野におけるアンサンブルアプローチの普及への道を開く。
関連論文リスト
- Self-Supervised Representation Learning for Adversarial Attack Detection [6.528181610035978]
教師付き学習に基づく敵攻撃検出手法は,多数のラベル付きデータに依存している。
この欠点に対処するために、敵攻撃検出タスクのための自己教師付き表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-05T09:37:16Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z) - PARL: Enhancing Diversity of Ensemble Networks to Resist Adversarial
Attacks via Pairwise Adversarially Robust Loss Function [13.417003144007156]
敵の攻撃は 転送可能性の原理に 依存する傾向があります
敵攻撃に対するアンサンブル法は、敵の例が複数の分類器を誤解させる可能性が低いことを示す。
最近のアンサンブル法は、より強い敵に弱いか、エンドツーエンドの評価が欠如していることが示されている。
論文 参考訳(メタデータ) (2021-12-09T14:26:13Z) - Towards A Conceptually Simple Defensive Approach for Few-shot
classifiers Against Adversarial Support Samples [107.38834819682315]
本研究は,数発の分類器を敵攻撃から守るための概念的簡便なアプローチについて検討する。
本稿では,自己相似性とフィルタリングの概念を用いた簡易な攻撃非依存検出法を提案する。
ミニイメージネット(MI)とCUBデータセットの攻撃検出性能は良好である。
論文 参考訳(メタデータ) (2021-10-24T05:46:03Z) - Learning to Detect Adversarial Examples Based on Class Scores [0.8411385346896413]
我々は、すでに訓練済みの分類モデルのクラススコアに基づいて、敵の攻撃検出についてより詳しく検討する。
本稿では,SVM(Support Vector Machine)をクラススコアで学習し,逆例を検出することを提案する。
提案手法は,実装が容易でありながら,既存の手法と比較して検出率の向上を図っている。
論文 参考訳(メタデータ) (2021-07-09T13:29:54Z) - Self-Supervised Adversarial Example Detection by Disentangled
Representation [16.98476232162835]
判別器ネットワークが支援するオートエンコーダを,正しくペア化されたクラス/セマンティクス特徴と誤ったペアのクラス/セマンティクス特徴の両方から訓練し,良性と反例を再構築する。
これは逆例の振る舞いを模倣し、オートエンコーダの不要な一般化能力を減らすことができる。
本手法は,最先端の自己監視検出手法と比較して,様々な測定結果において優れた性能を示す。
論文 参考訳(メタデータ) (2021-05-08T12:48:18Z) - Adversarial Unsupervised Domain Adaptation Guided with Deep Clustering
for Face Presentation Attack Detection [0.8701566919381223]
顔提示攻撃検知(PAD)は顔認識システムを確保するために注目されている。
PAD一般化能力を改善するために,ドメイン適応(DA)に基づくエンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-13T05:34:40Z) - Detection of Adversarial Supports in Few-shot Classifiers Using Feature
Preserving Autoencoders and Self-Similarity [89.26308254637702]
敵対的なサポートセットを強調するための検出戦略を提案する。
我々は,特徴保存型オートエンコーダフィルタリングと,この検出を行うサポートセットの自己相似性の概念を利用する。
提案手法は攻撃非依存であり, 最善の知識まで, 数発分類器の検出を探索する最初の方法である。
論文 参考訳(メタデータ) (2020-12-09T14:13:41Z) - Cross-domain Face Presentation Attack Detection via Multi-domain
Disentangled Representation Learning [109.42987031347582]
顔提示攻撃検出(PAD)は,顔認識システムにおいて緊急に解決すべき課題である。
クロスドメイン顔PADのための効率的な非交叉表現学習を提案する。
我々のアプローチは、不整合表現学習(DR-Net)とマルチドメイン学習(MD-Net)からなる。
論文 参考訳(メタデータ) (2020-04-04T15:45:14Z) - Adversarial Distributional Training for Robust Deep Learning [53.300984501078126]
逆行訓練(AT)は、逆行例によるトレーニングデータを増やすことにより、モデルロバスト性を改善する最も効果的な手法の一つである。
既存のAT手法の多くは、敵の例を作らせるために特定の攻撃を採用しており、他の目に見えない攻撃に対する信頼性の低い堅牢性につながっている。
本稿では,ロバストモデル学習のための新しいフレームワークであるADTを紹介する。
論文 参考訳(メタデータ) (2020-02-14T12:36:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。