論文の概要: Decision-based Black-box Attack Against Vision Transformers via
Patch-wise Adversarial Removal
- arxiv url: http://arxiv.org/abs/2112.03492v1
- Date: Tue, 7 Dec 2021 04:46:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 15:23:43.454270
- Title: Decision-based Black-box Attack Against Vision Transformers via
Patch-wise Adversarial Removal
- Title(参考訳): パッチワイズ逆境除去による視覚トランスフォーマーに対する意思決定に基づくブラックボックス攻撃
- Authors: Yucheng Shi, Yahong Han
- Abstract要約: 我々は、Patch-wise Adrialectomy (PAR) と呼ばれる、VTTに対する新たな決定ベースのブラックボックス攻撃を提案する。
PARは、各パッチのノイズサイズとノイズ感度を記録し、ノイズ圧縮の最も高いクエリ値でパッチを選択する。
ImageNet-21k、ILSVRC-2012、Tiny-Imagenetデータセットの実験では、PARはクエリ数と同じ平均で、摂動の非常に低い大きさを達成している。
- 参考スコア(独自算出の注目度): 42.032749850729246
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision transformers (ViTs) have demonstrated impressive performance and
stronger adversarial robustness compared to Deep Convolutional Neural Networks
(CNNs). On the one hand, ViTs' focus on global interaction between individual
patches reduces the local noise sensitivity of images. On the other hand, the
existing decision-based attacks for CNNs ignore the difference in noise
sensitivity between different regions of the image, which affects the
efficiency of noise compression. Therefore, validating the black-box
adversarial robustness of ViTs when the target model can only be queried still
remains a challenging problem. In this paper, we propose a new decision-based
black-box attack against ViTs termed Patch-wise Adversarial Removal (PAR). PAR
divides images into patches through a coarse-to-fine search process and
compresses the noise on each patch separately. PAR records the noise magnitude
and noise sensitivity of each patch and selects the patch with the highest
query value for noise compression. In addition, PAR can be used as a noise
initialization method for other decision-based attacks to improve the noise
compression efficiency on both ViTs and CNNs without introducing additional
calculations. Extensive experiments on ImageNet-21k, ILSVRC-2012, and
Tiny-Imagenet datasets demonstrate that PAR achieves a much lower magnitude of
perturbation on average with the same number of queries.
- Abstract(参考訳): 視覚変換器(ViTs)は、Deep Convolutional Neural Networks(CNNs)と比較して、優れた性能と強力な対向性を示している。
一方、個々のパッチ間のグローバルな相互作用に焦点を当てたViTsは、画像の局所的なノイズ感度を低下させる。
一方、既存のCNNに対する決定に基づく攻撃は、ノイズ圧縮の効率に影響を与える画像の異なる領域間のノイズ感度の差を無視している。
したがって、ターゲットモデルのみをクエリできる場合、ViTのブラックボックス対逆ロバスト性を検証することは依然として難しい問題である。
本稿では, Patch-wise Adversarialectomy (PAR) と呼ばれる, ViT に対する新たな決定ベースのブラックボックス攻撃を提案する。
PARは粗い検索プロセスを通じて画像をパッチに分割し、各パッチのノイズを別々に圧縮する。
PARは、各パッチのノイズサイズとノイズ感度を記録し、ノイズ圧縮の最も高いクエリ値でパッチを選択する。
さらに、parは、追加の計算を導入することなく、vitsとcnnの両方のノイズ圧縮効率を向上させるために、他の決定に基づく攻撃のノイズ初期化方法として使用できる。
ImageNet-21k、ILSVRC-2012、Tiny-Imagenetデータセットの大規模な実験により、PARはクエリ数と同じ平均で、摂動の非常に低い大きさを達成することが示された。
関連論文リスト
- Query-Efficient Hard-Label Black-Box Attack against Vision Transformers [9.086983253339069]
ビジョントランスフォーマー(ViT)は、ディープ畳み込みニューラルネットワーク(CNN)として敵対的攻撃から同様のセキュリティリスクに直面している
本稿では,ブラックボックスシナリオ下での敵攻撃に対するViTsの脆弱性について検討する。
本稿では,AdvViTと呼ばれる新しいクエリ効率の高いハードラベル逆攻撃手法を提案する。
論文 参考訳(メタデータ) (2024-06-29T10:09:12Z) - A cross Transformer for image denoising [83.68175077524111]
直列ブロック(SB)、並列ブロック(PB)、残留ブロック(RB)を備えたクロストランスフォーマー(CTNet)を提案する。
CTNetは、実画像や合成画像のデノナイジングにおいて、一般的なデノナイジング法よりも優れている。
論文 参考訳(メタデータ) (2023-10-16T13:53:19Z) - LeNo: Adversarial Robust Salient Object Detection Networks with
Learnable Noise [7.794351961083746]
本稿では,SODモデルに対する敵攻撃に対する軽量Learnble Noise (LeNo)を提案する。
LeNoは、逆画像とクリーン画像の両方でSODモデルの精度を保ち、推論速度も保持する。
ヒトの視覚的注意機構の中心に触発されて、敵の攻撃に対する防御力を高めるために、交差した形状のガウス分布で浅い雑音を初期化する。
論文 参考訳(メタデータ) (2022-10-27T12:52:55Z) - DnSwin: Toward Real-World Denoising via Continuous Wavelet
Sliding-Transformer [40.21145302686399]
本研究では,実環境下での周波数対応を実現する連続ウェーブレットスライディング変換器を提案する。
具体的には、まず、CNNエンコーダを用いてノイズの多い入力画像からボトム特徴を抽出する。
我々は、CNNデコーダを用いて、深い特徴を復号化画像に再構成する。
論文 参考訳(メタデータ) (2022-07-28T02:33:57Z) - Optimizing Image Compression via Joint Learning with Denoising [49.83680496296047]
スマートフォンカメラに搭載された比較的小さなセンサーのため、今日の撮像画像には高レベルのノイズが通常存在している。
計算コストを少なくして目的をシンプルかつ効果的に実現できるように,プラグイン機能付き2分岐重み共有アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-07-22T04:23:01Z) - Practical Blind Image Denoising via Swin-Conv-UNet and Data Synthesis [148.16279746287452]
本研究では,残差畳み込み層の局所モデリング能力とスウィントランスブロックの非局所モデリング能力を組み込むスウィンコンブブロックを提案する。
トレーニングデータ合成のために,異なる種類のノイズを考慮した実用的なノイズ劣化モデルの設計を行う。
AGWN除去と実画像復号化の実験は、新しいネットワークアーキテクチャ設計が最先端の性能を達成することを実証している。
論文 参考訳(メタデータ) (2022-03-24T18:11:31Z) - Exploring Inter-frequency Guidance of Image for Lightweight Gaussian
Denoising [1.52292571922932]
本稿では,周波数帯域を低域から高域に漸進的に洗練するために,IGNetと呼ばれる新しいネットワークアーキテクチャを提案する。
この設計では、より周波数間先行と情報を利用するため、モデルサイズは軽量化でき、競争結果も維持できる。
論文 参考訳(メタデータ) (2021-12-22T10:35:53Z) - Image Denoising using Attention-Residual Convolutional Neural Networks [0.0]
本稿では,学習に基づく新たな非盲検手法であるAttention Residual Convolutional Neural Network (ARCNN)を提案し,その拡張としてFlexible Attention Residual Convolutional Neural Network (FARCNN)を提案する。
ARCNNはガウス語とポアソン語で約0.44dBと0.96dBの平均PSNR結果を達成し、FARCNNはARCNNに比べて若干パフォーマンスが悪くても非常に一貫した結果を示した。
論文 参考訳(メタデータ) (2021-01-19T16:37:57Z) - Wavelet Integrated CNNs for Noise-Robust Image Classification [51.18193090255933]
我々は、離散ウェーブレット変換(DWT)により、最大プール、ストライド畳み込み、平均プールを置き換えることでCNNを強化する。
VGG、ResNets、DenseNetのウェーブレット統合バージョンであるWaveCNetsは、バニラバージョンよりも精度が高く、ノイズ・ロバスト性も向上している。
論文 参考訳(メタデータ) (2020-05-07T09:10:41Z) - Variational Denoising Network: Toward Blind Noise Modeling and Removal [59.36166491196973]
ブラインド画像のデノイングはコンピュータビジョンにおいて重要な問題であるが、非常に難しい問題である。
本稿では,ノイズ推定と画像デノーミングを併用した新しい変分推論手法を提案する。
論文 参考訳(メタデータ) (2019-08-29T15:54:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。