論文の概要: Efficient Decision-based Black-box Patch Attacks on Video Recognition
- arxiv url: http://arxiv.org/abs/2303.11917v1
- Date: Tue, 21 Mar 2023 15:08:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-22 14:29:10.305346
- Title: Efficient Decision-based Black-box Patch Attacks on Video Recognition
- Title(参考訳): ビデオ認識における意思決定に基づくブラックボックスパッチ攻撃の効率化
- Authors: Kaixun Jiang, Zhaoyu Chen, Tony Huang, Jiafeng Wang, Dingkang Yang, Bo
Li, Yan Wang, Wenqiang Zhang
- Abstract要約: この研究はまず、意思決定に基づくビデオモデルに対するパッチ攻撃について検討する。
問合せ効率の高い攻撃を実現するために,時空間差分進化フレームワークを提案する。
STDEは、脅威、効率、非受容性の点で最先端のパフォーマンスを実証している。
- 参考スコア(独自算出の注目度): 17.15206297582425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although Deep Neural Networks (DNNs) have demonstrated excellent performance,
they are vulnerable to adversarial patches that introduce perceptible and
localized perturbations to the input. Generating adversarial patches on images
has received much attention, while adversarial patches on videos have not been
well investigated. Further, decision-based attacks, where attackers only access
the predicted hard labels by querying threat models, have not been well
explored on video models either, even if they are practical in real-world video
recognition scenes. The absence of such studies leads to a huge gap in the
robustness assessment for video models. To bridge this gap, this work first
explores decision-based patch attacks on video models. We analyze that the huge
parameter space brought by videos and the minimal information returned by
decision-based models both greatly increase the attack difficulty and query
burden. To achieve a query-efficient attack, we propose a spatial-temporal
differential evolution (STDE) framework. First, STDE introduces target videos
as patch textures and only adds patches on keyframes that are adaptively
selected by temporal difference. Second, STDE takes minimizing the patch area
as the optimization objective and adopts spatialtemporal mutation and crossover
to search for the global optimum without falling into the local optimum.
Experiments show STDE has demonstrated state-of-the-art performance in terms of
threat, efficiency and imperceptibility. Hence, STDE has the potential to be a
powerful tool for evaluating the robustness of video recognition models.
- Abstract(参考訳): ディープニューラルネットワーク(DNN)は優れた性能を示したが、入力に知覚的かつ局所的な摂動をもたらす敵のパッチに弱い。
画像上の敵意パッチの生成は注目されているが、ビデオ上の敵意パッチは十分に調査されていない。
さらに、脅威モデルをクエリして予測されたハードラベルにのみアクセスする意思決定に基づく攻撃は、実世界のビデオ認識シーンで実用的であっても、ビデオモデルでも十分に検討されていない。
このような研究の欠如は、ビデオモデルのロバストネス評価において大きなギャップをもたらす。
このギャップを埋めるため、この研究はまず、ビデオモデルに対する意思決定に基づくパッチ攻撃を探求する。
ビデオが生み出す巨大なパラメータ空間と、決定に基づくモデルが返す最小限の情報によって、攻撃の難易度とクエリの負担が大幅に増加することを分析した。
問合せ効率の高い攻撃を実現するために,時空間微分進化(STDE)フレームワークを提案する。
まず、STDEはターゲットビデオをパッチテクスチャとして導入し、時間差によって適応的に選択されるキーフレームにのみパッチを追加する。
第2に、stdeはパッチ領域の最小化を最適化目標とし、空間的時間的変異とクロスオーバーを採用し、局所的最適に陥ることなくグローバル最適を探索する。
実験の結果、STDEは脅威、効率、非受容性の点で最先端のパフォーマンスを示した。
したがって、STDEはビデオ認識モデルの堅牢性を評価する強力なツールとなる可能性がある。
関連論文リスト
- Query-Efficient Decision-based Black-Box Patch Attack [36.043297146652414]
本稿では,クエリ効率の高い決定ベースのパッチアタックに対して,DevoPatchという微分進化アルゴリズムを提案する。
DevoPatchは、パッチ領域とアタック成功率の点で、最先端のブラックボックスパッチ攻撃を上回っている。
本稿では,ViTの脆弱性評価と画像分類を,初めて決定ベースのパッチアタック設定で実施する。
論文 参考訳(メタデータ) (2023-07-02T05:15:43Z) - Efficient Robustness Assessment via Adversarial Spatial-Temporal Focus
on Videos [0.0]
本稿では,ビデオの空間時間的アタック(AstFocus)を新たに設計し,同時に焦点を絞ったキーフレームとキー領域に対するアタックを行う。
連続的なクエリにより、キーフレームとキー領域からなる縮小された検索空間が正確になっている。
4つの主流ビデオ認識モデルと3つの広く使われているアクション認識データセットの実験は、提案したAstFocus攻撃がSOTA法より優れていることを示した。
論文 参考訳(メタデータ) (2023-01-03T00:28:57Z) - Defensive Patches for Robust Recognition in the Physical World [111.46724655123813]
データエンドディフェンスは、モデルを変更する代わりに入力データの操作によって堅牢性を改善する。
従来のデータエンドディフェンスは、様々なノイズに対する低一般化と、複数のモデル間での弱い転送可能性を示している。
モデルがこれらの機能をよりよく活用することを支援することにより、これらの問題に対処するための防御パッチ生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-13T07:34:51Z) - On the Real-World Adversarial Robustness of Real-Time Semantic
Segmentation Models for Autonomous Driving [59.33715889581687]
現実世界の敵対的な例(通常はパッチの形で)の存在は、安全クリティカルなコンピュータビジョンタスクにおけるディープラーニングモデルの使用に深刻な脅威をもたらす。
本稿では,異なる種類の対立パッチを攻撃した場合のセマンティックセグメンテーションモデルのロバスト性を評価する。
画素の誤分類を誘導する攻撃者の能力を改善するために, 新たな損失関数を提案する。
論文 参考訳(メタデータ) (2022-01-05T22:33:43Z) - Attacking Video Recognition Models with Bullet-Screen Comments [79.53159486470858]
本稿では,BSC攻撃による映像認識モデルに対する新たな敵攻撃を提案する。
BSCは一種の意味のあるパッチと見なすことができ、クリーンなビデオに追加しても、ビデオの内容に対する人々の理解に影響を与えたり、人々の疑念を喚起したりしない。
論文 参考訳(メタデータ) (2021-10-29T08:55:50Z) - Reinforcement Learning Based Sparse Black-box Adversarial Attack on
Video Recognition Models [3.029434408969759]
ブラックボックスの敵攻撃は、選択されたキー領域とキーフレームでのみ実行される。
本稿では,攻撃プロセスの高速化を目的とした強化学習に基づくフレーム選択手法を提案する。
実データセットにおける実験結果の範囲は,提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2021-08-29T12:22:40Z) - Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction [61.17654438176999]
本稿では,フレーム予測と適切な設計による新規で頑健な非教師付きビデオ異常検出手法を提案する。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROCスコアを得る。
論文 参考訳(メタデータ) (2020-11-05T11:34:12Z) - Bias-based Universal Adversarial Patch Attack for Automatic Check-out [59.355948824578434]
逆の例は、ディープニューラルネットワーク(DNN)を簡単に誤解させる、知覚不能な摂動を持つ入力である。
既存の戦略は強力な一般化能力を持つ敵パッチを生成できなかった。
本稿では,強い一般化能力を持つクラス非依存の普遍的敵パッチを生成するためのバイアスベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-19T07:38:54Z) - Motion-Excited Sampler: Video Adversarial Attack with Sparked Prior [63.11478060678794]
そこで本研究では,前もってモーションアウェアノイズを得るための効果的なモーションエキサイティングサンプリング手法を提案する。
より少ないクエリ数で様々なビデオ分類モデルを攻撃することができる。
論文 参考訳(メタデータ) (2020-03-17T10:54:12Z) - Sparse Black-box Video Attack with Reinforcement Learning [14.624074868199287]
ブラックボックスビデオ攻撃を強化学習フレームワークに定式化する。
RLの環境を認識モデルとし、RLのエージェントがフレーム選択の役割を果たす。
我々は2つの主流ビデオ認識モデルを用いて一連の実験を行う。
論文 参考訳(メタデータ) (2020-01-11T14:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。