Fugu-MT 論文翻訳(概要): Diffusion Models for Imperceptible and Transferable Adversarial Attack

論文の概要: Diffusion Models for Imperceptible and Transferable Adversarial Attack

arxiv url: http://arxiv.org/abs/2305.08192v2
Date: Thu, 30 Nov 2023 14:40:54 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-01 20:31:33.550489
Title: Diffusion Models for Imperceptible and Transferable Adversarial Attack
Title（参考訳）: 知覚不能および伝達不能な逆襲に対する拡散モデル
Authors: Jianqi Chen, Hao Chen, Keyan Chen, Yilan Zhang, Zhengxia Zou, Zhenwei Shi
Abstract要約: 本稿では,拡散モデルの生成的および識別的パワーを両立させることにより,新たな非受容的かつ伝達可能な攻撃を提案する。提案手法であるDiffAttackは,対向攻撃場に拡散モデルを導入する最初の方法である。
参考スコア（独自算出の注目度）: 23.991194050494396
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Many existing adversarial attacks generate $L_p$-norm perturbations on image RGB space. Despite some achievements in transferability and attack success rate, the crafted adversarial examples are easily perceived by human eyes. Towards visual imperceptibility, some recent works explore unrestricted attacks without $L_p$-norm constraints, yet lacking transferability of attacking black-box models. In this work, we propose a novel imperceptible and transferable attack by leveraging both the generative and discriminative power of diffusion models. Specifically, instead of direct manipulation in pixel space, we craft perturbations in the latent space of diffusion models. Combined with well-designed content-preserving structures, we can generate human-insensitive perturbations embedded with semantic clues. For better transferability, we further "deceive" the diffusion model which can be viewed as an implicit recognition surrogate, by distracting its attention away from the target regions. To our knowledge, our proposed method, DiffAttack, is the first that introduces diffusion models into the adversarial attack field. Extensive experiments on various model structures, datasets, and defense methods have demonstrated the superiority of our attack over the existing attack methods.
Abstract（参考訳）: 既存の多くの敵攻撃は画像RGB空間上で$L_p$-norm摂動を生成する。移植性や攻撃成功率のいくつかの成果にもかかわらず、製作された敵の例は人間の目で容易に認識される。最近の研究では、L_p$-norm制約なしで制限のない攻撃を探索しているが、ブラックボックスモデルに対する攻撃の転送性は欠如している。本研究では,拡散モデルの生成的・判別的パワーを活用し,新しい非受容的・移動可能攻撃を提案する。具体的には、ピクセル空間の直接操作の代わりに、拡散モデルの潜在空間で摂動を発生させる。適切に設計されたコンテンツ保存構造と組み合わせることで、意味的な手がかりが埋め込まれた人間非感受性の摂動を生成することができる。移動性を改善するために,対象領域から注意をそらすことにより,暗黙の認識の代理と見なすことのできる拡散モデルをさらに「欺く」。我々の知る限り、提案手法であるdiffattackは、敵の攻撃フィールドに拡散モデルを導入する最初の方法である。各種モデル構造,データセット,防衛手法に関する大規模な実験により,既存の攻撃方法に対する攻撃の優位性を実証した。

関連論文リスト

TRAIL: Transferable Robust Adversarial Images via Latent diffusion [35.54430200195499]
敵対的攻撃は、ディープラーニングシステムに深刻なセキュリティリスクをもたらす。モデル間の転送性は、生成した逆数の特徴と実世界のデータの間の分布ミスマッチによって制限されている。テスト時間適応フレームワークTRAIL(Latent Diffusion)を用いたTransferable Robust Adrial Imagesを提案する。
論文参考訳（メタデータ） (2025-05-22T03:11:35Z)
Embedding Hidden Adversarial Capabilities in Pre-Trained Diffusion Models [1.534667887016089]
我々は,極細調整による拡散モデルに直接,隠れた敵の能力を組み込む新たな攻撃パラダイムを導入する。得られた改ざんされたモデルは、原画像と区別できない高品質な画像を生成する。当社のアプローチの有効性とステルス性を実証し、新たなセキュリティ上の懸念を生じさせる隠蔽攻撃ベクトルを明らかにする。
論文参考訳（メタデータ） (2025-04-05T12:51:36Z)
Pixel is a Barrier: Diffusion Models Are More Adversarially Robust Than We Think [14.583181596370386]
拡散モデルの逆例は、安全上の問題に対する解決策として広く使われている。このことは、拡散モデルがほとんどの深層モデルのような敵攻撃に対して脆弱であると考えることを誤解させるかもしれない。本稿では, 勾配をベースとしたホワイトボックス攻撃がLDM攻撃に有効であっても, PDM攻撃に失敗する,という新たな知見を示す。
論文参考訳（メタデータ） (2024-04-20T08:28:43Z)
Adv-Diffusion: Imperceptible Adversarial Face Identity Attack via Latent Diffusion Model [61.53213964333474]
本稿では,生の画素空間ではなく,潜在空間における非知覚的対角的アイデンティティ摂動を生成できる統一的なフレームワークAdv-Diffusionを提案する。具体的には,周囲のセマンティックな摂動を生成するために,個人性に敏感な条件付き拡散生成モデルを提案する。設計された適応強度に基づく対向摂動アルゴリズムは、攻撃の伝達性とステルス性の両方を確保することができる。
論文参考訳（メタデータ） (2023-12-18T15:25:23Z)
Improving Adversarial Transferability by Stable Diffusion [36.97548018603747]
敵対的な例は良心サンプルに知覚不能な摂動を導入予測を欺くディープニューラルネットワーク(Deep Neural Network, DNN)は、良性サンプルに知覚不能な摂動を導入し、予測を誤認する敵の例に影響を受けやすい。本稿では,SDAM(Stable Diffusion Attack Method)と呼ばれる新しい攻撃手法を提案する。
論文参考訳（メタデータ） (2023-11-18T09:10:07Z)
Semantic Adversarial Attacks via Diffusion Models [30.169827029761702]
セマンティック敵攻撃は、色、コンテキスト、特徴などのクリーンな例のセマンティック属性の変更に焦点を当てる。本稿では,近年の拡散モデルを利用して,セマンティック・アタックを迅速に生成するフレームワークを提案する。提案手法は,FIDが36.61である複数環境での攻撃成功率を約100%達成する。
論文参考訳（メタデータ） (2023-09-14T02:57:48Z)
Data Forensics in Diffusion Models: A Systematic Analysis of Membership Privacy [62.16582309504159]
本研究では,拡散モデルに対するメンバシップ推論攻撃の系統的解析を開発し,各攻撃シナリオに適した新しい攻撃手法を提案する。提案手法は容易に入手可能な量を利用して,現実的なシナリオにおいてほぼ完全な攻撃性能 (>0.9 AUCROC) を達成することができる。
論文参考訳（メタデータ） (2023-02-15T17:37:49Z)
Towards Understanding and Boosting Adversarial Transferability from a Distribution Perspective [80.02256726279451]
近年,ディープニューラルネットワーク(DNN)に対する敵対的攻撃が注目されている。本稿では,画像の分布を操作することで,敵の例を再現する新しい手法を提案する。本手法は,攻撃の伝達性を大幅に向上させ,未目標シナリオと目標シナリオの両方において最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2022-10-09T09:58:51Z)
Frequency Domain Model Augmentation for Adversarial Attack [91.36850162147678]
ブラックボックス攻撃の場合、代用モデルと被害者モデルの間のギャップは通常大きい。そこで本研究では,通常の訓練モデルと防衛モデルの両方に対して,より伝達可能な対角線モデルを構築するための新しいスペクトルシミュレーション攻撃を提案する。
論文参考訳（メタデータ） (2022-07-12T08:26:21Z)
Learning to Learn Transferable Attack [77.67399621530052]
転送逆行攻撃は非自明なブラックボックス逆行攻撃であり、サロゲートモデル上で敵の摂動を発生させ、そのような摂動を被害者モデルに適用することを目的としている。本研究では,データとモデル拡張の両方から学習することで,敵の摂動をより一般化する学習可能な攻撃学習法(LLTA)を提案する。提案手法の有効性を実証し, 現状の手法と比較して, 12.85%のトランスファー攻撃の成功率で検証した。
論文参考訳（メタデータ） (2021-12-10T07:24:21Z)
Boosting the Transferability of Video Adversarial Examples via Temporal Translation [82.0745476838865]
敵の例は転送可能であり、現実世界のアプリケーションにおけるブラックボックス攻撃に対して実現可能である。本稿では,一組の時間的翻訳ビデオクリップ上での対向的摂動を最適化する時間的翻訳攻撃手法を提案する。 Kinetics-400 データセットと UCF-101 データセットを用いた実験により,本手法がビデオ対向例の転送可能性を大幅に向上することを示した。
論文参考訳（メタデータ） (2021-10-18T07:52:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。