Fugu-MT 論文翻訳(概要): On the Role of Generalization in Transferability of Adversarial Examples

論文の概要: On the Role of Generalization in Transferability of Adversarial Examples

arxiv url: http://arxiv.org/abs/2206.09238v1
Date: Sat, 18 Jun 2022 16:33:53 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-22 14:24:50.286794
Title: On the Role of Generalization in Transferability of Adversarial Examples
Title（参考訳）: 逆例の伝達可能性における一般化の役割について
Authors: Yilin Wang, Farzan Farnia
Abstract要約: 本研究では, 代替NNの一般化特性が, 未観測NNへの攻撃スキームの転送可能性に果たす役割について述べる。我々の限界は、より一般化挙動のよい代替NNが、より移動可能な逆の例をもたらすことを示唆している。さらに,標準作用素ノルムに基づく正規化手法により,設計した逆数例の転送性が向上することを示した。
参考スコア（独自算出の注目度）: 33.850716051009165
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Black-box adversarial attacks designing adversarial examples for unseen neural networks (NNs) have received great attention over the past years. While several successful black-box attack schemes have been proposed in the literature, the underlying factors driving the transferability of black-box adversarial examples still lack a thorough understanding. In this paper, we aim to demonstrate the role of the generalization properties of the substitute classifier used for generating adversarial examples in the transferability of the attack scheme to unobserved NN classifiers. To do this, we apply the max-min adversarial example game framework and show the importance of the generalization properties of the substitute NN in the success of the black-box attack scheme in application to different NN classifiers. We prove theoretical generalization bounds on the difference between the attack transferability rates on training and test samples. Our bounds suggest that a substitute NN with better generalization behavior could result in more transferable adversarial examples. In addition, we show that standard operator norm-based regularization methods could improve the transferability of the designed adversarial examples. We support our theoretical results by performing several numerical experiments showing the role of the substitute network's generalization in generating transferable adversarial examples. Our empirical results indicate the power of Lipschitz regularization methods in improving the transferability of adversarial examples.
Abstract（参考訳）: black-box adversarial attacks design adversarial examples for unseen neural networks (nns) は近年注目を集めている。いくつかのブラックボックス攻撃方式が文献で提案されているが、ブラックボックス攻撃例の転送可能性を高める根本的要因はまだ十分に理解されていない。本稿では,未観測のNN分類器への攻撃スキームの転送可能性の逆例を生成するために使用される代用分類器の一般化特性の役割を示す。これを実現するために,max-min のadversarial example game framework を適用し,代替 nn の一般化特性が,異なる nn 分類器に適用するブラックボックス攻撃方式の成功に重要であることを示す。本研究では,攻撃伝達率と試験試料との差を理論的に一般化する。我々の限界は、より一般化挙動のよい代替NNが、より移動可能な逆の例をもたらすことを示唆している。さらに,標準作用素ノルムに基づく正規化手法により,設計した逆数例の転送性が向上することを示した。我々は,代用ネットワークの一般化が転置可能な逆例生成に果たす役割を示す数値実験を複数実施し,理論結果を裏付ける。実験結果は,リプシッツ正則化法が,逆例の伝達性を向上させる効果を示した。

関連論文リスト

Extend Adversarial Policy Against Neural Machine Translation via Unknown Token [66.40609413186122]
本稿では,トークン置換に基づく既存主流対立政策の文字摂動を導入した「デックスCharポリシー」を提案する。また、RLのフィードバックを提供する自己教師型マッチングを改善し、敵の訓練に必要な意味的制約に対処する。
論文参考訳（メタデータ） (2025-01-21T14:43:04Z)
Boosting the Targeted Transferability of Adversarial Examples via Salient Region & Weighted Feature Drop [2.176586063731861]
敵攻撃に対する一般的なアプローチは、敵の例の転送可能性に依存する。 SWFD(Salient Region & Weighted Feature Drop)をベースとした新しいフレームワークは,敵対的事例のターゲット転送可能性を高める。
論文参考訳（メタデータ） (2024-11-11T08:23:37Z)
Efficient Generation of Targeted and Transferable Adversarial Examples for Vision-Language Models Via Diffusion Models [17.958154849014576]
大規模視覚言語モデル(VLM)のロバスト性を評価するために、敵対的攻撃を用いることができる。従来のトランスファーベースの敵攻撃は、高いイテレーション数と複雑なメソッド構造により、高いコストを発生させる。本稿では, 拡散モデルを用いて, 自然, 制約のない, 対象とする対向的な例を生成するAdvDiffVLMを提案する。
論文参考訳（メタデータ） (2024-04-16T07:19:52Z)
Transcending Adversarial Perturbations: Manifold-Aided Adversarial Examples with Legitimate Semantics [10.058463432437659]
ディープニューラルネットワークは、悪意のある小さな摂動によって操作される敵の例に対して、極めて脆弱であった。本稿では, 現実的, 合法的意味論による敵対的事例を生成するために, 教師付き意味変換生成モデルを提案する。 MNISTおよび産業用欠陥データセットを用いた実験により、我々の敵の例は、より良い視覚的品質を示しただけでなく、優れた攻撃伝達性を示した。
論文参考訳（メタデータ） (2024-02-05T15:25:40Z)
Bag of Tricks to Boost Adversarial Transferability [5.803095119348021]
ホワイトボックス設定で生成された逆例は、しばしば異なるモデル間で低い転送可能性を示す。そこで本研究では,既存の敵攻撃の微妙な変化が攻撃性能に大きく影響することを発見した。既存の敵攻撃の綿密な研究に基づいて、敵の移動性を高めるためのトリックの袋を提案する。
論文参考訳（メタデータ） (2024-01-16T17:42:36Z)
Common Knowledge Learning for Generating Transferable Adversarial Examples [60.1287733223249]
本稿では,代用(ソース)モデルにより敵のサンプルを生成するブラックボックス攻撃の重要タイプに着目した。既存の手法では、ソースモデルとターゲットモデルが異なるタイプのDNNアーキテクチャのものである場合、不満足な逆転が生じる傾向にある。本稿では,より優れたネットワーク重みを学習し,敵対的な例を生成するための共通知識学習(CKL)フレームワークを提案する。
論文参考訳（メタデータ） (2023-07-01T09:07:12Z)
Generating Adversarial Examples with Better Transferability via Masking Unimportant Parameters of Surrogate Model [6.737574282249396]
非重要マスキングパラメータ(MUP)を用いた転送攻撃における敵例の転送可能性の向上を提案する。 MUPのキーとなるアイデアは、事前訓練されたサロゲートモデルを洗練して、転送ベースの攻撃を強化することである。
論文参考訳（メタデータ） (2023-04-14T03:06:43Z)
Making Substitute Models More Bayesian Can Enhance Transferability of Adversarial Examples [89.85593878754571]
ディープニューラルネットワークにおける敵の例の転送可能性は多くのブラックボックス攻撃の欠如である。我々は、望ましい転送可能性を達成するためにベイズモデルを攻撃することを提唱する。我々の手法は近年の最先端を大きなマージンで上回る。
論文参考訳（メタデータ） (2023-02-10T07:08:13Z)
Transferable Adversarial Examples with Bayes Approach [15.35252941167733]
ブラックボックスの敵攻撃は、信頼できるAIにおいて最も熱いトピックの1つである。本稿では,ベイズ的アプローチのレンズを用いた逆例の転送可能性について検討する。実験は、より移動可能な敵の例を作る上で、BayAtkの有意義な効果を示す。
論文参考訳（メタデータ） (2022-08-13T01:20:39Z)
Latent Boundary-guided Adversarial Training [61.43040235982727]
モデルトレーニングに敵の例を注入する最も効果的な戦略は、敵のトレーニングであることが証明されている。本稿では, LAtent bounDary-guided aDvErsarial tRaining という新たな逆トレーニングフレームワークを提案する。
論文参考訳（メタデータ） (2022-06-08T07:40:55Z)
Towards Defending against Adversarial Examples via Attack-Invariant Features [147.85346057241605]
ディープニューラルネットワーク(DNN)は敵の雑音に弱い。敵の強靭性は、敵の例を利用して改善することができる。目に見えない種類の敵の例に基づいて訓練されたモデルは、一般的に、目に見えない種類の敵の例にうまく一般化できない。
論文参考訳（メタデータ） (2021-06-09T12:49:54Z)
Detecting Adversarial Examples by Input Transformations, Defense Perturbations, and Voting [71.57324258813674]
畳み込みニューラルネットワーク(CNN)は、視覚認識タスクにおいて超人的性能に達することが証明されている。 CNNは敵の例、すなわち不正な出力をネットワークに強制する悪意のある画像によって簡単に騙される。本稿では,画像変換による敵例の検出を幅広く検討し,新しい手法を提案する。
論文参考訳（メタデータ） (2021-01-27T14:50:41Z)
On the Transferability of Adversarial Attacksagainst Neural Text Classifier [121.6758865857686]
テキスト分類モデルの逆例の転送可能性について検討する。本稿では,ほとんどすべての既存モデルを騙すために,敵の例を誘導できるモデル群を見つける遺伝的アルゴリズムを提案する。これらの逆例からモデル診断に使用できる単語置換規則を導出する。
論文参考訳（メタデータ） (2020-11-17T10:45:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。