論文の概要: The Relationship Between Network Similarity and Transferability of Adversarial Attacks
- arxiv url: http://arxiv.org/abs/2501.18629v1
- Date: Mon, 27 Jan 2025 17:07:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-03 14:02:10.739130
- Title: The Relationship Between Network Similarity and Transferability of Adversarial Attacks
- Title(参考訳): 敵攻撃のネットワーク類似性と伝達性の関係
- Authors: Gerrit Klause, Niklas Bunzel,
- Abstract要約: 我々は,多数の畳み込みニューラルネットワーク(CNN)と敵攻撃の相関関係を見出した。
レイヤの類似性は、DataParallel、Dropout、Conv2dといった一貫性のある基本的なレイヤにとって最も高かった。
DecisionTreeRegressorは、90%以上の精度で転送された攻撃の成功率を予測することができる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Neural networks are vulnerable to adversarial attacks, and several defenses have been proposed. Designing a robust network is a challenging task given the wide range of attacks that have been developed. Therefore, we aim to provide insight into the influence of network similarity on the success rate of transferred adversarial attacks. Network designers can then compare their new network with existing ones to estimate its vulnerability. To achieve this, we investigate the complex relationship between network similarity and the success rate of transferred adversarial attacks. We applied the Centered Kernel Alignment (CKA) network similarity score and used various methods to find a correlation between a large number of Convolutional Neural Networks (CNNs) and adversarial attacks. Network similarity was found to be moderate across different CNN architectures, with more complex models such as DenseNet showing lower similarity scores due to their architectural complexity. Layer similarity was highest for consistent, basic layers such as DataParallel, Dropout and Conv2d, while specialized layers showed greater variability. Adversarial attack success rates were generally consistent for non-transferred attacks, but varied significantly for some transferred attacks, with complex networks being more vulnerable. We found that a DecisionTreeRegressor can predict the success rate of transferred attacks for all black-box and Carlini & Wagner attacks with an accuracy of over 90%, suggesting that predictive models may be viable under certain conditions. However, the variability of results across different data subsets underscores the complexity of these relationships and suggests that further research is needed to generalize these findings across different attack scenarios and network architectures.
- Abstract(参考訳): ニューラルネットワークは敵の攻撃に対して脆弱であり、いくつかの防御策が提案されている。
堅牢なネットワークを設計することは、幅広い攻撃が開発されていることを考えると、難しい作業である。
そこで本研究では,ネットワークの類似性による攻撃の成功率への影響について考察する。
ネットワークデザイナは新たなネットワークと既存のネットワークを比較して脆弱性を見積もることができる。
そこで本研究では,ネットワークの類似性と転倒攻撃の成功率との複雑な関係について検討する。
また,CNN(Centered Kernel Alignment, CKA)ネットワーク類似度スコアを適用し, 多数の畳み込みニューラルネットワーク(CNN)と敵攻撃の相関関係について検討した。
ネットワークの類似性は、異なるCNNアーキテクチャで適度であることが判明し、DenseNetのようなより複雑なモデルでは、アーキテクチャの複雑さにより、類似度が低いことが判明した。
レイヤの類似性は、DataParallel、Dropout、Conv2dなど、一貫性のある基本的なレイヤに対して最も高く、特殊なレイヤはより可変性を示した。
敵の攻撃の成功率は概して非伝達攻撃には一貫性があったが、移行攻撃には大きな違いがあり、複雑なネットワークはより脆弱である。
その結果,DecisionTreeRegressorはすべてのブラックボックスとCarini & Wagner攻撃に対する攻撃の成功率を90%以上の精度で予測でき,特定の条件下では予測モデルが有効である可能性が示唆された。
しかしながら、異なるデータサブセット間の結果の変動は、これらの関係の複雑さを浮き彫りにして、異なる攻撃シナリオやネットワークアーキテクチャでこれらの結果を一般化するためには、さらなる研究が必要であることを示唆している。
関連論文リスト
- Investigating Human-Identifiable Features Hidden in Adversarial
Perturbations [54.39726653562144]
我々の研究では、最大5つの攻撃アルゴリズムを3つのデータセットにわたって探索する。
対人摂動における人間の識別可能な特徴を同定する。
画素レベルのアノテーションを用いて、そのような特徴を抽出し、ターゲットモデルに妥協する能力を実証する。
論文 参考訳(メタデータ) (2023-09-28T22:31:29Z) - Thermal Heating in ReRAM Crossbar Arrays: Challenges and Solutions [0.5672132510411465]
本稿では,CIFAR-10データセットの画像分類問題に対するSpinalNetベースのニューラルネットワークやコンパクト畳み込み変換器(CCT)などの新しいモデルの堅牢性を検討した。
特定の個人モデルに対する攻撃の有効性が高いにもかかわらず、これは他のモデルへの転送可能性を保証するものではないことが示されている。
論文 参考訳(メタデータ) (2022-12-28T05:47:19Z) - From Environmental Sound Representation to Robustness of 2D CNN Models
Against Adversarial Attacks [82.21746840893658]
本稿では, 各種環境音響表現(スペクトログラム)が, 被害者残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
DWTスペクトログラムでトレーニングしたResNet-18モデルでは高い認識精度が得られたが、このモデルに対する攻撃は敵にとって比較的コストがかかる。
論文 参考訳(メタデータ) (2022-04-14T15:14:08Z) - Adversarial Attack via Dual-Stage Network Erosion [7.28871533402894]
ディープニューラルネットワークは敵の例に弱いため、微妙な摂動を加えることでディープモデルを騙すことができる。
本稿では, 既存モデルに2段階の特徴レベル摂動を適用し, 多様なモデルの集合を暗黙的に生成する手法を提案する。
我々は、非残留ネットワークと残留ネットワークの両方で包括的な実験を行い、最先端の計算手法と同様の計算コストで、より伝達可能な逆の例を得る。
論文 参考訳(メタデータ) (2022-01-01T02:38:09Z) - Identification of Attack-Specific Signatures in Adversarial Examples [62.17639067715379]
異なる攻撃アルゴリズムは, その効果だけでなく, 被害者の質的な影響も示している。
以上の結果から, 予測的対人攻撃は, 模擬モデルにおける成功率だけでなく, 被害者に対するより深い下流効果によって比較されるべきであることが示唆された。
論文 参考訳(メタデータ) (2021-10-13T15:40:48Z) - Demystifying the Transferability of Adversarial Attacks in Computer
Networks [23.80086861061094]
CNNベースのモデルは様々な敵攻撃を受ける。
いくつかの敵対的な例は、異なる未知のモデルに対して効果がある可能性がある。
本稿では,CNNモデルによる対向移動性に対するロバスト性を評価する。
論文 参考訳(メタデータ) (2021-10-09T07:20:44Z) - TREND: Transferability based Robust ENsemble Design [6.663641564969944]
本稿では, ネットワークアーキテクチャ, 入力, 重量, アクティベーションの量子化が, 対向サンプルの転送性に及ぼす影響について検討する。
本研究では,ソースとターゲット間の入力量子化によってトランスファービリティが著しく阻害されていることを示す。
我々は、これに対抗するために、新しい最先端のアンサンブル攻撃を提案する。
論文 参考訳(メタデータ) (2020-08-04T13:38:14Z) - Understanding and Diagnosing Vulnerability under Adversarial Attacks [62.661498155101654]
ディープニューラルネットワーク(DNN)は敵の攻撃に弱いことが知られている。
本稿では,潜在変数の分類に使用される特徴を説明するために,新しい解釈可能性手法であるInterpretGANを提案する。
また、各層がもたらす脆弱性を定量化する最初の診断方法も設計する。
論文 参考訳(メタデータ) (2020-07-17T01:56:28Z) - Bridging Mode Connectivity in Loss Landscapes and Adversarial Robustness [97.67477497115163]
我々は、モード接続を用いて、ディープニューラルネットワークの対角的堅牢性を研究する。
実験では、異なるネットワークアーキテクチャやデータセットに適用される様々な種類の敵攻撃について取り上げる。
以上の結果から,モード接続は,敵の強靭性を評価・改善するための総合的なツールであり,実用的な手段であることが示唆された。
論文 参考訳(メタデータ) (2020-04-30T19:12:50Z) - Transferable Perturbations of Deep Feature Distributions [102.94094966908916]
本研究は,クラスワイドおよび層ワイドな特徴分布のモデリングと利用に基づく新たな敵攻撃を提案する。
我々は、未定義の画像ネットモデルに対して、最先端のブラックボックス転送に基づく攻撃結果を得る。
論文 参考訳(メタデータ) (2020-04-27T00:32:25Z) - Architectural Resilience to Foreground-and-Background Adversarial Noise [0.0]
正常な画像の知覚不能な摂動の形でのアドリサイドアタックが広く研究されている。
本稿では,異なるネットワークアーキテクチャのレジリエンスとロバスト性を検討するために,画像の異なるモデルに依存しないベンチマーク摂動を提案する。
論文 参考訳(メタデータ) (2020-03-23T01:38:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。