Fugu-MT 論文翻訳(概要): Towards Good Practices in Evaluating Transfer Adversarial Attacks

論文の概要: Towards Good Practices in Evaluating Transfer Adversarial Attacks

arxiv url: http://arxiv.org/abs/2211.09565v3
Date: Sat, 28 Oct 2023 04:26:57 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-31 23:42:29.041483
Title: Towards Good Practices in Evaluating Transfer Adversarial Attacks
Title（参考訳）: 転校者攻撃評価の実践に向けて
Authors: Zhengyu Zhao, Hanwei Zhang, Renjue Li, Ronan Sicre, Laurent Amsaleg, Michael Backes
Abstract要約: 我々は、ImageNet上の9つの防御に対する23の代表的な攻撃を網羅し、転送攻撃の包括的評価を行った。特に,既存の攻撃を5つのカテゴリに分類することを提案する。また、さまざまな非受容性指標を採用し、よりきめ細かな特徴を探求することで、ステルスネスに特に注意を払っています。
参考スコア（独自算出の注目度）: 23.40245805066479
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Transfer adversarial attacks raise critical security concerns in real-world, black-box scenarios. However, the actual progress of this field is difficult to assess due to two common limitations in existing evaluations. First, different methods are often not systematically and fairly evaluated in a one-to-one comparison. Second, only transferability is evaluated but another key attack property, stealthiness, is largely overlooked. In this work, we design good practices to address these limitations, and we present the first comprehensive evaluation of transfer attacks, covering 23 representative attacks against 9 defenses on ImageNet. In particular, we propose to categorize existing attacks into five categories, which enables our systematic category-wise analyses. These analyses lead to new findings that even challenge existing knowledge and also help determine the optimal attack hyperparameters for our attack-wise comprehensive evaluation. We also pay particular attention to stealthiness, by adopting diverse imperceptibility metrics and looking into new, finer-grained characteristics. Overall, our new insights into transferability and stealthiness lead to actionable good practices for future evaluations.
Abstract（参考訳）: トランスファー攻撃は、現実のブラックボックスシナリオにおいて重要なセキュリティ上の懸念を引き起こす。しかし,既存の評価では2つの共通的な限界があるため,実際の評価は困難である。第一に、異なる方法はしばしば体系的にではなく、1対1の比較でかなり評価される。第2に、転送性のみが評価されるが、他の重要な攻撃特性であるステルス性は見過ごされている。本稿では,これらの制限に対処するための優れた手法をデザインし,imagenetにおける23の代表的な攻撃を対象とし,転送攻撃を包括的に評価する。特に,既存の攻撃を5つのカテゴリに分類することを提案する。これらの分析は、既存の知識にも挑戦し、攻撃的総合評価に最適な攻撃ハイパーパラメータを決定するのに役立つ新たな発見につながる。我々はまた、様々な非知覚性指標を採用し、新しいきめ細かい特徴を調べることで、ステルスネスに特に注意を払っています。全体として、転送可能性とステルス性に関する新たな洞察は、将来の評価に有効なベストプラクティスをもたらします。

関連論文リスト

A Critical Evaluation of Defenses against Prompt Injection Attacks [95.81023801370073]
大型言語モデル (LLM) はインジェクション攻撃に弱い。いくつかの防衛策が提案され、しばしばこれらの攻撃をうまく緩和すると主張した。既存の研究は、これらの防衛を評価するための原則的なアプローチを欠いていると論じる。
論文参考訳（メタデータ） (2025-05-23T19:39:56Z)
SecReEvalBench: A Multi-turned Security Resilience Evaluation Benchmark for Large Language Models [4.788427041690547]
本稿ではSecReEvalBench, Security Resilience Evaluation Benchmarkを紹介する。 Prompt Attack Resilience Score、Prompt Attack Refusal Logic Score、ChainベースのAttack Resilience Score、ChainベースのAttack Rejection Time Scoreの4つの新しいメトリクスを定義している。また、中立的なプロンプトと悪意のあるプロンプトの両方を組み込んだ、ベンチマーク用にカスタマイズされたデータセットも導入しています。
論文参考訳（メタデータ） (2025-05-12T14:09:24Z)
AttackEval: How to Evaluate the Effectiveness of Jailbreak Attacking on Large Language Models [29.92550386563915]
本稿では,大規模言語モデルに対するジェイルブレイク攻撃の有効性を評価するための,革新的なフレームワークを提案する。粗粒度評価と細粒度評価の2つの異なる評価フレームワークを提案する。我々は、ジェイルブレイクのプロンプトに特化して、総合的な真実データセットを開発する。
論文参考訳（メタデータ） (2024-01-17T06:42:44Z)
Towards Evaluating Transfer-based Attacks Systematically, Practically, and Fairly [79.07074710460012]
ディープニューラルネットワーク(DNN)の敵対的脆弱性に大きな注目を集めている。ブラックボックスDNNモデルを騙すための転送ベース手法が増えている。 30以上のメソッドを実装した転送ベースアタックベンチマーク(TA-Bench)を確立する。
論文参考訳（メタデータ） (2023-11-02T15:35:58Z)
Revisiting Transferable Adversarial Image Examples: Attack Categorization, Evaluation Guidelines, and New Insights [30.14129637790446]
トランスファー可能な敵の例は、現実のブラックボックス攻撃シナリオにおいて重要なセキュリティ上の懸念を引き起こす。本研究は,共通評価実践における2つの主要な問題点を明らかにするものである。我々は、ImageNet上で転送可能な敵例を大規模に評価する。
論文参考訳（メタデータ） (2023-10-18T10:06:42Z)
Adversarial Attacks and Defenses in Machine Learning-Powered Networks: A Contemporary Survey [114.17568992164303]
機械学習とディープニューラルネットワークにおけるアドリアックと防御が注目されている。本調査は、敵攻撃・防衛技術分野における最近の進歩を包括的に概観する。検索ベース、意思決定ベース、ドロップベース、物理世界攻撃など、新たな攻撃方法も検討されている。
論文参考訳（メタデータ） (2023-03-11T04:19:31Z)
MEAD: A Multi-Armed Approach for Evaluation of Adversarial Examples Detectors [24.296350262025552]
いくつかの攻撃戦略に基づいて検知器を評価するための新しいフレームワークMEADを提案する。そのうちの1つは、攻撃を起こすための3つの新しい目的である。提案したパフォーマンス指標は最悪のシナリオに基づいている。
論文参考訳（メタデータ） (2022-06-30T17:05:45Z)
Deep-Attack over the Deep Reinforcement Learning [26.272161868927004]
敵攻撃の開発により強化学習がより脆弱になった本研究は,実効性と盗聴を自然に考慮し,強化学習に基づく攻撃フレームワークを提案する。また,これらの2つの側面において,攻撃モデルの性能を評価するための新しい指標を提案する。
論文参考訳（メタデータ） (2022-05-02T10:58:19Z)
Model-Agnostic Meta-Attack: Towards Reliable Evaluation of Adversarial Robustness [53.094682754683255]
モデル非依存型メタアタック(MAMA)アプローチにより,より強力な攻撃アルゴリズムを自動検出する。本手法は、繰り返しニューラルネットワークによってパラメータ化された逆攻撃を学習する。本研究では,未知の防御を攻撃した場合の学習能力を向上させるために,モデルに依存しない訓練アルゴリズムを開発した。
論文参考訳（メタデータ） (2021-10-13T13:54:24Z)
Random Projections for Adversarial Attack Detection [8.684378639046644]
敵の攻撃検出は 2つの観点から根本的な問題です本稿では,無作為射影の特殊特性を利用して,清潔で敵対的な例の挙動を特徴付ける手法を提案する。性能評価は私達の技術が($>0.92$ AUC)技術(SOTA)攻撃戦略の競争状態を上回っていることを示します。
論文参考訳（メタデータ） (2020-12-11T15:02:28Z)
Guided Adversarial Attack for Evaluating and Enhancing Adversarial Defenses [59.58128343334556]
我々は、より適切な勾配方向を見つけ、攻撃効果を高め、より効率的な対人訓練をもたらす標準損失に緩和項を導入する。本稿では, クリーン画像の関数マッピングを用いて, 敵生成を誘導するGAMA ( Guided Adversarial Margin Attack) を提案する。また,一段防衛における最先端性能を実現するためのGAT ( Guided Adversarial Training) を提案する。
論文参考訳（メタデータ） (2020-11-30T16:39:39Z)
Reliable evaluation of adversarial robustness with an ensemble of diverse parameter-free attacks [65.20660287833537]
本稿では,最適段差の大きさと目的関数の問題による障害を克服するPGD攻撃の2つの拡張を提案する。そして、我々の新しい攻撃と2つの補完的な既存の攻撃を組み合わせることで、パラメータフリーで、計算に手頃な価格で、ユーザに依存しない攻撃のアンサンブルを形成し、敵の堅牢性をテストする。
論文参考訳（メタデータ） (2020-03-03T18:15:55Z)
On Adaptive Attacks to Adversarial Example Defenses [123.32678153377915]
本稿では、敵の事例に対して、防御に対する適応攻撃を行うために必要な方法論とアプローチを概説する。これらの分析が、敵の事例に対して適切な防御攻撃を行うためのガイダンスとして役立てられることを期待している。
論文参考訳（メタデータ） (2020-02-19T18:50:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。