Fugu-MT 論文翻訳(概要): Adversarial Example Games

論文の概要: Adversarial Example Games

arxiv url: http://arxiv.org/abs/2007.00720v6
Date: Sat, 9 Jan 2021 01:44:02 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-14 21:43:53.086588
Title: Adversarial Example Games
Title（参考訳）: 対戦型実演ゲーム
Authors: Avishek Joey Bose, Gauthier Gidel, Hugo Berard, Andre Cianflone, Pascal Vincent, Simon Lacoste-Julien and William L. Hamilton
Abstract要約: Adrial Example Games (AEG) は、敵の例の製作をモデル化するフレームワークである。 AEGは、ある仮説クラスからジェネレータとアバーサを反対に訓練することで、敵の例を設計する新しい方法を提供する。 MNIST と CIFAR-10 データセットに対する AEG の有効性を示す。
参考スコア（独自算出の注目度）: 51.92698856933169
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The existence of adversarial examples capable of fooling trained neural network classifiers calls for a much better understanding of possible attacks to guide the development of safeguards against them. This includes attack methods in the challenging non-interactive blackbox setting, where adversarial attacks are generated without any access, including queries, to the target model. Prior attacks in this setting have relied mainly on algorithmic innovations derived from empirical observations (e.g., that momentum helps), lacking principled transferability guarantees. In this work, we provide a theoretical foundation for crafting transferable adversarial examples to entire hypothesis classes. We introduce Adversarial Example Games (AEG), a framework that models the crafting of adversarial examples as a min-max game between a generator of attacks and a classifier. AEG provides a new way to design adversarial examples by adversarially training a generator and a classifier from a given hypothesis class (e.g., architecture). We prove that this game has an equilibrium, and that the optimal generator is able to craft adversarial examples that can attack any classifier from the corresponding hypothesis class. We demonstrate the efficacy of AEG on the MNIST and CIFAR-10 datasets, outperforming prior state-of-the-art approaches with an average relative improvement of $29.9\%$ and $47.2\%$ against undefended and robust models (Table 2 & 3) respectively.
Abstract（参考訳）: 訓練されたニューラルネットワーク分類器を騙すことができる敵の例の存在は、それらに対する安全策の開発を導くために考えられる攻撃をよりよく理解することを要求する。これには、ターゲットモデルへのクエリを含むいかなるアクセスもなしに逆攻撃が生成される、非インタラクティブなブラックボックス設定における攻撃メソッドが含まれている。この設定での先行攻撃は、主に経験的観察(例えば、運動量が役に立つ)に由来するアルゴリズム的な革新に依存しており、原理的な伝達可能性の保証を欠いている。本研究は,仮説クラス全体への移動可能な逆例を作成するための理論的基礎を提供する。我々は,攻撃生成器と分類器の間のミニマックスゲームとして,攻撃例の作成をモデル化するフレームワークであるadversarial example games(aeg)を紹介する。 AEGは、ある仮説クラス(アーキテクチャなど)からジェネレータと分類器を敵対的に訓練することで、敵の例を設計する新しい方法を提供する。このゲームに平衡性があることを証明し、最適生成器は対応する仮説クラスから任意の分類子を攻撃できる逆例を作成できることを示した。 MNIST と CIFAR-10 データセットにおける AEG の有効性を実証し、平均相対改善率29.9 %$ と 47.2 %$ をそれぞれ無防備モデルとロバストモデル (Table 2 と 3) と比較した。

関連論文リスト

MISLEADER: Defending against Model Extraction with Ensembles of Distilled Models [56.09354775405601]
モデル抽出攻撃は、クエリアクセスを通じてブラックボックスモデルの機能を複製することを目的としている。既存のディフェンスでは、アタッカークエリにはオフ・オブ・ディストリビューション(OOD)サンプルがあることを前提としており、不審な入力を検出し破壊することができる。 OOD仮定に依存しない新しい防衛戦略であるMISLEADERを提案する。
論文参考訳（メタデータ） (2025-06-03T01:37:09Z)
Meta Invariance Defense Towards Generalizable Robustness to Unknown Adversarial Attacks [62.036798488144306]
現在の防衛は主に既知の攻撃に焦点を当てているが、未知の攻撃に対する敵意の強固さは見過ごされている。メタ不変防衛(Meta Invariance Defense, MID)と呼ばれる攻撃非依存の防御手法を提案する。 MIDは高レベルの画像分類と低レベルの頑健な画像再生における攻撃抑制において,知覚不能な逆方向の摂動に対して同時に頑健性を実現する。
論文参考訳（メタデータ） (2024-04-04T10:10:38Z)
AdvDiff: Generating Unrestricted Adversarial Examples using Diffusion Models [7.406040859734522]
制限のない敵攻撃は、深層学習モデルや敵防衛技術に深刻な脅威をもたらす。以前の攻撃法は、しばしば生成モデルのサンプリングに投影された勾配(PGD)を直接注入する。本稿では,拡散モデルを用いた非制限逆例を生成するAdvDiffと呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (2023-07-24T03:10:02Z)
Adversarial Attacks are a Surprisingly Strong Baseline for Poisoning Few-Shot Meta-Learners [28.468089304148453]
これにより、システムの学習アルゴリズムを騙すような、衝突する入力セットを作れます。ホワイトボックス環境では、これらの攻撃は非常に成功しており、ターゲットモデルの予測が偶然よりも悪化する可能性があることを示す。攻撃による「過度な対応」と、攻撃が生成されたモデルと攻撃が転送されたモデルとのミスマッチという2つの仮説を探索する。
論文参考訳（メタデータ） (2022-11-23T14:55:44Z)
Understanding the Vulnerability of Skeleton-based Human Activity Recognition via Black-box Attack [53.032801921915436]
HAR(Human Activity Recognition)は、自動運転車など、幅広い用途に採用されている。近年,敵対的攻撃に対する脆弱性から,骨格型HAR法の堅牢性に疑問が呈されている。攻撃者がモデルの入出力しかアクセスできない場合でも、そのような脅威が存在することを示す。 BASARと呼ばれる骨格をベースとしたHARにおいて,最初のブラックボックス攻撃手法を提案する。
論文参考訳（メタデータ） (2022-11-21T09:51:28Z)
The Space of Adversarial Strategies [6.295859509997257]
機械学習モデルにおける最悪のケース動作を誘発するインプットである逆例は、過去10年間に広く研究されてきた。最悪の場合(すなわち最適な)敵を特徴づける体系的なアプローチを提案する。
論文参考訳（メタデータ） (2022-09-09T20:53:11Z)
Adversarial Robustness of Deep Reinforcement Learning based Dynamic Recommender Systems [50.758281304737444]
本稿では,強化学習に基づく対話型レコメンデーションシステムにおける敵例の探索と攻撃検出を提案する。まず、入力に摂動を加え、カジュアルな要因に介入することで、異なる種類の逆例を作成する。そこで,本研究では,人工データに基づく深層学習に基づく分類器による潜在的攻撃を検出することにより,推薦システムを強化した。
論文参考訳（メタデータ） (2021-12-02T04:12:24Z)
Towards A Conceptually Simple Defensive Approach for Few-shot classifiers Against Adversarial Support Samples [107.38834819682315]
本研究は,数発の分類器を敵攻撃から守るための概念的簡便なアプローチについて検討する。本稿では,自己相似性とフィルタリングの概念を用いた簡易な攻撃非依存検出法を提案する。ミニイメージネット(MI)とCUBデータセットの攻撃検出性能は良好である。
論文参考訳（メタデータ） (2021-10-24T05:46:03Z)
Are Adversarial Examples Created Equal? A Learnable Weighted Minimax Risk for Robustness under Non-uniform Attacks [70.11599738647963]
敵の訓練は、強力な攻撃に耐える数少ない防衛の1つである。従来の防御機構は、基礎となるデータ分布に従って、サンプルに対する均一な攻撃を前提とします。非一様攻撃に対して重み付けされたミニマックスリスク最適化を提案する。
論文参考訳（メタデータ） (2020-10-24T21:20:35Z)
ATRO: Adversarial Training with a Rejection Option [10.36668157679368]
本稿では, 逆例による性能劣化を軽減するために, 拒否オプション付き分類フレームワークを提案する。分類器と拒否関数を同時に適用することにより、テストデータポイントの分類に自信が不十分な場合に分類を控えることができる。
論文参考訳（メタデータ） (2020-10-24T14:05:03Z)
Challenging the adversarial robustness of DNNs based on error-correcting output codes [33.46319608673487]
ECOCベースのネットワークは、小さな逆方向の摂動を導入することで、非常に容易に攻撃できる。敵の例は、予測対象クラスの高い確率を達成するために、このような方法で生成することができる。
論文参考訳（メタデータ） (2020-03-26T12:14:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。