論文の概要: Defending Variational Autoencoders from Adversarial Attacks with MCMC
- arxiv url: http://arxiv.org/abs/2203.09940v1
- Date: Fri, 18 Mar 2022 13:25:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-21 19:25:40.933963
- Title: Defending Variational Autoencoders from Adversarial Attacks with MCMC
- Title(参考訳): MCMCによる敵攻撃からの変分オートエンコーダの回避
- Authors: Anna Kuzina, Max Welling, Jakub M. Tomczak
- Abstract要約: 変分オートエンコーダ(VAE)は、様々な領域で使用される深部生成モデルである。
以前の研究が示すように、視覚的にわずかに修正された入力に対する予期せぬ潜在表現と再構成を生成するために、VAEを簡単に騙すことができる。
本稿では, 敵攻撃構築のための目的関数について検討し, モデルのロバスト性を評価する指標を提案し, 解決策を提案する。
- 参考スコア(独自算出の注目度): 74.36233246536459
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Variational autoencoders (VAEs) are deep generative models used in various
domains. VAEs can generate complex objects and provide meaningful latent
representations, which can be further used in downstream tasks such as
classification. As previous work has shown, one can easily fool VAEs to produce
unexpected latent representations and reconstructions for a visually slightly
modified input. Here, we examine several objective functions for adversarial
attacks construction, suggest metrics assess the model robustness, and propose
a solution to alleviate the effect of an attack. Our method utilizes the Markov
Chain Monte Carlo (MCMC) technique in the inference step and is motivated by
our theoretical analysis. Thus, we do not incorporate any additional costs
during training or we do not decrease the performance on non-attacked inputs.
We validate our approach on a variety of datasets (MNIST, Fashion MNIST, Color
MNIST, CelebA) and VAE configurations ($\beta$-VAE, NVAE, TC-VAE) and show that
it consistently improves the model robustness to adversarial attacks.
- Abstract(参考訳): 変分オートエンコーダ(VAE)は、様々な領域で使用される深部生成モデルである。
VAEは複雑なオブジェクトを生成し、意味のある潜在表現を提供することができる。
以前の研究が示すように、視覚的にわずかに修正された入力に対する予期せぬ潜在表現と再構成を生成するために、VAEを簡単に騙すことができる。
本稿では,敵対的攻撃構築のための目的関数をいくつか検討し,モデルのロバスト性を評価する指標を提案し,攻撃の効果を緩和するための解決策を提案する。
本手法は,マルコフ連鎖モンテカルロ(mcmc)手法を推論ステップに応用し,理論解析により動機づけられている。
したがって、トレーニング中に追加コストを組み込まないか、非攻撃的な入力の性能を低下させません。
我々は,様々なデータセット (MNIST, Fashion MNIST, Color MNIST, CelebA) とVAE構成 (\beta$-VAE, NVAE, TC-VAE) にアプローチを検証し,敵攻撃に対するモデルロバスト性を一貫して改善していることを示す。
関連論文リスト
- MOREL: Enhancing Adversarial Robustness through Multi-Objective Representation Learning [1.534667887016089]
ディープニューラルネットワーク(DNN)は、わずかに敵対的な摂動に対して脆弱である。
トレーニング中の強力な特徴表現学習は、元のモデルの堅牢性を大幅に向上させることができることを示す。
本稿では,多目的特徴表現学習手法であるMORELを提案する。
論文 参考訳(メタデータ) (2024-10-02T16:05:03Z) - How to Robustify Black-Box ML Models? A Zeroth-Order Optimization
Perspective [74.47093382436823]
入力クエリと出力フィードバックだけでブラックボックスモデルを堅牢化する方法?
我々は,ブラックボックスモデルに適用可能な防御操作の一般的な概念を提案し,それを復号化スムーシング(DS)のレンズを通して設計する。
我々は,ZO-AE-DSが既存のベースラインよりも精度,堅牢性,クエリの複雑さを向上できることを実証的に示す。
論文 参考訳(メタデータ) (2022-03-27T03:23:32Z) - Discrete Auto-regressive Variational Attention Models for Text Modeling [53.38382932162732]
変分オートエンコーダ(VAE)はテキストモデリングに広く応用されている。
情報不足と後部崩壊という2つの課題に悩まされている。
本稿では,自己回帰変動注意モデル(DAVAM)を提案する。
論文 参考訳(メタデータ) (2021-06-16T06:36:26Z) - Diagnosing Vulnerability of Variational Auto-Encoders to Adversarial
Attacks [80.73580820014242]
所定の潜入コード(監視攻撃)を取得するためにデータポイントを変更するか、または劇的に異なるコード(監視されていない攻撃)を取得する方法を示します。
モデル修正がvaesのロバスト性に及ぼす影響を調べ,定量化のための指標を提案する。
論文 参考訳(メタデータ) (2021-03-10T14:23:20Z) - Autoencoding Variational Autoencoder [56.05008520271406]
我々は,この行動が学習表現に与える影響と,自己整合性の概念を導入することでそれを修正する結果について検討する。
自己整合性アプローチで訓練されたエンコーダは、敵攻撃による入力の摂動に対して頑健な(無神経な)表現につながることを示す。
論文 参考訳(メタデータ) (2020-12-07T14:16:14Z) - A Hamiltonian Monte Carlo Method for Probabilistic Adversarial Attack
and Learning [122.49765136434353]
本稿では,HMCAM (Acumulated Momentum) を用いたハミルトニアンモンテカルロ法を提案する。
また, 対数的対数的対数的学習(Contrastive Adversarial Training, CAT)と呼ばれる新たな生成法を提案し, 対数的例の平衡分布にアプローチする。
いくつかの自然画像データセットと実用システムに関する定量的および定性的な解析により、提案アルゴリズムの優位性が確認された。
論文 参考訳(メタデータ) (2020-10-15T16:07:26Z) - Luring of transferable adversarial perturbations in the black-box
paradigm [0.0]
我々は、ブラックボックス転送攻撃に対するモデルの堅牢性を改善するための新しいアプローチを提案する。
除去可能な追加ニューラルネットワークが対象モデルに含まれており、テクスチャリング効果を誘導するように設計されている。
提案手法は,対象モデルの予測にのみアクセス可能であり,ラベル付きデータセットを必要としない。
論文 参考訳(メタデータ) (2020-04-10T06:48:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。