論文の概要: On Distinctive Properties of Universal Perturbations
- arxiv url: http://arxiv.org/abs/2112.15329v1
- Date: Fri, 31 Dec 2021 07:35:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-03 13:58:32.371354
- Title: On Distinctive Properties of Universal Perturbations
- Title(参考訳): 普遍摂動の特異性について
- Authors: Sung Min Park, Kuo-An Wei, Kai Xiao, Jerry Li, Aleksander Madry
- Abstract要約: 投射降下勾配によって生成された標的UAPは2つの人間配列特性を示すことを示す。
また,UAPは標準対向摂動よりも信号の一般化が著しく少ないことを示す。
- 参考スコア(独自算出の注目度): 83.32555186221052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We identify properties of universal adversarial perturbations (UAPs) that
distinguish them from standard adversarial perturbations. Specifically, we show
that targeted UAPs generated by projected gradient descent exhibit two
human-aligned properties: semantic locality and spatial invariance, which
standard targeted adversarial perturbations lack. We also demonstrate that UAPs
contain significantly less signal for generalization than standard adversarial
perturbations -- that is, UAPs leverage non-robust features to a smaller extent
than standard adversarial perturbations.
- Abstract(参考訳): 我々は、標準対向摂動と区別する普遍対向摂動(UAP)の特性を同定する。
具体的には、投影勾配降下によって生成された標的UAPが、標準的な対向的摂動を欠く意味的局所性と空間的不変性という2つの人間的な特性を示すことを示す。
また、UAPは標準対向摂動よりも一般化の信号が著しく少ないこと、すなわち、UAPは標準対向摂動よりも小さな範囲で非破壊的特徴を利用することを示した。
関連論文リスト
- Explainable Adversarial Attacks on Coarse-to-Fine Classifiers [4.1608968552041565]
本稿では,多段階分類器に対するインスタンスベースの逆攻撃を提案する。
提案手法は, LRPを用いて, 粗い, きめ細かな分類に不可欠な重要な特徴を同定し, ターゲットにすることで, 説明可能な逆方向の摂動を生成する。
従来の攻撃とは異なり、本手法は誤分類を誘発するだけでなく、分類段階にわたってモデルの動作の解釈可能性を高める。
論文 参考訳(メタデータ) (2025-01-19T00:23:02Z) - AFD: Mitigating Feature Gap for Adversarial Robustness by Feature Disentanglement [56.90364259986057]
逆方向の微調整法は、逆方向の訓練方法で事前訓練されたモデルを微調整することにより、逆方向の強靭性を高める。
本稿では,特定の潜伏する特徴を明示的にモデル化し,除去するためのアンタングルメントに基づくアプローチを提案する。
提案手法は,既存の対戦型微調整法や対戦型トレーニングベースラインを超越した手法である。
論文 参考訳(メタデータ) (2024-01-26T08:38:57Z) - Rethinking Domain Generalization: Discriminability and Generalizability [31.967801550742312]
ドメイン一般化(DG)は、優れた識別可能性を維持しつつ、強力な一般化性を持つ堅牢なモデルを開発する。
DMDA(Distriminative Microscopic Distribution Alignment)という新しいフレームワークを提案する。
DMDAはSelective Channel Pruning(SCP)とMicro-level Distribution Alignment(MDA)の2つのコアコンポーネントを組み込んでいる。
論文 参考訳(メタデータ) (2023-09-28T14:45:54Z) - STAR Loss: Reducing Semantic Ambiguity in Facial Landmark Detection [80.04000067312428]
本稿では,意味的あいまいさの特性を利用した自己適応型あいまいさ低減(STAR)の損失を提案する。
意味的あいまいさは異方性予測分布をもたらすことが分かり、予測分布を用いて意味的あいまいさを表現する。
また,分布の異常変化とモデルの初期収束を回避できる2種類の固有値制限法を提案する。
論文 参考訳(メタデータ) (2023-06-05T10:33:25Z) - Curve Your Enthusiasm: Concurvity Regularization in Differentiable
Generalized Additive Models [5.519653885553456]
GAM(Generalized Additive Models)はその解釈可能性のために最近人気が回復した。
我々は,GAMの解釈可能性の低下がいかに深刻かを示す。
線形変換しない特徴変数の相互相関をペナルティ化した,概念的には単純だが効果的な正則化器を提案する。
論文 参考訳(メタデータ) (2023-05-19T06:55:49Z) - A PAC-Bayesian Generalization Bound for Equivariant Networks [15.27608414735815]
我々は、同変ネットワークに対するノルムベースのPAC-ベイジアン一般化境界を導出する。
境界は、群のサイズ、および一般化誤差に対する可約表現の多重度と次数の影響を特徴づける。
一般に、モデルにおけるより大きなグループサイズを用いることで、広範な数値実験によって証明された一般化誤差が向上することを示す。
論文 参考訳(メタデータ) (2022-10-24T12:07:03Z) - Towards Defending against Adversarial Examples via Attack-Invariant
Features [147.85346057241605]
ディープニューラルネットワーク(DNN)は敵の雑音に弱い。
敵の強靭性は、敵の例を利用して改善することができる。
目に見えない種類の敵の例に基づいて訓練されたモデルは、一般的に、目に見えない種類の敵の例にうまく一般化できない。
論文 参考訳(メタデータ) (2021-06-09T12:49:54Z) - Double Targeted Universal Adversarial Perturbations [83.60161052867534]
本稿では, インスタンス別画像依存摂動と汎用的普遍摂動のギャップを埋めるために, 二重目標普遍摂動(DT-UAP)を導入する。
提案したDTAアルゴリズムの幅広いデータセットに対する有効性を示すとともに,物理攻撃の可能性を示す。
論文 参考訳(メタデータ) (2020-10-07T09:08:51Z) - Fundamental Tradeoffs between Invariance and Sensitivity to Adversarial
Perturbations [65.05561023880351]
敵の例は誤分類を引き起こすために作られた悪意のある入力である。
本稿では, 相補的障害モード, 不変性に基づく逆数例について検討する。
感度に基づく攻撃に対する防御は、不変性に基づく攻撃に対するモデルの精度を積極的に損なうことを示す。
論文 参考訳(メタデータ) (2020-02-11T18:50:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。