論文の概要: Logit Margin Matters: Improving Transferable Targeted Adversarial Attack
by Logit Calibration
- arxiv url: http://arxiv.org/abs/2303.03680v1
- Date: Tue, 7 Mar 2023 06:42:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-08 16:17:20.102466
- Title: Logit Margin Matters: Improving Transferable Targeted Adversarial Attack
by Logit Calibration
- Title(参考訳): ロジットマージン問題:ロジットキャリブレーションによる移動可能なターゲティング・アタックの改善
- Authors: Juanjuan Weng, Zhiming Luo, Zhun Zhong, Shaozi Li, Nicu Sebe
- Abstract要約: クロスエントロピー(CE)損失関数は、伝達可能な標的対向例を学習するには不十分である。
本稿では,ロジットを温度係数と適応マージンでダウンスケールすることで,ロジットのキャリブレーションを簡易かつ効果的に行う2つの手法を提案する。
ImageNetデータセットを用いて実験を行い,提案手法の有効性を検証した。
- 参考スコア(独自算出の注目度): 85.71545080119026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous works have extensively studied the transferability of adversarial
samples in untargeted black-box scenarios. However, it still remains
challenging to craft targeted adversarial examples with higher transferability
than non-targeted ones. Recent studies reveal that the traditional
Cross-Entropy (CE) loss function is insufficient to learn transferable targeted
adversarial examples due to the issue of vanishing gradient. In this work, we
provide a comprehensive investigation of the CE loss function and find that the
logit margin between the targeted and untargeted classes will quickly obtain
saturation in CE, which largely limits the transferability. Therefore, in this
paper, we devote to the goal of continually increasing the logit margin along
the optimization to deal with the saturation issue and propose two simple and
effective logit calibration methods, which are achieved by downscaling the
logits with a temperature factor and an adaptive margin, respectively. Both of
them can effectively encourage optimization to produce a larger logit margin
and lead to higher transferability. Besides, we show that minimizing the cosine
distance between the adversarial examples and the classifier weights of the
target class can further improve the transferability, which is benefited from
downscaling logits via L2-normalization. Experiments conducted on the ImageNet
dataset validate the effectiveness of the proposed methods, which outperform
the state-of-the-art methods in black-box targeted attacks. The source code is
available at \href{https://github.com/WJJLL/Target-Attack/}{Link}
- Abstract(参考訳): 従来の研究は、標的のないブラックボックスシナリオにおける敵のサンプルの転送可能性について広範囲に研究されてきた。
しかし、ターゲットでないものよりも高い転送性でターゲットとなる敵の例を作るのは依然として困難である。
近年の研究では、従来のクロスエントロピー(CE)損失関数は、消失勾配の問題により、移動可能な敵のサンプルを学習するには不十分であることが示されている。
本研究では,CEの損失関数の包括的調査を行い,対象クラスと未対象クラス間のロジットマージンがCEの飽和を素早く得ることを明らかにする。
そこで本稿では,飽和問題に対処するために,最適化に伴うロジットマージンを継続的に増やすことを目標とし,それぞれ温度係数と適応マージンでロジットをダウンスケールすることで達成した2つの単純かつ効果的なロジットキャリブレーション手法を提案する。
どちらも効果的に最適化を奨励し、ロジットマージンを大きくし、転送可能性を高めることができる。
また,逆例間のコサイン距離と対象クラスの分類子重みの最小化により,l2正規化によるロジットのダウンスケーリングのメリットを生かした転送性がさらに向上することを示す。
imagenetデータセットで行った実験は、ブラックボックス標的攻撃において最先端のメソッドを上回る提案手法の有効性を検証する。
ソースコードは \href{https://github.com/WJLL/Target-Attack/}{Link} で入手できる。
関連論文リスト
- Perturbation Towards Easy Samples Improves Targeted Adversarial Transferability [6.631279159122179]
ESMA(Easy Sample Matching Attack)と呼ばれる攻撃戦略が提案されている。
ESMAは標的攻撃の成功率が高く、SOTA生成法より優れている。
論文 参考訳(メタデータ) (2024-06-08T17:33:23Z) - Improving Transferable Targeted Adversarial Attack via Normalized Logit Calibration and Truncated Feature Mixing [26.159434438078968]
損失・特徴面から目標転送可能性を改善するための2つの手法を提案する。
以前のアプローチでは、ロジットキャリブレーションは主にターゲットクラスとサンプル間の未ターゲットクラスの間のロジットマージンに焦点を当てていた。
本稿では,ロジットマージンと標準偏差を共同で検討する正規化ロジット校正手法を提案する。
論文 参考訳(メタデータ) (2024-05-10T09:13:57Z) - Query-Efficient Black-box Adversarial Attacks Guided by a Transfer-based
Prior [50.393092185611536]
対象モデルの勾配にアクセスできることなく、敵が敵の例を作らなければならないブラックボックスの敵設定を考える。
従来の手法では、代用ホワイトボックスモデルの転送勾配を用いたり、モデルクエリのフィードバックに基づいて真の勾配を近似しようとした。
偏りサンプリングと勾配平均化に基づく2つの事前誘導型ランダム勾配フリー(PRGF)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-13T04:06:27Z) - Towards Transferable Unrestricted Adversarial Examples with Minimum
Changes [13.75751221823941]
転送ベースの敵の例はブラックボックス攻撃の最も重要なクラスの一つである。
対人摂動の伝達可能性と非受容性の間にはトレードオフがある。
最小限の変更を伴って転送可能な逆例を生成するための幾何対応フレームワークを提案する。
論文 参考訳(メタデータ) (2022-01-04T12:03:20Z) - Adaptive Perturbation for Adversarial Attack [50.77612889697216]
そこで本研究では,新たな逆例に対する勾配に基づく攻撃手法を提案する。
逆方向の摂動を発生させるために,スケーリング係数を用いた正確な勾配方向を用いる。
本手法は, 高い伝達性を示し, 最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2021-11-27T07:57:41Z) - Boosting Transferability of Targeted Adversarial Examples via
Hierarchical Generative Networks [56.96241557830253]
転送ベースの敵攻撃はブラックボックス設定におけるモデルロバスト性を効果的に評価することができる。
本稿では,異なるクラスを対象にした対角的例を生成する条件生成攻撃モデルを提案する。
提案手法は,既存の手法と比較して,標的となるブラックボックス攻撃の成功率を大幅に向上させる。
論文 参考訳(メタデータ) (2021-07-05T06:17:47Z) - On Generating Transferable Targeted Perturbations [102.3506210331038]
伝達性の高い標的摂動に対する新しい生成的アプローチを提案する。
私たちのアプローチは、ターゲットクラスの「乱れた画像分布」にマッチし、高いターゲット転送率につながります。
論文 参考訳(メタデータ) (2021-03-26T17:55:28Z) - Towards Accurate Knowledge Transfer via Target-awareness Representation
Disentanglement [56.40587594647692]
本稿では,TRED(Target-Awareness Representation Disentanglement)の概念を取り入れた新しいトランスファー学習アルゴリズムを提案する。
TREDは、対象のタスクに関する関連する知識を元のソースモデルから切り離し、ターゲットモデルを微調整する際、レギュレータとして使用する。
各種実世界のデータセットを用いた実験により,本手法は標準微調整を平均2%以上安定的に改善することが示された。
論文 参考訳(メタデータ) (2020-10-16T17:45:08Z) - Continuous Transfer Learning with Label-informed Distribution Alignment [42.34180707803632]
時間発展ターゲット領域を持つ新しい連続移動学習環境について検討する。
連続移動学習に関連する大きな課題の1つは、負転移の発生の可能性である。
本稿では,TransLATE という汎用逆変分自動エンコーダフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-05T04:44:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。