論文の概要: Game-theoretic Understanding of Adversarially Learned Features
- arxiv url: http://arxiv.org/abs/2103.07364v1
- Date: Fri, 12 Mar 2021 15:56:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-15 13:33:10.410405
- Title: Game-theoretic Understanding of Adversarially Learned Features
- Title(参考訳): 逆学習特徴のゲーム理論的理解
- Authors: Jie Ren, Die Zhang, Yisen Wang, Lu Chen, Zhanpeng Zhou, Xu Cheng, Xin
Wang, Yiting Chen, Jie Shi, Quanshi Zhang
- Abstract要約: 本論文は,DNNの信号処理挙動という,新たな種別からの敵対攻撃と防御を理解することを目的とする。
6つの性質を満たすゲーム理論における多階相互作用を新たに定義する。
- 参考スコア(独自算出の注目度): 38.19291233245746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper aims to understand adversarial attacks and defense from a new
perspecitve, i.e., the signal-processing behavior of DNNs. We novelly define
the multi-order interaction in game theory, which satisfies six properties.
With the multi-order interaction, we discover that adversarial attacks mainly
affect high-order interactions to fool the DNN. Furthermore, we find that the
robustness of adversarially trained DNNs comes from category-specific low-order
interactions. Our findings provide more insights into and make a revision of
previous understanding for the shape bias of adversarially learned features.
Besides, the multi-order interaction can also explain the recoverability of
adversarial examples.
- Abstract(参考訳): 本論文は,DNNの信号処理挙動という,新たな種別からの敵対攻撃と防御を理解することを目的とする。
6つの性質を満たすゲーム理論における多階相互作用を新たに定義する。
マルチオーダーの相互作用では、敵対攻撃がDNNをだますために高階の相互作用に主に影響することを発見します。
さらに、敵対的に訓練されたDNNのロバスト性は、カテゴリー固有の低次相互作用によってもたらされる。
本研究は,敵意学習機能の形状バイアスに対する事前理解のさらなる考察と修正を行う。
さらに、多階相互作用は逆例の回復可能性も説明できる。
関連論文リスト
- A Survey on Transferability of Adversarial Examples across Deep Neural
Networks [54.47263618782188]
逆の例では、機械学習モデルを操作して誤った予測を行うことができます。
敵の例の転送可能性によって"ブラックボックス"攻撃が可能になり、ターゲットモデルの詳細な知識の必要性を回避することができる。
本研究は, 対角移動可能性の展望を考察した。
論文 参考訳(メタデータ) (2023-10-26T17:45:26Z) - Investigating Human-Identifiable Features Hidden in Adversarial
Perturbations [54.39726653562144]
我々の研究では、最大5つの攻撃アルゴリズムを3つのデータセットにわたって探索する。
対人摂動における人間の識別可能な特徴を同定する。
画素レベルのアノテーションを用いて、そのような特徴を抽出し、ターゲットモデルに妥協する能力を実証する。
論文 参考訳(メタデータ) (2023-09-28T22:31:29Z) - Re-mine, Learn and Reason: Exploring the Cross-modal Semantic
Correlations for Language-guided HOI detection [57.13665112065285]
ヒューマンオブジェクトインタラクション(HOI)検出は、コンピュータビジョンの課題である。
本稿では,構造化テキスト知識を組み込んだHOI検出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-25T14:20:52Z) - Latent Boundary-guided Adversarial Training [61.43040235982727]
モデルトレーニングに敵の例を注入する最も効果的な戦略は、敵のトレーニングであることが証明されている。
本稿では, LAtent bounDary-guided aDvErsarial tRaining という新たな逆トレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-08T07:40:55Z) - Discovering and Explaining the Representation Bottleneck of DNNs [21.121270460158712]
本稿では,ディープニューラルネットワーク(DNN)の特徴表現のボトルネックについて検討する。
入力変数間の多階相互作用に焦点をあて、その順序は相互作用の複雑さを表す。
DNNは単純すぎる相互作用と複雑すぎる相互作用の両方を符号化する傾向にあるが、通常は中間複雑性の相互作用を学習することができない。
論文 参考訳(メタデータ) (2021-11-11T14:35:20Z) - A Unified Game-Theoretic Interpretation of Adversarial Robustness [39.64586231421121]
本稿では,異なる敵攻撃と防御方法を説明する統一的な視点を提供する。
本研究は, 敵の摂動と強靭性を統一する可能性があり, 既存の防御法を原則的に説明できる。
論文 参考訳(メタデータ) (2021-11-05T14:57:49Z) - Interpreting Attributions and Interactions of Adversarial Attacks [19.50612458496236]
本稿では、敵の摂動が攻撃課題にどのように貢献するかという観点から、敵の攻撃を説明することを目的とする。
逆摂動画素間の相互作用を定義し定量化し、摂動マップ全体を比較的独立した摂動成分に分解する。
論文 参考訳(メタデータ) (2021-08-16T04:59:39Z) - Recent Advances in Understanding Adversarial Robustness of Deep Neural
Networks [15.217367754000913]
敵の例に抵抗する高い堅牢性を持つモデルを得ることがますます重要である。
我々は、敵の攻撃と堅牢性について、予備的な定義を与える。
我々は、頻繁に使用されるベンチマークについて研究し、理論的に証明された敵の堅牢性の境界について言及する。
論文 参考訳(メタデータ) (2020-11-03T07:42:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。