Fugu-MT 論文翻訳(概要): Deviations in Representations Induced by Adversarial Attacks

論文の概要: Deviations in Representations Induced by Adversarial Attacks

arxiv url: http://arxiv.org/abs/2211.03714v1
Date: Mon, 7 Nov 2022 17:40:08 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-08 18:05:03.479665
Title: Deviations in Representations Induced by Adversarial Attacks
Title（参考訳）: 敵の攻撃による表現の偏差
Authors: Daniel Steinberg, Paul Munro
Abstract要約: 研究によると、ディープラーニングモデルは敵の攻撃に弱い。この発見は研究の新たな方向性をもたらし、脆弱性のあるネットワークを攻撃して防御するためにアルゴリズムが開発された。本稿では,敵攻撃によって引き起こされる表現の偏差を計測し,解析する手法を提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep learning has been a popular topic and has achieved success in many areas. It has drawn the attention of researchers and machine learning practitioners alike, with developed models deployed to a variety of settings. Along with its achievements, research has shown that deep learning models are vulnerable to adversarial attacks. This finding brought about a new direction in research, whereby algorithms were developed to attack and defend vulnerable networks. Our interest is in understanding how these attacks effect change on the intermediate representations of deep learning models. We present a method for measuring and analyzing the deviations in representations induced by adversarial attacks, progressively across a selected set of layers. Experiments are conducted using an assortment of attack algorithms, on the CIFAR-10 dataset, with plots created to visualize the impact of adversarial attacks across different layers in a network.
Abstract（参考訳）: ディープラーニングは人気のあるトピックであり、多くの分野で成功しています。研究者や機械学習の実践者たちも注目しており、様々な設定に開発モデルが展開されている。その成果とともに、ディープラーニングモデルは敵の攻撃に弱いことが研究で示されている。この発見は研究の新しい方向性をもたらし、脆弱性のあるネットワークを攻撃して防御するためにアルゴリズムが開発された。我々の関心は、これらの攻撃がディープラーニングモデルの中間表現にどのように影響するかを理解することである。本稿では, 敵攻撃によって引き起こされる表現の偏差を, 選択的に測定し, 解析する手法を提案する。 CIFAR-10データセット上で、ネットワーク内の異なる層にまたがる敵攻撃の影響を可視化するプロットを用いて、一連の攻撃アルゴリズムを用いて実験を行う。

関連論文リスト

Exploiting Edge Features for Transferable Adversarial Attacks in Distributed Machine Learning [54.26807397329468]
この研究は、分散ディープラーニングシステムにおいて、これまで見過ごされていた脆弱性を探究する。中間的特徴をインターセプトする敵は、依然として深刻な脅威となる可能性がある。本稿では,分散環境に特化して設計されたエクスプロイト戦略を提案する。
論文参考訳（メタデータ） (2025-07-09T20:09:00Z)
Investigating Human-Identifiable Features Hidden in Adversarial Perturbations [54.39726653562144]
我々の研究では、最大5つの攻撃アルゴリズムを3つのデータセットにわたって探索する。対人摂動における人間の識別可能な特徴を同定する。画素レベルのアノテーションを用いて、そのような特徴を抽出し、ターゲットモデルに妥協する能力を実証する。
論文参考訳（メタデータ） (2023-09-28T22:31:29Z)
How Deep Learning Sees the World: A Survey on Adversarial Attacks & Defenses [0.0]
本稿では、攻撃能力によってグループ化された最新の敵攻撃と、防御戦略によってクラスタ化された現代の防御をコンパイルする。また、視覚変換器に関する新たな進歩を提示し、敵対的設定の文脈で使用されるデータセットとメトリクスを要約し、異なる攻撃下での最先端の結果を比較し、オープンな問題の特定で終了する。
論文参考訳（メタデータ） (2023-05-18T10:33:28Z)
Interpretations Cannot Be Trusted: Stealthy and Effective Adversarial Perturbations against Interpretable Deep Learning [16.13790238416691]
この研究はAdvEdgeとAdvEdge$+$という2つの攻撃を導入し、ターゲットのディープラーニングモデルと組み合わせた解釈モデルの両方を欺いた。我々の分析は、ディープラーニングモデルとそのインタプリタを騙すという観点から、我々の攻撃の有効性を示している。
論文参考訳（メタデータ） (2022-11-29T04:45:10Z)
Recent improvements of ASR models in the face of adversarial attacks [28.934863462633636]
音声認識モデルは敵攻撃に対して脆弱である。異なる攻撃アルゴリズムの相対的強度は、モデルアーキテクチャを変更する際に大きく異なることを示す。ソースコードをパッケージとしてリリースし、将来の攻撃と防御の評価に役立ちます。
論文参考訳（メタデータ） (2022-03-29T22:40:37Z)
Improving robustness of jet tagging algorithms with adversarial training [56.79800815519762]
本研究では,フレーバータグ付けアルゴリズムの脆弱性について,敵攻撃による検証を行った。シミュレーション攻撃の影響を緩和する対人訓練戦略を提案する。
論文参考訳（メタデータ） (2022-03-25T19:57:19Z)
Adversarial Robustness of Deep Reinforcement Learning based Dynamic Recommender Systems [50.758281304737444]
本稿では,強化学習に基づく対話型レコメンデーションシステムにおける敵例の探索と攻撃検出を提案する。まず、入力に摂動を加え、カジュアルな要因に介入することで、異なる種類の逆例を作成する。そこで,本研究では,人工データに基づく深層学習に基づく分類器による潜在的攻撃を検出することにより,推薦システムを強化した。
論文参考訳（メタデータ） (2021-12-02T04:12:24Z)
Towards A Conceptually Simple Defensive Approach for Few-shot classifiers Against Adversarial Support Samples [107.38834819682315]
本研究は,数発の分類器を敵攻撃から守るための概念的簡便なアプローチについて検討する。本稿では,自己相似性とフィルタリングの概念を用いた簡易な攻撃非依存検出法を提案する。ミニイメージネット(MI)とCUBデータセットの攻撃検出性能は良好である。
論文参考訳（メタデータ） (2021-10-24T05:46:03Z)
Identification of Attack-Specific Signatures in Adversarial Examples [62.17639067715379]
異なる攻撃アルゴリズムは, その効果だけでなく, 被害者の質的な影響も示している。以上の結果から, 予測的対人攻撃は, 模擬モデルにおける成功率だけでなく, 被害者に対するより深い下流効果によって比較されるべきであることが示唆された。
論文参考訳（メタデータ） (2021-10-13T15:40:48Z)
Explainable Adversarial Attacks in Deep Neural Networks Using Activation Profiles [69.9674326582747]
本稿では,敵対的事例に基づくニューラルネットワークモデルを検討するためのビジュアルフレームワークを提案する。これらの要素を観察することで、モデル内の悪用領域を素早く特定できることを示す。
論文参考訳（メタデータ） (2021-03-18T13:04:21Z)
Detection Defense Against Adversarial Attacks with Saliency Map [7.736844355705379]
ニューラルネットワークは、人間の視覚にほとんど受容できない敵の例に弱いことがよく確認されている。既存の防衛は、敵の攻撃に対するモデルの堅牢性を強化する傾向にある。本稿では,新たな雑音と組み合わせた新しい手法を提案し,不整合戦略を用いて敵のサンプルを検出する。
論文参考訳（メタデータ） (2020-09-06T13:57:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。