Fugu-MT 論文翻訳(概要): Adversarial Doodles: Interpretable and Human-drawable Attacks Provide Describable Insights

論文の概要: Adversarial Doodles: Interpretable and Human-drawable Attacks Provide Describable Insights

arxiv url: http://arxiv.org/abs/2311.15994v3
Date: Wed, 11 Sep 2024 11:55:16 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-12 22:03:32.450294
Title: Adversarial Doodles: Interpretable and Human-drawable Attacks Provide Describable Insights
Title（参考訳）: 逆行性ドゥードル:解釈可能で人力による攻撃は説明可能な洞察を与える
Authors: Ryoya Nara, Yusuke Matsui,
Abstract要約: 本稿では, 解釈可能な形状を持つ逆ドゥードルを提案する。我々は、人間が手動でそれらを複製しても、誤分類を引き起こす小さな攻撃を得る。
参考スコア（独自算出の注目度）: 12.555117983678624
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: DNN-based image classifiers are susceptible to adversarial attacks. Most previous adversarial attacks do not have clear patterns, making it difficult to interpret attacks' results and gain insights into classifiers' mechanisms. Therefore, we propose Adversarial Doodles, which have interpretable shapes. We optimize black bezier curves to fool the classifier by overlaying them onto the input image. By introducing random affine transformation and regularizing the doodled area, we obtain small-sized attacks that cause misclassification even when humans replicate them by hand. Adversarial doodles provide describable insights into the relationship between the human-drawn doodle's shape and the classifier's output, such as "When we add three small circles on a helicopter image, the ResNet-50 classifier mistakenly classifies it as an airplane."
Abstract（参考訳）: DNNベースの画像分類器は敵の攻撃を受けやすい。これまでのほとんどの敵攻撃は明確なパターンを持たないため、攻撃の結果を解釈し、分類器のメカニズムに関する洞察を得ることが困難である。そこで本研究では,解釈可能な形状を持つ逆ドゥードルを提案する。入力画像上にオーバーレイすることで、ブラックベジエ曲線を最適化し、分類器を騙す。ランダムなアフィン変換を導入してドード領域を正規化することにより、人間が手動で複製しても、誤分類を引き起こす小さな攻撃が得られる。例えば、「ヘリコプター画像に3つの小さな円を加えると、ResNet-50分類器は誤って飛行機として分類する」などである。

関連論文リスト

Web Artifact Attacks Disrupt Vision Language Models [61.59021920232986]
視覚言語モデル(VLM)は、大規模で軽量にキュレートされたWebデータセットに基づいて訓練されている。意味概念と無関係な視覚信号の間に意図しない相関関係を学習する。これまでの研究は、これらの相関関係をモデル予測を操作するための攻撃ベクトルとして武器化してきた。非マッチングテキストとグラフィカル要素の両方を使ってモデルを誤解させる新しい操作クラスである、アーティファクトベースのアタックを紹介します。
論文参考訳（メタデータ） (2025-03-17T18:59:29Z)
Robust Feature-Level Adversaries are Interpretability Tools [17.72884349429452]
イメージジェネレータの潜伏表現を操り、"機能レベル"の対向摂動を創りだす最近の研究は、認識可能な、解釈可能な対向攻撃を探求する機会を与えてくれる。これらの敵は、独自に多目的であり、非常に堅牢であることを示す。 ImageNetスケールでターゲット、普遍、偽装、物理的に実現可能、およびブラックボックス攻撃を生成するために使用できる。
論文参考訳（メタデータ） (2021-10-07T16:33:11Z)
Query-based Adversarial Attacks on Graph with Fake Nodes [32.67989796394633]
そこで本研究では,元のグラフに偽ノードの集合を導入することで,新たな敵攻撃を提案する。具体的には、各被害者ノードに対して、最も敵対的な特徴を取得するよう、被害者モデルに問い合わせる。私たちの攻撃は実用的で目立たない方法で行われます。
論文参考訳（メタデータ） (2021-09-27T14:19:17Z)
Real-World Adversarial Examples involving Makeup Application [58.731070632586594]
フルフェイスメイクを用いた身体的敵攻撃を提案する。我々の攻撃は、色や位置関連エラーなどのメークアップアプリケーションにおける手動エラーを効果的に克服できる。
論文参考訳（メタデータ） (2021-09-04T05:29:28Z)
Attack to Fool and Explain Deep Networks [59.97135687719244]
対人摂動における人為的意味のパターンの証拠を提供することによって、私たちは逆転する。我々の主な貢献は、その後視覚モデルを理解するためのツールに変換される、新しい実用的対人攻撃である。
論文参考訳（メタデータ） (2021-06-20T03:07:36Z)
Poisoned classifiers are not only backdoored, they are fundamentally broken [84.67778403778442]
一般的に研究されている、分類モデルに対するバックドア中毒攻撃の下で、攻撃者はトレーニングデータのサブセットに小さなトリガーを追加する。毒を盛った分類器は、引き金を持つ敵のみに弱いと推定されることが多い。本稿では,このバックドア型分類器の考え方が誤りであることを実証的に示す。
論文参考訳（メタデータ） (2020-10-18T19:42:44Z)
Learning to Attack with Fewer Pixels: A Probabilistic Post-hoc Framework for Refining Arbitrary Dense Adversarial Attacks [21.349059923635515]
敵対的回避攻撃はディープニューラルネットワーク画像分類器に影響を受けやすいと報告されている本稿では,乱れ画素数を著しく減少させることで,高密度攻撃を抑える確率的ポストホックフレームワークを提案する。我々のフレームワークは、既存のスパース攻撃よりもはるかに高速に敵攻撃を行う。
論文参考訳（メタデータ） (2020-10-13T02:51:10Z)
Adversarial examples are useful too! [47.64219291655723]
モデルがバックドア攻撃を受けたかどうかを判断する新しい手法を提案する。その考え方は、FGSMのような従来の攻撃を用いて、標的または未標的の敵の例を生成することである。障害のある地域を視覚的に見つけて、攻撃を露呈することができる。
論文参考訳（メタデータ） (2020-05-13T01:38:56Z)
Towards Feature Space Adversarial Attack [18.874224858723494]
本稿では,画像分類のためのニューラルネットに対する新たな敵攻撃を提案する。私たちの攻撃は、抽象的な特徴、具体的にはスタイルを表す特徴の摂動に焦点を当てています。我々の攻撃は、最先端の攻撃よりも自然に見える敵のサンプルを生成できることを示す。
論文参考訳（メタデータ） (2020-04-26T13:56:31Z)
Deflecting Adversarial Attacks [94.85315681223702]
我々は、攻撃者が攻撃対象クラスに似た入力を生成することによって、敵攻撃を「防御」するこのサイクルを終わらせる新しいアプローチを提案する。本稿ではまず,3つの検出機構を組み合わせたカプセルネットワークに基づくより強力な防御手法を提案する。
論文参考訳（メタデータ） (2020-02-18T06:59:13Z)
Over-the-Air Adversarial Flickering Attacks against Video Recognition Networks [54.82488484053263]
ビデオ分類のためのディープニューラルネットワークは、敵の操作を受けることができる。本稿では,フリックング時間摂動を導入することで,ビデオ分類器を騙す操作手法を提案する。攻撃はいくつかの標的モデルに実装され、攻撃の伝達性が実証された。
論文参考訳（メタデータ） (2020-02-12T17:58:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。