Fugu-MT 論文翻訳(概要): CEPA: Consensus Embedded Perturbation for Agnostic Detection and Inversion of Backdoors

論文の概要: CEPA: Consensus Embedded Perturbation for Agnostic Detection and Inversion of Backdoors

arxiv url: http://arxiv.org/abs/2402.02034v3
Date: Thu, 06 Mar 2025 20:00:04 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-10 19:13:14.530317
Title: CEPA: Consensus Embedded Perturbation for Agnostic Detection and Inversion of Backdoors
Title（参考訳）: CEPA: バックドアの異常検出と逆転のためのコンセンサス埋め込み摂動
Authors: Guangmingmei Yang, Xi Li, Hang Wang, David J. Miller, George Kesidis,
Abstract要約: ディープニューラルネットワーク(DNN)における(バックドア攻撃)トロイの木馬に対する様々な防御策が提案されている。バックドアに依存しない手法は、攻撃者が使用する組み込み機構に関係なく、バックドアを確実に検出および/または緩和しようとする。バックドアを推定(反転)し,対象とするクラスを特定するために,組込み特徴表現に依存する新しい検出器について述べる。
参考スコア（独自算出の注目度）: 30.143123333668218
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A variety of defenses have been proposed against Trojans planted in (backdoor attacks on) deep neural network (DNN) classifiers. Backdoor-agnostic methods seek to reliably detect and/or to mitigate backdoors irrespective of the incorporation mechanism used by the attacker, while inversion methods explicitly assume one. In this paper, we describe a new detector that: relies on embedded feature representations to estimate (invert) the backdoor and to identify its target class; can operate without access to the training dataset; and is highly effective for various incorporation mechanisms (i.e., is backdoor agnostic). Our detection approach is evaluated -- and found to be favorable - in comparison with an array of published defenses for a variety of different attacks on the CIFAR-10 and CIFAR-100 image-classification domains.
Abstract（参考訳）: ディープニューラルネットワーク(DNN)分類器に植えられたトロイの木馬に対する様々な防御策が提案されている。 backdoor-agnosticメソッドは、攻撃者が使用するインクルージョンメカニズムに関わらず、バックドアを確実に検出および/または緩和し、インバージョンメソッドがそれを明示的に仮定する。本稿では,組込み特徴表現を用いてバックドアを推定し,対象クラスを同定し,トレーニングデータセットにアクセスせずに動作し,各種の組み込み機構(バックドア非依存性)に極めて有効である,新しい検出器について述べる。 CIFAR-10とCIFAR-100の画像分類ドメインに対する様々な攻撃に対して、我々の検出アプローチは評価され、好適であることが判明した。

関連論文リスト

Data Free Backdoor Attacks [83.10379074100453]
DFBAは、モデルアーキテクチャを変更することなく、リトレーニングフリーでデータフリーのバックドア攻撃である。我々の注入されたバックドアは、様々な最先端の防御策によって、検出不可能で、検出不能であることを確認した。複数のデータセットに対する評価では,1) 無視可能な分類損失,2) 攻撃成功率,3) 既存の6つの防御を回避している。
論文参考訳（メタデータ） (2024-12-09T05:30:25Z)
T2IShield: Defending Against Backdoors on Text-to-Image Diffusion Models [70.03122709795122]
バックドア攻撃の検出, 局所化, 緩和のための総合防御手法T2IShieldを提案する。バックドアトリガーによって引き起こされた横断アテンションマップの「アシミレーション現象」を見いだす。バックドアサンプル検出のために、T2IShieldは計算コストの低い88.9$%のF1スコアを達成している。
論文参考訳（メタデータ） (2024-07-05T01:53:21Z)
Model Pairing Using Embedding Translation for Backdoor Attack Detection on Open-Set Classification Tasks [63.269788236474234]
バックドア検出のためのオープンセット分類タスクにモデルペアを用いることを提案する。このスコアは、異なるアーキテクチャのモデルがあるにもかかわらず、バックドアの存在を示す指標であることを示している。この技術は、オープンセット分類タスク用に設計されたモデル上のバックドアの検出を可能にするが、文献ではほとんど研究されていない。
論文参考訳（メタデータ） (2024-02-28T21:29:16Z)
Improved Activation Clipping for Universal Backdoor Mitigation and Test-Time Detection [27.62279831135902]
ディープニューラルネットワークは、攻撃者がバックドアトリガーでトレーニングセットに毒を盛るトロイア攻撃に対して脆弱である。近年の研究では、バックドア中毒は攻撃されたモデルにおいて過剰な適合(通常、大きな活性化)を引き起こすことが示されている。我々は、分類マージンを明示的に制限するためにアクティベーション境界を選択する新しいアプローチを考案する。
論文参考訳（メタデータ） (2023-08-08T22:47:39Z)
Backdoor Attack with Sparse and Invisible Trigger [57.41876708712008]
ディープニューラルネットワーク(DNN)は、バックドア攻撃に対して脆弱である。バックドアアタックは、訓練段階の脅威を脅かしている。軽度で目に見えないバックドアアタック(SIBA)を提案する。
論文参考訳（メタデータ） (2023-05-11T10:05:57Z)
Adaptive Perturbation Generation for Multiple Backdoors Detection [29.01715186371785]
本稿では,複数種類のバックドア攻撃を検出するための適応摂動生成(APG)フレームワークを提案する。まず,複数種類のバックドアトリガに適合するグローバル・ローカル戦略を設計する。摂動注入の効率をさらに高めるため,勾配誘導マスク生成戦略を導入する。
論文参考訳（メタデータ） (2022-09-12T13:37:06Z)
An anomaly detection approach for backdoored neural networks: face recognition as a case study [77.92020418343022]
本稿では,異常検出の原理に基づく新しいバックドアネットワーク検出手法を提案する。バックドアネットワークの新たなデータセット上で本手法を検証し,完全スコアで検出可能性について報告する。
論文参考訳（メタデータ） (2022-08-22T12:14:13Z)
MM-BD: Post-Training Detection of Backdoor Attacks with Arbitrary Backdoor Pattern Types Using a Maximum Margin Statistic [27.62279831135902]
本稿では,任意の種類のバックドア埋め込みによるバックドア攻撃を検出するポストトレーニングディフェンスを提案する。我々の検出器は正当なクリーンなサンプルを一切必要とせず、任意の数のソースクラスでバックドア攻撃を効率的に検出することができる。
論文参考訳（メタデータ） (2022-05-13T21:32:24Z)
Post-Training Detection of Backdoor Attacks for Two-Class and Multi-Attack Scenarios [22.22337220509128]
バックドア攻撃(BA)は、ディープニューラルネットワーク分類器に対する新たな脅威である。本稿では,BPリバースエンジニアリングに基づく検出フレームワークを提案する。
論文参考訳（メタデータ） (2022-01-20T22:21:38Z)
AEVA: Black-box Backdoor Detection Using Adversarial Extreme Value Analysis [23.184335982913325]
ブラックボックスのハードラベルバックドア検出問題に対処する。本研究では, バックドア検出の目的は, 逆方向の目的によって拘束されていることを示す。ブラックボックスニューラルネットワークのバックドア検出のための対向的極値解析を提案する。
論文参考訳（メタデータ） (2021-10-28T04:36:48Z)
Check Your Other Door! Establishing Backdoor Attacks in the Frequency Domain [80.24811082454367]
検出不能で強力なバックドア攻撃を確立するために周波数領域を利用する利点を示す。また、周波数ベースのバックドア攻撃を成功させる2つの防御方法と、攻撃者がそれらを回避できる可能性を示す。
論文参考訳（メタデータ） (2021-09-12T12:44:52Z)
Black-box Detection of Backdoor Attacks with Limited Information and Data [56.0735480850555]
モデルへのクエリアクセスのみを用いてバックドア攻撃を同定するブラックボックスバックドア検出(B3D)手法を提案する。バックドア検出に加えて,同定されたバックドアモデルを用いた信頼性の高い予測手法を提案する。
論文参考訳（メタデータ） (2021-03-24T12:06:40Z)
Scalable Backdoor Detection in Neural Networks [61.39635364047679]
ディープラーニングモデルは、トロイの木馬攻撃に対して脆弱で、攻撃者はトレーニング中にバックドアをインストールして、結果のモデルが小さなトリガーパッチで汚染されたサンプルを誤識別させる。本稿では,ラベル数と計算複雑性が一致しない新たなトリガリバースエンジニアリング手法を提案する。実験では,提案手法が純モデルからトロイの木馬モデルを分離する際の完全なスコアを達成できることが観察された。
論文参考訳（メタデータ） (2020-06-10T04:12:53Z)
Exposing Backdoors in Robust Machine Learning Models [0.5672132510411463]
逆向きに堅牢なモデルがバックドア攻撃の影響を受けやすいことを示す。バックドアはそのようなモデルの特徴表現に反映されますこの観測は、AEGISと呼ばれる検出技術を用いて、バックドア感染モデルを検出するために利用される。
論文参考訳（メタデータ） (2020-02-25T04:45:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。