Fugu-MT 論文翻訳(概要): UNICORN: A Unified Backdoor Trigger Inversion Framework

論文の概要: UNICORN: A Unified Backdoor Trigger Inversion Framework

arxiv url: http://arxiv.org/abs/2304.02786v1
Date: Wed, 5 Apr 2023 23:14:08 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-07 15:52:36.168519
Title: UNICORN: A Unified Backdoor Trigger Inversion Framework
Title（参考訳）: UNICORN: 統一されたバックドアトリガーインバージョンフレームワーク
Authors: Zhenting Wang, Kai Mei, Juan Zhai, Shiqing Ma
Abstract要約: トリガーインバージョンは、バックドアモデルを特定し、組込み敵行動を理解する効果的な方法である。この研究は、異なる空間に注入されたトリガーと逆問題を定義し解析する。そして,トリガの形式化とバックドアモデルの内部挙動の同定に基づいて,バックドアトリガを逆転させる統一的なフレームワークを提案する。
参考スコア（独自算出の注目度）: 13.841110859970827
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The backdoor attack, where the adversary uses inputs stamped with triggers (e.g., a patch) to activate pre-planted malicious behaviors, is a severe threat to Deep Neural Network (DNN) models. Trigger inversion is an effective way of identifying backdoor models and understanding embedded adversarial behaviors. A challenge of trigger inversion is that there are many ways of constructing the trigger. Existing methods cannot generalize to various types of triggers by making certain assumptions or attack-specific constraints. The fundamental reason is that existing work does not consider the trigger's design space in their formulation of the inversion problem. This work formally defines and analyzes the triggers injected in different spaces and the inversion problem. Then, it proposes a unified framework to invert backdoor triggers based on the formalization of triggers and the identified inner behaviors of backdoor models from our analysis. Our prototype UNICORN is general and effective in inverting backdoor triggers in DNNs. The code can be found at https://github.com/RU-System-Software-and-Security/UNICORN.
Abstract（参考訳）: バックドア攻撃(バックドア攻撃)は、敵が事前に移植された悪意のある動作を活性化するためにトリガー(例えばパッチ)でスタンプされた入力を使用するもので、ディープニューラルネットワーク(DNN)モデルに対する深刻な脅威である。トリガーインバージョンは、バックドアモデルを特定し、組込み敵行動を理解する効果的な方法である。トリガー反転の課題は、トリガーを構築する多くの方法があることである。既存のメソッドは、特定の仮定や攻撃固有の制約をすることで、様々な種類のトリガーに一般化できない。根本的な理由は、既存の作業が反転問題の定式化においてトリガーの設計空間を考慮しないからである。この研究は、異なる空間に注入されたトリガーと逆問題を定義し解析する。そこで,本研究では,トリガの形式化とバックドアモデルの内部挙動の同定に基づいて,バックドアトリガを逆転させる統一フレームワークを提案する。我々のプロトタイプであるUNICORNは、DNNのバックドアトリガの反転に有効である。コードはhttps://github.com/RU-System-Software-and-Security/UNICORNで見ることができる。

関連論文リスト

A4O: All Trigger for One sample [10.78460062665304]
提案されたバックドアディフェンダーは、トリガーが統一された方法で現れるという仮定に依存することが多い。本稿では,この単純な仮定が抜け穴を生じさせ,より洗練されたバックドア攻撃を回避できることを示す。我々は,複数の種類のバックドアトリガーを組み込んだ新たなバックドア攻撃機構を設計し,ステルスネスと有効性に着目した。
論文参考訳（メタデータ） (2025-01-13T10:38:58Z)
PureDiffusion: Using Backdoor to Counter Backdoor in Generative Diffusion Models [5.957580737396457]
拡散モデル(DM)は、幅広い生成タスクにおいて最先端の能力を達成した高度なディープラーニングモデルである。近年の研究では、バックドア攻撃に関する脆弱性が示されており、バックドアDMは、バックドアターゲットと呼ばれる指定結果を一貫して生成している。 DMに埋め込まれたバックドアトリガを反転させることで、バックドア攻撃を効率的に検出できる新しいバックドア防御フレームワークであるPureDiffusionを導入する。
論文参考訳（メタデータ） (2024-09-20T23:19:26Z)
Eliminating Backdoors in Neural Code Models via Trigger Inversion [24.053091055319562]
ニューラルネットワークモデルに対するバックドア攻撃は、重大なセキュリティ脅威となる。本稿では,EliBadCodeと呼ばれるトリガーインバージョンに基づくバックドア防御手法を提案する。 EliBadCodeはバックドアを効果的に排除でき、モデルの通常の機能に最小限の悪影響を及ぼすことを示した。
論文参考訳（メタデータ） (2024-08-08T08:23:03Z)
Evolutionary Trigger Detection and Lightweight Model Repair Based Backdoor Defense [10.310546695762467]
ディープニューラルネットワーク(DNN)は、自律運転や顔認識など、多くの分野で広く利用されている。 DNNモデルのバックドアは、トリガーによる有毒な入力によってアクティベートされ、誤った予測につながる。進化的トリガ検出と軽量モデル修復に基づく効率的なバックドア防御を提案する。
論文参考訳（メタデータ） (2024-07-07T14:50:59Z)
LOTUS: Evasive and Resilient Backdoor Attacks through Sub-Partitioning [49.174341192722615]
バックドア攻撃は、ディープラーニングアプリケーションに重大なセキュリティ脅威をもたらす。近年の研究では、特殊な変換機能によって作られたサンプル特異的に見えないトリガーを用いた攻撃が導入されている。我々は、回避性とレジリエンスの両方に対処するために、新しいバックドアアタックLOTUSを導入する。
論文参考訳（メタデータ） (2024-03-25T21:01:29Z)
Shortcuts Everywhere and Nowhere: Exploring Multi-Trigger Backdoor Attacks [64.68741192761726]
ディープニューラルネットワーク(DNN)の事前トレーニングとデプロイに対して、バックドア攻撃は重大な脅威となっている。本研究では,マルチトリガーバックドア攻撃(MTBA)の概念について検討し,複数の敵が異なる種類のトリガーを利用して同一のデータセットを毒する。
論文参考訳（メタデータ） (2024-01-27T04:49:37Z)
From Shortcuts to Triggers: Backdoor Defense with Denoised PoE [51.287157951953226]
言語モデルは、しばしば多様なバックドア攻撃、特にデータ中毒の危険にさらされる。既存のバックドア防御手法は主に明示的なトリガーによるバックドア攻撃に焦点を当てている。我々は,様々なバックドア攻撃を防御するために,エンド・ツー・エンドアンサンブルに基づくバックドア防御フレームワークDPoEを提案する。
論文参考訳（メタデータ） (2023-05-24T08:59:25Z)
Backdoor Attack with Sparse and Invisible Trigger [57.41876708712008]
ディープニューラルネットワーク(DNN)は、バックドア攻撃に対して脆弱である。バックドアアタックは、訓練段階の脅威を脅かしている。軽度で目に見えないバックドアアタック(SIBA)を提案する。
論文参考訳（メタデータ） (2023-05-11T10:05:57Z)
Backdoor Attacks with Input-unique Triggers in NLP [34.98477726215485]
Backdoor攻撃は、ニューラルネットワークを誘導して毒データに対する誤った予測を行い、クリーンなデータセットの予測を変更せずに維持することを目的としている。本稿では,入力に固有のバックドアトリガを生成する,入出力型バックドアアタック(NURA)を提案する。
論文参考訳（メタデータ） (2023-03-25T01:41:54Z)
BATT: Backdoor Attack with Transformation-based Triggers [72.61840273364311]
ディープニューラルネットワーク(DNN)は、バックドア攻撃に対して脆弱である。バックドアの敵は、敵が特定したトリガーパターンによって活性化される隠れたバックドアを注入する。最近の研究によると、既存の攻撃のほとんどは現実世界で失敗した。
論文参考訳（メタデータ） (2022-11-02T16:03:43Z)
Backdoor Defense via Suppressing Model Shortcuts [91.30995749139012]
本稿では,モデル構造の角度からバックドア機構を探索する。攻撃成功率 (ASR) は, キースキップ接続の出力を減少させると著しく低下することを示した。
論文参考訳（メタデータ） (2022-11-02T15:39:19Z)
Imperceptible Backdoor Attack: From Input Space to Feature Representation [24.82632240825927]
バックドア攻撃はディープニューラルネットワーク(DNN)への脅威が急速に高まっている本稿では,既存の攻撃手法の欠点を分析し,新たな非受容的バックドア攻撃を提案する。我々のトリガーは、良性画像の1%以下のピクセルしか変更せず、大きさは1。
論文参考訳（メタデータ） (2022-05-06T13:02:26Z)
Check Your Other Door! Establishing Backdoor Attacks in the Frequency Domain [80.24811082454367]
検出不能で強力なバックドア攻撃を確立するために周波数領域を利用する利点を示す。また、周波数ベースのバックドア攻撃を成功させる2つの防御方法と、攻撃者がそれらを回避できる可能性を示す。
論文参考訳（メタデータ） (2021-09-12T12:44:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。