論文の概要: SSL-Cleanse: Trojan Detection and Mitigation in Self-Supervised Learning
- arxiv url: http://arxiv.org/abs/2303.09079v2
- Date: Sun, 8 Oct 2023 01:17:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 14:16:30.820292
- Title: SSL-Cleanse: Trojan Detection and Mitigation in Self-Supervised Learning
- Title(参考訳): SSL-Cleanse: 自己監視学習におけるトロイの木馬の検出と緩和
- Authors: Mengxin Zheng, Jiaqi Xue, Zihao Wang, Xun Chen, Qian Lou, Lei Jiang
and Xiaofeng Wang
- Abstract要約: 自己教師付き学習(SSL)は、データ表現を符号化する一般的な手法である。
SSLエンコーダに埋め込まれたTrojan攻撃は隠蔽的に動作し、複数のユーザやデバイスに分散する。
SSLエンコーダのバックドア脅威を特定し軽減するためのソリューションとしてSSL-Cleanseを導入します。
- 参考スコア(独自算出の注目度): 29.07850836962995
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-supervised learning (SSL) is a prevalent approach for encoding data
representations. Using a pre-trained SSL image encoder and subsequently
training a downstream classifier, impressive performance can be achieved on
various tasks with very little labeled data. The growing adoption of SSL has
led to an increase in security research on SSL encoders and associated Trojan
attacks. Trojan attacks embedded in SSL encoders can operate covertly,
spreading across multiple users and devices. The presence of backdoor behavior
in Trojaned encoders can inadvertently be inherited by downstream classifiers,
making it even more difficult to detect and mitigate the threat. Although
current Trojan detection methods in supervised learning can potentially
safeguard SSL downstream classifiers, identifying and addressing triggers in
the SSL encoder before its widespread dissemination is a challenging task. This
challenge arises because downstream tasks might be unknown, dataset labels may
be unavailable, and the original unlbeled training dataset might be
inaccessible during Trojan detection in SSL encoders. We introduce SSL-Cleanse
as a solution to identify and mitigate backdoor threats in SSL encoders. We
evaluated SSL-Cleanse on various datasets using 1200 encoders, achieving an
average detection success rate of 82.2% on ImageNet-100. After mitigating
backdoors, on average, backdoored encoders achieve 0.3% attack success rate
without great accuracy loss, proving the effectiveness of SSL-Cleanse.
- Abstract(参考訳): 自己教師付き学習(SSL)は、データ表現を符号化する一般的な手法である。
予めトレーニングされたsslイメージエンコーダを使用して、その後下流の分類器をトレーニングすることで、ラベル付きデータの少ないさまざまなタスクで印象的なパフォーマンスを実現することができる。
SSLの採用の増加により、SSLエンコーダと関連するTrojan攻撃に関するセキュリティ調査が増加した。
SSLエンコーダに埋め込まれたTrojan攻撃は隠蔽的に動作し、複数のユーザやデバイスに分散する。
トロイの木馬エンコーダにおけるバックドアの挙動の存在は、下流の分類器によって必然的に継承され、脅威の検出と緩和がさらに困難になる。
教師あり学習における現在のトロイの木馬検出手法は、SSL下流の分類器を保護できる可能性があるが、広く普及する前にSSLエンコーダ内のトリガーを特定し、対処することは難しい課題である。
この課題は、ダウンストリームタスクが不明な場合やデータセットラベルが利用できない場合、SSLエンコーダのトロイの木馬検出時に、元の未学習のトレーニングデータセットにアクセスできない場合、発生します。
SSLエンコーダのバックドア脅威を特定し軽減するためのソリューションとしてSSL-Cleanseを導入する。
1200エンコーダを用いてさまざまなデータセット上でSSL-Cleanseを評価し,ImageNet-100の平均検出成功率は82.2%に達した。
バックドアを緩和した後、バックドアエンコーダは平均して0.3%のアタック成功率を達成し、ssl-cleanseの有効性を証明した。
関連論文リスト
- DeDe: Detecting Backdoor Samples for SSL Encoders via Decoders [6.698677477097004]
自己教師付き学習(SSL)は、大量のラベルのないデータで高品質な上流エンコーダのトレーニングに広く利用されている。
バックドア攻撃は トレーニングデータの ごく一部を汚染するだけ
本稿では,被害者エンコーダの共起によるバックドアマッピングの活性化を検知し,入力をトリガーする新しい検出機構であるDeDeを提案する。
論文 参考訳(メタデータ) (2024-11-25T07:26:22Z) - How to Craft Backdoors with Unlabeled Data Alone? [54.47006163160948]
自己教師型学習(SSL)は、経済的かつスケーラブルな方法でリッチな機能を学ぶことができる。
リリースされたデータセットが悪意ある毒を盛られた場合、テストサンプルにトリガーが注入された場合、バックドアのSSLモデルはひどい振る舞いをする可能性がある。
本稿では, 疑似ラベルを用いたクラスタリングに基づく選別と, 相互情報原理に基づくコントラスト選択の2つの方法を提案する。
論文 参考訳(メタデータ) (2024-04-10T02:54:18Z) - Towards Adversarial Robustness And Backdoor Mitigation in SSL [0.562479170374811]
Self-Supervised Learning (SSL)は、ラベルのないデータから表現を学習する際の大きな可能性を示している。
SSLメソッドは、最近、バックドア攻撃に対して脆弱であることが示されている。
この作業はSSLのバックドア攻撃に対する防御に対処することを目的としている。
論文 参考訳(メタデータ) (2024-03-23T19:21:31Z) - Erasing Self-Supervised Learning Backdoor by Cluster Activation Masking [65.44477004525231]
研究者は最近、自己監視学習(SSL)がバックドア攻撃に脆弱であることを発見した。
本稿では,クラスタアクティベーションマスキングによるSSLバックドアの消去を提案し,新しいPoisonCAM法を提案する。
ImageNet-100の最先端手法の3%と比較して,バックドアトリガ検出の精度は96%であった。
論文 参考訳(メタデータ) (2023-12-13T08:01:15Z) - ESTAS: Effective and Stable Trojan Attacks in Self-supervised Encoders
with One Target Unlabelled Sample [16.460288815336902]
ESTASは1つのターゲットクラスサンプルで99%の攻撃成功率(ASR)を達成する。
従来の研究と比較すると、ESTASは平均で30%のASR増加と8.3%の精度向上を達成した。
論文 参考訳(メタデータ) (2022-11-20T08:58:34Z) - An Embarrassingly Simple Backdoor Attack on Self-supervised Learning [52.28670953101126]
自己教師付き学習(SSL)は、ラベルに頼ることなく、複雑なデータの高品質な表現を学習することができる。
SSLのバックドア攻撃に対する脆弱性について検討する。
論文 参考訳(メタデータ) (2022-10-13T20:39:21Z) - SSL-WM: A Black-Box Watermarking Approach for Encoders Pre-trained by
Self-supervised Learning [21.36798280084255]
自己監視学習(SSL)はコンピュータビジョン(CV)や自然言語処理(NLP)の様々な下流タスクに広く利用されている。
攻撃者はそのようなSSLモデルを盗み、利益のために商業化する可能性があり、SSLモデルの所有権を検証することが不可欠である。
既存の所有権保護ソリューション(例えば、バックドアベースの透かし)は、教師あり学習モデルのために設計されている。
SSLモデルのオーナシップを検証するため,SSL-WMと呼ばれる新しいブラックボックス透かし方式を提案する。
論文 参考訳(メタデータ) (2022-09-08T05:02:11Z) - OpenLDN: Learning to Discover Novel Classes for Open-World
Semi-Supervised Learning [110.40285771431687]
半教師付き学習(SSL)は、教師付き学習のアノテーションボトルネックに対処する主要なアプローチの1つである。
最近のSSLメソッドは、ラベルなしデータの大規模なリポジトリを有効活用して、ラベル付きデータの小さなセットに依存しながら、パフォーマンスを向上させることができる。
この研究は、ペアワイズ類似度損失を利用して新しいクラスを発見するOpenLDNを導入している。
論文 参考訳(メタデータ) (2022-07-05T18:51:05Z) - DATA: Domain-Aware and Task-Aware Pre-training [94.62676913928831]
我々は、自己教師付き学習(SSL)に特化した、シンプルで効果的なNASアプローチであるDataを提示する。
提案手法は,画像分類,オブジェクト検出,セマンティックセグメンテーションなど,下流タスクにおける計算コストの広い範囲にわたる有望な結果を実現する。
論文 参考訳(メタデータ) (2022-03-17T02:38:49Z) - Robust Deep Semi-Supervised Learning: A Brief Introduction [63.09703308309176]
半教師付き学習(SSL)は、ラベルが不十分なときにラベル付きデータを活用することにより、学習性能を向上させることを目的としている。
ディープモデルによるSSLは、標準ベンチマークタスクで成功したことが証明されている。
しかし、それらは現実世界のアプリケーションにおける様々な堅牢性に対する脅威に対して依然として脆弱である。
論文 参考訳(メタデータ) (2022-02-12T04:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。