論文の概要: SSL-Cleanse: Trojan Detection and Mitigation in Self-Supervised Learning
- arxiv url: http://arxiv.org/abs/2303.09079v1
- Date: Thu, 16 Mar 2023 04:45:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 16:45:14.258835
- Title: SSL-Cleanse: Trojan Detection and Mitigation in Self-Supervised Learning
- Title(参考訳): SSL-Cleanse: 自己監視学習におけるトロイの木馬の検出と緩和
- Authors: Mengxin Zheng, Jiaqi Xue, Xun Chen, Lei Jiang, Qian Lou
- Abstract要約: 自己教師付き学習(SSL)は、データ表現の学習と符号化に一般的に用いられるアプローチである。
本稿では,SSLエンコーダのバックドア攻撃の検出と軽減を目的としたSSL-Cleanseと呼ばれる革新的な手法を提案する。
- 参考スコア(独自算出の注目度): 19.77360108097476
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-supervised learning (SSL) is a commonly used approach to learning and
encoding data representations. By using a pre-trained SSL image encoder and
training a downstream classifier on top of it, impressive performance can be
achieved on various tasks with very little labeled data. The increasing usage
of SSL has led to an uptick in security research related to SSL encoders and
the development of various Trojan attacks. The danger posed by Trojan attacks
inserted in SSL encoders lies in their ability to operate covertly and spread
widely among various users and devices. The presence of backdoor behavior in
Trojaned encoders can inadvertently be inherited by downstream classifiers,
making it even more difficult to detect and mitigate the threat. Although
current Trojan detection methods in supervised learning can potentially
safeguard SSL downstream classifiers, identifying and addressing triggers in
the SSL encoder before its widespread dissemination is a challenging task. This
is because downstream tasks are not always known, dataset labels are not
available, and even the original training dataset is not accessible during the
SSL encoder Trojan detection. This paper presents an innovative technique
called SSL-Cleanse that is designed to detect and mitigate backdoor attacks in
SSL encoders. We evaluated SSL-Cleanse on various datasets using 300 models,
achieving an average detection success rate of 83.7% on ImageNet-100. After
mitigating backdoors, on average, backdoored encoders achieve 0.24% attack
success rate without great accuracy loss, proving the effectiveness of
SSL-Cleanse.
- Abstract(参考訳): 自己教師付き学習(SSL)は、データ表現の学習と符号化に一般的に用いられるアプローチである。
予めトレーニングされたsslイメージエンコーダを使用して、その上に下流の分類器をトレーニングすることで、ラベル付きデータの少ないさまざまなタスクで印象的なパフォーマンスを実現することができる。
SSLの利用の増加により、SSLエンコーダに関するセキュリティ研究や、さまざまなトロイの木馬攻撃の開発が急増した。
sslエンコーダにトロイの木馬攻撃が挿入される危険性は、秘密裏に動作し、さまざまなユーザやデバイスに広く広がる能力にある。
トロイの木馬エンコーダにおけるバックドアの挙動の存在は、下流の分類器によって必然的に継承され、脅威の検出と緩和がさらに困難になる。
教師あり学習における現在のトロイの木馬検出手法は、SSL下流の分類器を保護できる可能性があるが、広く普及する前にSSLエンコーダ内のトリガーを特定し、対処することは難しい課題である。
これは、ダウンストリームタスクが常に知られていないこと、データセットラベルが利用できないこと、SSLエンコーダのTrojan検出の間、オリジナルのトレーニングデータセットでさえアクセスできないためである。
本稿では,SSLエンコーダのバックドア攻撃の検出と軽減を目的としたSSL-Cleanseと呼ばれる革新的な手法を提案する。
様々なデータセットにおけるssl-cleanseを300モデルを用いて評価し,imagenet-100で平均検出成功率83.7%を得た。
バックドアを緩和した後、平均してバックドアエンコーダは0.24%の攻撃成功率を高い精度で達成し、SSL-Cleanseの有効性を証明した。
関連論文リスト
- DeDe: Detecting Backdoor Samples for SSL Encoders via Decoders [6.698677477097004]
自己教師付き学習(SSL)は、大量のラベルのないデータで高品質な上流エンコーダのトレーニングに広く利用されている。
バックドア攻撃は トレーニングデータの ごく一部を汚染するだけ
本稿では,被害者エンコーダの共起によるバックドアマッピングの活性化を検知し,入力をトリガーする新しい検出機構であるDeDeを提案する。
論文 参考訳(メタデータ) (2024-11-25T07:26:22Z) - How to Craft Backdoors with Unlabeled Data Alone? [54.47006163160948]
自己教師型学習(SSL)は、経済的かつスケーラブルな方法でリッチな機能を学ぶことができる。
リリースされたデータセットが悪意ある毒を盛られた場合、テストサンプルにトリガーが注入された場合、バックドアのSSLモデルはひどい振る舞いをする可能性がある。
本稿では, 疑似ラベルを用いたクラスタリングに基づく選別と, 相互情報原理に基づくコントラスト選択の2つの方法を提案する。
論文 参考訳(メタデータ) (2024-04-10T02:54:18Z) - Towards Adversarial Robustness And Backdoor Mitigation in SSL [0.562479170374811]
Self-Supervised Learning (SSL)は、ラベルのないデータから表現を学習する際の大きな可能性を示している。
SSLメソッドは、最近、バックドア攻撃に対して脆弱であることが示されている。
この作業はSSLのバックドア攻撃に対する防御に対処することを目的としている。
論文 参考訳(メタデータ) (2024-03-23T19:21:31Z) - Erasing Self-Supervised Learning Backdoor by Cluster Activation Masking [65.44477004525231]
研究者は最近、自己監視学習(SSL)がバックドア攻撃に脆弱であることを発見した。
本稿では,クラスタアクティベーションマスキングによるSSLバックドアの消去を提案し,新しいPoisonCAM法を提案する。
ImageNet-100の最先端手法の3%と比較して,バックドアトリガ検出の精度は96%であった。
論文 参考訳(メタデータ) (2023-12-13T08:01:15Z) - ESTAS: Effective and Stable Trojan Attacks in Self-supervised Encoders
with One Target Unlabelled Sample [16.460288815336902]
ESTASは1つのターゲットクラスサンプルで99%の攻撃成功率(ASR)を達成する。
従来の研究と比較すると、ESTASは平均で30%のASR増加と8.3%の精度向上を達成した。
論文 参考訳(メタデータ) (2022-11-20T08:58:34Z) - An Embarrassingly Simple Backdoor Attack on Self-supervised Learning [52.28670953101126]
自己教師付き学習(SSL)は、ラベルに頼ることなく、複雑なデータの高品質な表現を学習することができる。
SSLのバックドア攻撃に対する脆弱性について検討する。
論文 参考訳(メタデータ) (2022-10-13T20:39:21Z) - SSL-WM: A Black-Box Watermarking Approach for Encoders Pre-trained by
Self-supervised Learning [21.36798280084255]
自己監視学習(SSL)はコンピュータビジョン(CV)や自然言語処理(NLP)の様々な下流タスクに広く利用されている。
攻撃者はそのようなSSLモデルを盗み、利益のために商業化する可能性があり、SSLモデルの所有権を検証することが不可欠である。
既存の所有権保護ソリューション(例えば、バックドアベースの透かし)は、教師あり学習モデルのために設計されている。
SSLモデルのオーナシップを検証するため,SSL-WMと呼ばれる新しいブラックボックス透かし方式を提案する。
論文 参考訳(メタデータ) (2022-09-08T05:02:11Z) - OpenLDN: Learning to Discover Novel Classes for Open-World
Semi-Supervised Learning [110.40285771431687]
半教師付き学習(SSL)は、教師付き学習のアノテーションボトルネックに対処する主要なアプローチの1つである。
最近のSSLメソッドは、ラベルなしデータの大規模なリポジトリを有効活用して、ラベル付きデータの小さなセットに依存しながら、パフォーマンスを向上させることができる。
この研究は、ペアワイズ類似度損失を利用して新しいクラスを発見するOpenLDNを導入している。
論文 参考訳(メタデータ) (2022-07-05T18:51:05Z) - DATA: Domain-Aware and Task-Aware Pre-training [94.62676913928831]
我々は、自己教師付き学習(SSL)に特化した、シンプルで効果的なNASアプローチであるDataを提示する。
提案手法は,画像分類,オブジェクト検出,セマンティックセグメンテーションなど,下流タスクにおける計算コストの広い範囲にわたる有望な結果を実現する。
論文 参考訳(メタデータ) (2022-03-17T02:38:49Z) - Robust Deep Semi-Supervised Learning: A Brief Introduction [63.09703308309176]
半教師付き学習(SSL)は、ラベルが不十分なときにラベル付きデータを活用することにより、学習性能を向上させることを目的としている。
ディープモデルによるSSLは、標準ベンチマークタスクで成功したことが証明されている。
しかし、それらは現実世界のアプリケーションにおける様々な堅牢性に対する脅威に対して依然として脆弱である。
論文 参考訳(メタデータ) (2022-02-12T04:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。