論文の概要: SSL-Cleanse: Trojan Detection and Mitigation in Self-Supervised Learning
- arxiv url: http://arxiv.org/abs/2303.09079v1
- Date: Thu, 16 Mar 2023 04:45:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 16:45:14.258835
- Title: SSL-Cleanse: Trojan Detection and Mitigation in Self-Supervised Learning
- Title(参考訳): SSL-Cleanse: 自己監視学習におけるトロイの木馬の検出と緩和
- Authors: Mengxin Zheng, Jiaqi Xue, Xun Chen, Lei Jiang, Qian Lou
- Abstract要約: 自己教師付き学習(SSL)は、データ表現の学習と符号化に一般的に用いられるアプローチである。
本稿では,SSLエンコーダのバックドア攻撃の検出と軽減を目的としたSSL-Cleanseと呼ばれる革新的な手法を提案する。
- 参考スコア(独自算出の注目度): 19.77360108097476
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-supervised learning (SSL) is a commonly used approach to learning and
encoding data representations. By using a pre-trained SSL image encoder and
training a downstream classifier on top of it, impressive performance can be
achieved on various tasks with very little labeled data. The increasing usage
of SSL has led to an uptick in security research related to SSL encoders and
the development of various Trojan attacks. The danger posed by Trojan attacks
inserted in SSL encoders lies in their ability to operate covertly and spread
widely among various users and devices. The presence of backdoor behavior in
Trojaned encoders can inadvertently be inherited by downstream classifiers,
making it even more difficult to detect and mitigate the threat. Although
current Trojan detection methods in supervised learning can potentially
safeguard SSL downstream classifiers, identifying and addressing triggers in
the SSL encoder before its widespread dissemination is a challenging task. This
is because downstream tasks are not always known, dataset labels are not
available, and even the original training dataset is not accessible during the
SSL encoder Trojan detection. This paper presents an innovative technique
called SSL-Cleanse that is designed to detect and mitigate backdoor attacks in
SSL encoders. We evaluated SSL-Cleanse on various datasets using 300 models,
achieving an average detection success rate of 83.7% on ImageNet-100. After
mitigating backdoors, on average, backdoored encoders achieve 0.24% attack
success rate without great accuracy loss, proving the effectiveness of
SSL-Cleanse.
- Abstract(参考訳): 自己教師付き学習(SSL)は、データ表現の学習と符号化に一般的に用いられるアプローチである。
予めトレーニングされたsslイメージエンコーダを使用して、その上に下流の分類器をトレーニングすることで、ラベル付きデータの少ないさまざまなタスクで印象的なパフォーマンスを実現することができる。
SSLの利用の増加により、SSLエンコーダに関するセキュリティ研究や、さまざまなトロイの木馬攻撃の開発が急増した。
sslエンコーダにトロイの木馬攻撃が挿入される危険性は、秘密裏に動作し、さまざまなユーザやデバイスに広く広がる能力にある。
トロイの木馬エンコーダにおけるバックドアの挙動の存在は、下流の分類器によって必然的に継承され、脅威の検出と緩和がさらに困難になる。
教師あり学習における現在のトロイの木馬検出手法は、SSL下流の分類器を保護できる可能性があるが、広く普及する前にSSLエンコーダ内のトリガーを特定し、対処することは難しい課題である。
これは、ダウンストリームタスクが常に知られていないこと、データセットラベルが利用できないこと、SSLエンコーダのTrojan検出の間、オリジナルのトレーニングデータセットでさえアクセスできないためである。
本稿では,SSLエンコーダのバックドア攻撃の検出と軽減を目的としたSSL-Cleanseと呼ばれる革新的な手法を提案する。
様々なデータセットにおけるssl-cleanseを300モデルを用いて評価し,imagenet-100で平均検出成功率83.7%を得た。
バックドアを緩和した後、平均してバックドアエンコーダは0.24%の攻撃成功率を高い精度で達成し、SSL-Cleanseの有効性を証明した。
関連論文リスト
- ASSET: Robust Backdoor Data Detection Across a Multiplicity of Deep
Learning Paradigms [39.753721029332326]
バックドアデータ検出は、エンドツーエンドの教師あり学習(SL)設定で伝統的に研究されている。
近年,ラベル付きデータの必要性の低さから,自己教師付き学習(SSL)や転送学習(TL)の普及が進んでいる。
既存の検出手法の性能は様々な攻撃や毒素比で大きく異なり、すべて最先端のクリーンラベル攻撃では失敗する。
論文 参考訳(メタデータ) (2023-02-22T14:43:33Z) - ESTAS: Effective and Stable Trojan Attacks in Self-supervised Encoders
with One Target Unlabelled Sample [16.460288815336902]
ESTASは1つのターゲットクラスサンプルで99%の攻撃成功率(ASR)を達成する。
従来の研究と比較すると、ESTASは平均で30%のASR増加と8.3%の精度向上を達成した。
論文 参考訳(メタデータ) (2022-11-20T08:58:34Z) - Demystifying Self-supervised Trojan Attacks [50.039018962541455]
自己教師付き学習(SSL)は、データラベルなしで複雑なデータの高品質な表現を学習することができる。
SSLは、トロイの木馬攻撃に対する教師あり学習として、相互に脆弱であることを示す。
論文 参考訳(メタデータ) (2022-10-13T20:39:21Z) - SSL-WM: A Black-Box Watermarking Approach for Encoders Pre-trained by
Self-supervised Learning [20.0731682564249]
自己監視学習(SSL)モデルは、利益のために盗まれ、商業化される可能性がある。
SSLモデルのオーナシップを保護するため,SSL-WMと呼ばれる新しいブラックボックス透かし方式を提案する。
SSL-WMは、さまざまなダウンストリームタスクにおいて、盗まれたSSLモデルのオーナシップを効果的に検証できる。
論文 参考訳(メタデータ) (2022-09-08T05:02:11Z) - OpenLDN: Learning to Discover Novel Classes for Open-World
Semi-Supervised Learning [110.40285771431687]
半教師付き学習(SSL)は、教師付き学習のアノテーションボトルネックに対処する主要なアプローチの1つである。
最近のSSLメソッドは、ラベルなしデータの大規模なリポジトリを有効活用して、ラベル付きデータの小さなセットに依存しながら、パフォーマンスを向上させることができる。
この研究は、ペアワイズ類似度損失を利用して新しいクラスを発見するOpenLDNを導入している。
論文 参考訳(メタデータ) (2022-07-05T18:51:05Z) - DATA: Domain-Aware and Task-Aware Pre-training [94.62676913928831]
我々は、自己教師付き学習(SSL)に特化した、シンプルで効果的なNASアプローチであるDataを提示する。
提案手法は,画像分類,オブジェクト検出,セマンティックセグメンテーションなど,下流タスクにおける計算コストの広い範囲にわたる有望な結果を実現する。
論文 参考訳(メタデータ) (2022-03-17T02:38:49Z) - Robust Deep Semi-Supervised Learning: A Brief Introduction [63.09703308309176]
半教師付き学習(SSL)は、ラベルが不十分なときにラベル付きデータを活用することにより、学習性能を向上させることを目的としている。
ディープモデルによるSSLは、標準ベンチマークタスクで成功したことが証明されている。
しかし、それらは現実世界のアプリケーションにおける様々な堅牢性に対する脅威に対して依然として脆弱である。
論文 参考訳(メタデータ) (2022-02-12T04:16:41Z) - Practical Detection of Trojan Neural Networks: Data-Limited and
Data-Free Cases [87.69818690239627]
本稿では,データスカース方式におけるトロイの木馬ネットワーク(トロイの木馬網)検出の問題点について検討する。
本稿では,データ限定型TrojanNet検出器(TND)を提案する。
さらに,データサンプルにアクセスせずにTrojanNetを検出できるデータフリーTNDを提案する。
論文 参考訳(メタデータ) (2020-07-31T02:00:38Z) - A Simple Semi-Supervised Learning Framework for Object Detection [55.95789931533665]
半教師付き学習(SSL)は、ラベルなしデータを用いた機械学習モデルの予測性能を改善する可能性がある。
本稿では,データ拡張戦略とともに,視覚オブジェクト検出のための簡易かつ効果的なSSLフレームワークSTACを提案する。
論文 参考訳(メタデータ) (2020-05-10T19:15:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。