Fugu-MT 論文翻訳(概要): Better Safe than Sorry: Pre-training CLIP against Targeted Data Poisoning and Backdoor Attacks

論文の概要: Better Safe than Sorry: Pre-training CLIP against Targeted Data Poisoning and Backdoor Attacks

arxiv url: http://arxiv.org/abs/2310.05862v1
Date: Thu, 5 Oct 2023 19:42:03 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-11 00:18:31.558610
Title: Better Safe than Sorry: Pre-training CLIP against Targeted Data Poisoning and Backdoor Attacks
Title（参考訳）: Sorryより安全: ターゲットデータに対するCLIPの事前トレーニングとバックドア攻撃
Authors: Wenhan Yang, Jingdong Gao, Baharan Mirzasoleiman
Abstract要約: 大規模な画像キャプチャデータセット上でのCLIP(Contrastive Language- Image Pre-training)は、ゼロショット分類において顕著な成功を収めた。 CLIPは、教師付き学習と比較して、ターゲットデータ中毒やバックドア攻撃に対してより脆弱である。我々は、ターゲットデータ中毒やバックドア攻撃に対して、CLIPを安全に事前訓練するための強力な防御策SAFECLIPを提案する。
参考スコア（独自算出の注目度）: 52.26631767748843
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Contrastive Language-Image Pre-training (CLIP) on large image-caption datasets has achieved remarkable success in zero-shot classification and enabled transferability to new domains. However, CLIP is extremely more vulnerable to targeted data poisoning and backdoor attacks, compared to supervised learning. Perhaps surprisingly, poisoning 0.0001% of CLIP pre-training data is enough to make targeted data poisoning attacks successful. This is four orders of magnitude smaller than what is required to poison supervised models. Despite this vulnerability, existing methods are very limited in defending CLIP models during pre-training. In this work, we propose a strong defense, SAFECLIP, to safely pre-train CLIP against targeted data poisoning and backdoor attacks. SAFECLIP warms up the model by applying unimodal contrastive learning (CL) on image and text modalities separately. Then, it carefully divides the data into safe and risky subsets. SAFECLIP trains on the risky data by applying unimodal CL to image and text modalities separately, and trains on the safe data using the CLIP loss. By gradually increasing the size of the safe subset during the training, SAFECLIP effectively breaks targeted data poisoning and backdoor attacks without harming the CLIP performance. Our extensive experiments show that SAFECLIP decrease the attack success rate of targeted data poisoning attacks from 93.75% to 0% and that of the backdoor attacks from 100% to 0%, without harming the CLIP performance on various datasets.
Abstract（参考訳）: 大規模な画像キャプチャデータセット上でのコントラスト型言語イメージプリトレーニング(clip)は,ゼロショット分類において著しく成功し,新たなドメインへの転送性を実現している。しかし、CLIPは教師付き学習と比較して、ターゲットデータ中毒やバックドア攻撃に対して極めて脆弱である。意外なことに、CLIP事前トレーニングデータの0.0001%を汚染することは、ターゲットデータ中毒攻撃を成功させるのに十分である。これは、監督されたモデルに毒を盛るために必要なものよりも4桁小さい。この脆弱性にもかかわらず、既存のメソッドは事前トレーニング中にCLIPモデルを保護するために非常に制限されている。本研究は、ターゲットデータ中毒やバックドア攻撃に対するCLIPの訓練を安全に行うための強力な防御策であるSAFECLIPを提案する。 SAFECLIPは画像とテキストのモダリティに一元的コントラスト学習(CL)を適用してモデルをウォームアップする。そして、データを安全に危険なサブセットに慎重に分割する。 SAFECLIPは、画像とテキストのモダリティに一元的CLを適用してリスクデータをトレーニングし、CLIP損失を使用して安全なデータをトレーニングする。トレーニング中の安全なサブセットのサイズを徐々に大きくすることで、SAFECLIPはCLIPのパフォーマンスを損なうことなく、ターゲットデータ中毒やバックドア攻撃を効果的に破壊する。広範囲にわたる実験により,safeclipは標的データ中毒攻撃の攻撃成功率を93.75%から0%に,バックドア攻撃を100%から0%に低下させた。

関連論文リスト

CLIP-Guided Backdoor Defense through Entropy-Based Poisoned Dataset Separation [10.162187097557576]
ディープニューラルネットワーク(Deep Neural Networks, DNN)は、バックドア攻撃の影響を受ける。有毒データに対する現在のバックドア防御は、しばしば高い計算コストや、クリーンラベルやクリーンイメージバックドアのような高度な攻撃に対する低い効果に悩まされる。 CLIP誘導型バックドアディフェンス(CGD)は,様々なバックドア攻撃を軽減し,効率的かつ効果的な方法である。
論文参考訳（メタデータ） (2025-07-07T15:29:26Z)
Detecting Backdoor Samples in Contrastive Language Image Pretraining [32.85582585781569]
対照的に、CLIP (Contrastive Language-image Pretraining) は、バックドア攻撃の危険性が指摘されている。これにより、CLIPを使用して未調査のWebデータ上で大規模なモデルを事前トレーニングする現在のプラクティスに対するセキュリティ上の懸念が高まる。
論文参考訳（メタデータ） (2025-02-03T14:21:05Z)
Self-Calibrated CLIP for Training-Free Open-Vocabulary Segmentation [19.749490092520006]
Self-Calibrated CLIP (SC-CLIP) は、CLIPを校正してより微細な表現を生成する訓練不要の手法である。 SC-CLIPはバニラCLIP ViT-L/14の性能を6.8倍向上させる。
論文参考訳（メタデータ） (2024-11-24T15:14:05Z)
Persistent Pre-Training Poisoning of LLMs [71.53046642099142]
我々の研究は、事前学習中に言語モデルも妥協できるかどうかを初めて評価した。我々は、有害な敵に対する影響を測定するために、スクラッチから一連のLSMを事前訓練する。我々の主な結果は、モデルの事前トレーニングデータセットの0.1%しか中毒にならず、4つの攻撃のうち3つがポストトレーニングを通じて持続するのに十分であるということです。
論文参考訳（メタデータ） (2024-10-17T16:27:13Z)
BadCLIP: Trigger-Aware Prompt Learning for Backdoor Attacks on CLIP [55.33331463515103]
BadCLIPは、CLIPに対するバックドア攻撃において、新しく効果的なメカニズムの上に構築されている。画像に適用される学習可能なトリガーとトリガー対応コンテキストジェネレータで構成されており、トリガーはトリガー対応プロンプトを通じてテキスト機能を変更することができる。
論文参考訳（メタデータ） (2023-11-26T14:24:13Z)
A Comprehensive Study of Privacy Risks in Curriculum Learning [25.57099711643689]
有意義な順序でデータで機械学習モデルをトレーニングすることは、トレーニングプロセスの加速に有効であることが証明されている。重要な実現技術はカリキュラム学習(CL)であり、大きな成功を収め、画像やテキストの分類などの分野に展開されてきた。しかし、CLが機械学習のプライバシーにどのように影響するかは不明だ。
論文参考訳（メタデータ） (2023-10-16T07:06:38Z)
Demystifying CLIP Data [86.34045746910114]
Contrastive Language-Image Pre-Training (CLIP) はコンピュータビジョンの先進的な研究と応用を行っている。メタデータ変換言語画像事前学習(MetaCLIP)について紹介する。 MetaCLIPは生のデータプールとメタデータ(CLIPの概念から派生したもの)を取り、メタデータの分布に対してバランスの取れたサブセットを生成する。
論文参考訳（メタデータ） (2023-09-28T17:59:56Z)
Robust Contrastive Language-Image Pre-training against Data Poisoning and Backdoor Attacks [52.26631767748843]
ROCLIPは、ターゲットデータ中毒やバックドア攻撃に対して、マルチモーダル視覚言語モデルを堅牢に学習するための最初の効果的な方法である。 ROCLIPは、比較的大きく多様なランダムキャプションのプールを考慮することにより、有毒な撮像対の関連を効果的に破壊する。実験の結果,ROCLIPは訓練前のCLIPモデルにおいて,最先端のデータ中毒やバックドア攻撃を未然に防ぐことができることがわかった。
論文参考訳（メタデータ） (2023-03-13T04:49:46Z)
CleanCLIP: Mitigating Data Poisoning Attacks in Multimodal Contrastive Learning [63.72975421109622]
CleanCLIPは、バックドア攻撃によって引き起こされる学習された刺激的関連を弱める微調整フレームワークである。 CleanCLIPは、マルチモーダル・コントラッシブ・ラーニングに対するバックドア・アタックを根絶しながら、良質な例によるモデル性能を維持している。
論文参考訳（メタデータ） (2023-03-06T17:48:32Z)
BEAS: Blockchain Enabled Asynchronous & Secure Federated Machine Learning [0.0]
我々は、N-party Federated Learningのための最初のブロックチェーンベースのフレームワークBEASを紹介する。グラデーションプルーニングを使用したトレーニングデータの厳格なプライバシー保証を提供する。異常検出プロトコルは、データ汚染攻撃のリスクを最小限に抑えるために使用される。また、異種学習環境における早期収束を防止するための新しいプロトコルも定義する。
論文参考訳（メタデータ） (2022-02-06T17:11:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。