Fugu-MT 論文翻訳(概要): Robust Contrastive Language-Image Pre-training against Data Poisoning and Backdoor Attacks

論文の概要: Robust Contrastive Language-Image Pre-training against Data Poisoning and Backdoor Attacks

arxiv url: http://arxiv.org/abs/2303.06854v2
Date: Tue, 19 Dec 2023 19:12:53 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-21 19:23:28.160358
Title: Robust Contrastive Language-Image Pre-training against Data Poisoning and Backdoor Attacks
Title（参考訳）: データ中毒とバックドア攻撃に対するロバストなコントラスト言語画像前訓練
Authors: Wenhan Yang, Jingdong Gao, Baharan Mirzasoleiman
Abstract要約: ROCLIPは、ターゲットデータ中毒やバックドア攻撃に対して、マルチモーダル視覚言語モデルを堅牢に学習するための最初の効果的な方法である。 ROCLIPは、比較的大きく多様なランダムキャプションのプールを考慮することにより、有毒な撮像対の関連を効果的に破壊する。実験の結果,ROCLIPは訓練前のCLIPモデルにおいて,最先端のデータ中毒やバックドア攻撃を未然に防ぐことができることがわかった。
参考スコア（独自算出の注目度）: 52.26631767748843
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Contrastive vision-language representation learning has achieved state-of-the-art performance for zero-shot classification, by learning from millions of image-caption pairs crawled from the internet. However, the massive data that powers large multimodal models such as CLIP, makes them extremely vulnerable to various types of targeted data poisoning and backdoor attacks. Despite this vulnerability, robust contrastive vision-language pre-training against such attacks has remained unaddressed. In this work, we propose ROCLIP, the first effective method for robust pre-training multimodal vision-language models against targeted data poisoning and backdoor attacks. ROCLIP effectively breaks the association between poisoned image-caption pairs by considering a relatively large and varying pool of random captions, and matching every image with the text that is most similar to it in the pool instead of its own caption, every few epochs.It also leverages image and text augmentations to further strengthen the defense and improve the performance of the model. Our extensive experiments show that ROCLIP renders state-of-the-art targeted data poisoning and backdoor attacks ineffective during pre-training CLIP models. In particular, ROCLIP decreases the success rate for targeted data poisoning attacks from 93.75% to 12.5% and that of backdoor attacks down to 0%, while improving the model's linear probe performance by 10% and maintains a similar zero shot performance compared to CLIP. By increasing the frequency of matching, ROCLIP is able to defend strong attacks, which add up to 1% poisoned examples to the data, and successfully maintain a low attack success rate of 12.5%, while trading off the performance on some tasks.
Abstract（参考訳）: 対照的な視覚言語表現学習は、インターネットからクロールされた数百万のイメージキャプチャペアから学習することで、ゼロショット分類の最先端のパフォーマンスを達成している。しかし、CLIPのような大規模なマルチモーダルモデルを動かす巨大なデータは、さまざまな種類のターゲットデータ中毒やバックドア攻撃に対して極めて脆弱である。この脆弱性にもかかわらず、このような攻撃に対する強固な対照的な視覚言語事前訓練は未対応のままである。本研究では,ターゲットとするデータ中毒やバックドア攻撃に対して,マルチモーダル視覚言語モデルの堅牢な事前学習を行う最初の方法であるroclipを提案する。 ROCLIPは、比較的大きく多彩なランダムキャプションのプールを考慮し、各画像と、そのキャプションではなく、プール内で最もよく似たテキストとを、いくつかのエポックごとにマッチングすることにより、有毒な画像キャプチャペアの関連を効果的に破壊する。また、画像とテキストの強化を活用して、防御をさらに強化し、モデルの性能を向上させる。 ROCLIPは、訓練前のCLIPモデルにおいて、最先端のデータ中毒やバックドア攻撃が効果的でないことを示す。特にROCLIPは、ターゲットデータ中毒攻撃の成功率を93.75%から12.5%、バックドア攻撃の成功率を0%まで下げる一方で、モデルの線形プローブ性能を10%改善し、CLIPと比較して同様のゼロショット性能を維持する。マッチング頻度を増大させることで、ROCLIPは強い攻撃を防御することができ、これはデータに有毒な例を最大1%増やし、低い攻撃成功率の12.5%を維持しながら、一部のタスクのパフォーマンスをトレードオフする。

関連論文リスト

Neural Antidote: Class-Wise Prompt Tuning for Purifying Backdoors in Pre-trained Vision-Language Models [42.81731204702258]
CBPT(Class-wise Backdoor Prompt Tuning)は、テキストプロンプトによって間接的に汚染された視覚言語モデル(VLM)を浄化する効率的な方法である。 CBPTは、7つの主要なバックドア攻撃に対して平均的クリーン精度(CA)58.86%、アタック成功率(ASR)0.39%のモデルユーティリティを維持しながら、バックドアの脅威を著しく軽減する。
論文参考訳（メタデータ） (2025-02-26T16:25:15Z)
ELBA-Bench: An Efficient Learning Backdoor Attacks Benchmark for Large Language Models [55.93380086403591]
生成可能な大規模言語モデルは、バックドアアタックに対して脆弱である。 $textitELBA-Bench$は、パラメータを効率的に微調整することで攻撃者がバックドアを注入できるようにする。 $textitELBA-Bench$は1300以上の実験を提供する。
論文参考訳（メタデータ） (2025-02-22T12:55:28Z)
Defending Multimodal Backdoored Models by Repulsive Visual Prompt Tuning [19.638259197558625]
マルチモーダルコントラスト学習モデル(例えばCLIP)は、大規模な画像テキストデータセットから高品質な表現を学習することができる。彼らはバックドア攻撃に対する重大な脆弱性を示し、深刻な安全性を懸念している。本稿では,新しい防御手法としてRepulsive Visual Prompt Tuning (RVPT)を提案する。
論文参考訳（メタデータ） (2024-12-29T08:09:20Z)
CleanerCLIP: Fine-grained Counterfactual Semantic Augmentation for Backdoor Defense in Contrastive Learning [53.766434746801366]
バックドアトリガの特徴的接続を遮断するための細粒な textbfText textbfAlignment textbfCleaner (TA-Cleaner) を提案する。 TA-Cleanerは、ファインタニングベースの防御技術の中で最先端の防御性を達成している。
論文参考訳（メタデータ） (2024-09-26T07:35:23Z)
Adversarial Backdoor Defense in CLIP [47.6497532581449]
CLIPのようなモデルで実証されたマルチモーダルコントラスト事前トレーニングは、バックドア攻撃に対して脆弱であることが判明した。本稿では,新たなデータ拡張戦略であるAdversarial Backdoor Defenseを提案する。実験により,ABDは,CLIPを標的とした従来型の単一モードとマルチモーダルの両方のバックドア攻撃に対して堅牢な防御を提供することが示された。
論文参考訳（メタデータ） (2024-09-24T10:56:18Z)
Revisiting Backdoor Attacks against Large Vision-Language Models [76.42014292255944]
本稿では,LVLMの命令チューニングにおけるバックドア攻撃の一般化可能性について実験的に検討する。以上に基づいて,既存のバックドア攻撃を修正した。本稿では,従来のシンプルなバックドア戦略でさえ,LVLMに深刻な脅威をもたらすことを指摘する。
論文参考訳（メタデータ） (2024-06-27T02:31:03Z)
AICAttack: Adversarial Image Captioning Attack with Attention-Based Optimization [13.045125782574306]
本稿では,画像上の微妙な摂動によって画像キャプションモデルを攻撃する新たな攻撃戦略であるAICAttackを提案する。ブラックボックス攻撃シナリオ内で動作するため、我々のアルゴリズムはターゲットモデルのアーキテクチャ、パラメータ、勾配情報へのアクセスを必要としない。複数の犠牲者モデルに対するベンチマークデータセットの広範な実験を通じて,AICAttackの有効性を実証する。
論文参考訳（メタデータ） (2024-02-19T08:27:23Z)
BadCLIP: Trigger-Aware Prompt Learning for Backdoor Attacks on CLIP [55.33331463515103]
BadCLIPは、CLIPに対するバックドア攻撃において、新しく効果的なメカニズムの上に構築されている。画像に適用される学習可能なトリガーとトリガー対応コンテキストジェネレータで構成されており、トリガーはトリガー対応プロンプトを通じてテキスト機能を変更することができる。
論文参考訳（メタデータ） (2023-11-26T14:24:13Z)
Better Safe than Sorry: Pre-training CLIP against Targeted Data Poisoning and Backdoor Attacks [46.504428925984406]
大規模な画像キャプチャデータセット上でのCLIP(Contrastive Language- Image Pre-training)は、ゼロショット分類において顕著な成功を収めた。 CLIPは、教師付き学習と比較して、ターゲットデータ中毒やバックドア攻撃に対してより脆弱である。我々は、ターゲットデータ中毒やバックドア攻撃に対して、CLIPを安全に事前訓練するための強力な防御策SAFECLIPを提案する。
論文参考訳（メタデータ） (2023-10-05T19:42:03Z)
INK: Inheritable Natural Backdoor Attack Against Model Distillation [8.937026844871074]
InKは、モデル蒸留を標的とした、継承可能な自然バックドアアタックである。 INKは画像のばらつきをバックドアトリガーとして採用し、クリーンイメージとクリーンラベル攻撃の両方を可能にする。例えば、INKは、既存の方法では平均1.4%の攻撃成功率に対して、蒸留後98%以上の攻撃成功率を維持している。
論文参考訳（メタデータ） (2023-04-21T14:35:47Z)
CleanCLIP: Mitigating Data Poisoning Attacks in Multimodal Contrastive Learning [63.72975421109622]
CleanCLIPは、バックドア攻撃によって引き起こされる学習された刺激的関連を弱める微調整フレームワークである。 CleanCLIPは、マルチモーダル・コントラッシブ・ラーニングに対するバックドア・アタックを根絶しながら、良質な例によるモデル性能を維持している。
論文参考訳（メタデータ） (2023-03-06T17:48:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。