論文の概要: Repurposing and Evaluating the (In)Feasibility of Dataset Poisoning enabled Watermarking for Contrastive Learning
- arxiv url: http://arxiv.org/abs/2605.01834v1
- Date: Sun, 03 May 2026 12:01:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.958256
- Title: Repurposing and Evaluating the (In)Feasibility of Dataset Poisoning enabled Watermarking for Contrastive Learning
- Title(参考訳): コントラスト学習のための(In)データセット中毒対応型透かしの再利用と評価
- Authors: Zhiyang Dai, Yansong Gao, Boyu Kuang, Haodong Li, Qi Chang, Gaurav Varshney, Derek Abbott, Anmin Fu,
- Abstract要約: コントラスト学習(CL)は、自動からの監視信号によるアノテーションのコストを削減する。
近年の研究では、CLモデルはデータ汚染によるバックドア攻撃に弱いことが示されているが、その一般化とロバスト性は過小評価されている。
我々は、CLに対する既存のデータ収集バックドア攻撃を評価し、データセット適応性の低下、成功率の低下、ポータビリティの制限、制約のある仮定を明らかにした。
- 参考スコア(独自算出の注目度): 14.983235053435138
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contrastive learning (CL) reduces annotation cost via auto-derived supervisory signals. Since large-scale in-house CL datasets are infeasible, reliance on third-party or internet data is common. Recent studies show CL models are vulnerable to data-poisoning backdoor attacks, but their generalization and robustness are underexplored. We systematically evaluate existing data-poisoning backdoor attacks on CL, revealing limitations: poor dataset adaptability, low success rates, limited portability, and restrictive assumptions (e.g., downstream task knowledge). Interestingly, trigger samples exhibit distinguishable statistical divergence from clean samples, which inspires repurposing it as a watermark for dataset IP protection. Direct repurposing is challenging due to low success rates; we overcome this by statistical verification using a unified density metric. We further propose a multi-level watermarking scheme adapting to feature-level, soft-label, or hard-label outputs in CL. Experiments show some backdoor attacks can be repurposed as effective watermarks with trade-offs among fidelity, verifiability, and robustness. This work demonstrates weak backdoor effects become reliable signals for dataset IP protection in challenging CL settings.
- Abstract(参考訳): コントラスト学習(CL)は、自動からの監視信号によるアノテーションのコストを削減する。
大規模な社内CLデータセットは実現不可能であるため、サードパーティやインターネットデータへの依存が一般的である。
近年の研究では、CLモデルはデータ汚染によるバックドア攻撃に弱いことが示されているが、その一般化とロバスト性は過小評価されている。
我々はCLに対する既存のデータ収集バックドア攻撃を体系的に評価し、データセット適応性の低さ、成功率の低さ、ポータビリティの制限、制約のある仮定(ダウンストリームタスク知識など)といった制限を明らかにした。
興味深いことに、トリガーサンプルはクリーンサンプルと区別可能な統計的差異を示しており、データセットのIP保護のための透かしとして再利用するきっかけとなっている。
直接再資源化は成功率の低いため困難であり、統一密度計量を用いた統計的検証によってこれを克服する。
さらに,CLにおける特徴レベル,ソフトラベル,ハードラベルの出力に適応するマルチレベル透かし方式を提案する。
実験により、バックドア攻撃は、忠実さ、検証可能性、堅牢性の間のトレードオフを伴う効果的な透かしとして再利用できることが示された。
この研究は、弱いバックドア効果がCL設定に挑戦する際のデータセットIP保護のための信頼性の高い信号になることを示す。
関連論文リスト
- CBW: Towards Dataset Ownership Verification for Speaker Verification via Clustering-based Backdoor Watermarking [85.68235482145091]
大規模音声データセットは貴重な知的財産となった。
本稿では,新しいデータセットのオーナシップ検証手法を提案する。
我々のアプローチはクラスタリングに基づくバックドア透かし(CBW)を導入している。
我々は,ベンチマークデータセットに対する広範な実験を行い,本手法の有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2025-03-02T02:02:57Z) - Hide in Plain Sight: Clean-Label Backdoor for Auditing Membership Inference [16.893873979953593]
本研究では,ステルスデータ監査のための新しいクリーンラベルバックドア方式を提案する。
我々のアプローチでは、ターゲットモデルの振る舞いを模倣するシャドウモデルによって生成される最適なトリガを用いる。
提案手法は,ブラックボックスアクセスによるロバストなデータ監査を可能にし,多様なデータセット間で高い攻撃成功率を達成する。
論文 参考訳(メタデータ) (2024-11-24T20:56:18Z) - Defending Against Repetitive Backdoor Attacks on Semi-supervised Learning through Lens of Rate-Distortion-Perception Trade-off [20.713624299599722]
半教師付き学習(SSL)は、わずかなラベル付きデータで顕著なパフォーマンスを達成した。
信頼できないデータの大規模なプールは、データ中毒に極めて脆弱であり、バックドア攻撃につながる可能性がある。
トリガーパターンとターゲットクラスの関係を阻害する新しい手法であるunlabeled Data Purification (UPure)を提案する。
論文 参考訳(メタデータ) (2024-07-14T12:42:11Z) - A GAN-Based Data Poisoning Attack Against Federated Learning Systems and Its Countermeasure [17.975736855580674]
本稿では,VagGANという新たなデータ中毒モデルを提案する。
VagueGANは、GAN(Generative Adversarial Network)の変異を利用して、一見正当であるがノイズの多い有毒なデータを生成することができる。
我々の攻撃方法は一般によりステルス性が高く、複雑性の低いFL性能の劣化に有効である。
論文 参考訳(メタデータ) (2024-05-19T04:23:40Z) - Unveiling Vulnerabilities of Contrastive Recommender Systems to Poisoning Attacks [48.911832772464145]
コントラスト学習(CL)は近年,レコメンダシステムの領域で注目されている。
本稿では,CLをベースとしたレコメンデータシステムの脆弱性を明らかにする。
論文 参考訳(メタデータ) (2023-11-30T04:25:28Z) - Did You Train on My Dataset? Towards Public Dataset Protection with
Clean-Label Backdoor Watermarking [54.40184736491652]
本稿では,公開データの保護のための一般的な枠組みとして機能するバックドアベースの透かし手法を提案する。
データセットに少数の透かしサンプルを挿入することにより、我々のアプローチは、ディフェンダーが設定した秘密関数を暗黙的に学習することを可能にする。
この隠れた機能は、データセットを違法に使用するサードパーティモデルを追跡するための透かしとして使用できる。
論文 参考訳(メタデータ) (2023-03-20T21:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。