論文の概要: Unveiling the Achilles' Heel: Backdoor Watermarking Forgery Attack in Public Dataset Protection
- arxiv url: http://arxiv.org/abs/2411.15450v1
- Date: Sat, 23 Nov 2024 04:39:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:17:57.780775
- Title: Unveiling the Achilles' Heel: Backdoor Watermarking Forgery Attack in Public Dataset Protection
- Title(参考訳): アキレス腱の破片: 公共データ保護におけるバックドアウォーターマーキングの偽造攻撃
- Authors: Zhiying Li, Zhi Liu, Dongjie Liu, Shengda Zhuo, Guanggang Geng, Jian Weng, Shanxiang Lyu, Xiaobo Jin,
- Abstract要約: バックドアの透かしは 所有権の証拠として データセット保護を再定義する
本稿では,バックドア透かしの信頼性を疑問視し,攻撃者の視点から再検討する。
偽造攻撃の問題を探索することにより、データセットのオーナシップ検証プロセスの固有の欠陥を明らかにする。
- 参考スコア(独自算出の注目度): 15.597371838613965
- License:
- Abstract: High-quality datasets can greatly promote the development of technology. However, dataset construction is expensive and time-consuming, and public datasets are easily exploited by opportunists who are greedy for quick gains, which seriously infringes the rights and interests of dataset owners. At present, backdoor watermarks redefine dataset protection as proof of ownership and become a popular method to protect the copyright of public datasets, which effectively safeguards the rights of owners and promotes the development of open source communities. In this paper, we question the reliability of backdoor watermarks and re-examine them from the perspective of attackers. On the one hand, we refine the process of backdoor watermarks by introducing a third-party judicial agency to enhance its practical applicability in real-world scenarios. On the other hand, by exploring the problem of forgery attacks, we reveal the inherent flaws of the dataset ownership verification process. Specifically, we design a Forgery Watermark Generator (FW-Gen) to generate forged watermarks and define a distillation loss between the original watermark and the forged watermark to transfer the information in the original watermark to the forged watermark. Extensive experiments show that forged watermarks have the same statistical significance as original watermarks in copyright verification tests under various conditions and scenarios, indicating that dataset ownership verification results are insufficient to determine infringement. These findings highlight the unreliability of backdoor watermarking methods for dataset ownership verification and suggest new directions for enhancing methods for protecting public datasets.
- Abstract(参考訳): 高品質なデータセットは、技術の発展を大いに促進することができる。
しかし、データセットの構築は高価で時間を要するため、データセット所有者の権利と利益を著しく侵害する急激な利益を欲しがるオパチュニストによって、公開データセットは簡単に悪用される。
現在、バックドア透かしは、データセット保護を所有権の証明として再定義し、パブリックデータセットの著作権を保護する一般的な方法となり、所有者の権利を効果的に保護し、オープンソースコミュニティの発展を促進する。
本稿では,バックドア透かしの信頼性を疑問視し,攻撃者の視点から再検討する。
一方,現実のシナリオにおける実用性を高めるために,第三者司法機関を導入することで,バックドア透かしのプロセスを洗練する。
一方、偽造攻撃の問題を探索することにより、データセットの所有権検証プロセスの固有の欠陥を明らかにする。
具体的には,偽透かし生成器(FW-Gen)を設計し,原透かしと偽透かしの蒸留損失を定義し,原透かしの情報を偽透かしに転送する。
広範囲にわたる実験により、偽造された透かしは、様々な条件やシナリオ下での著作権検証試験において、オリジナルの透かしと同じ統計的意義を持つことが明らかとなり、データセットの所有権検証結果が侵害を判断するには不十分であることが示唆された。
これらの知見は、データセットの所有権検証のためのバックドア透かし手法の信頼性の欠如を浮き彫りにし、パブリックデータセットを保護する方法を強化するための新しい方向性を提案する。
関連論文リスト
- Your Fixed Watermark is Fragile: Towards Semantic-Aware Watermark for EaaS Copyright Protection [5.2431999629987]
埋め込み・アズ・ア・サービス(E: Embedding-as-a-Service)はビジネスパターンとして成功したが、著作権侵害に関する重大な課題に直面している。
様々な研究が、Eサービスの著作権を保護するためのバックドアベースの透かし方式を提案している。
本稿では,従来の透かし方式が意味に依存しない特徴を持つことを示す。
論文 参考訳(メタデータ) (2024-11-14T11:06:34Z) - ESpeW: Robust Copyright Protection for LLM-based EaaS via Embedding-Specific Watermark [50.08021440235581]
組み込み・アズ・ア・サービス(Eding)はAIアプリケーションにおいて重要な役割を担っている。
編集はモデル抽出攻撃に対して脆弱であり、著作権保護の緊急の必要性を強調している。
そこで我々は,Edingの著作権保護を堅牢にするための新しい埋め込み専用透かし (ESpeW) 機構を提案する。
論文 参考訳(メタデータ) (2024-10-23T04:34:49Z) - On the Weaknesses of Backdoor-based Model Watermarking: An Information-theoretic Perspective [39.676548104635096]
機械学習モデルの知的財産権の保護は、AIセキュリティの急激な懸念として浮上している。
モデルウォーターマーキングは、機械学習モデルのオーナシップを保護するための強力なテクニックである。
本稿では,既存の手法の限界を克服するため,新しいウォーターマーク方式であるIn-distriion Watermark Embedding (IWE)を提案する。
論文 参考訳(メタデータ) (2024-09-10T00:55:21Z) - Purification-Agnostic Proxy Learning for Agentic Copyright Watermarking against Adversarial Evidence Forgery [8.695511322757262]
不正使用と不正なAIモデルの配布は、知的財産に深刻な脅威をもたらす。
モデル透かしはこの問題に対処するための重要なテクニックとして登場した。
本稿では,透かしモデルへのいくつかの貢献について述べる。
論文 参考訳(メタデータ) (2024-09-03T02:18:45Z) - Certifiably Robust Image Watermark [57.546016845801134]
ジェネレーティブAIは、偽情報やプロパガンダキャンペーンの促進など、多くの社会的懸念を提起する。
ウォーターマークAI生成コンテンツは、これらの懸念に対処するための重要な技術である。
本報告では, 除去・偽造攻撃に対するロバスト性保証を保証した最初の画像透かしを提案する。
論文 参考訳(メタデータ) (2024-07-04T17:56:04Z) - Towards Robust Model Watermark via Reducing Parametric Vulnerability [57.66709830576457]
バックドアベースのオーナシップ検証が最近人気となり,モデルオーナがモデルをウォーターマークすることが可能になった。
本研究では,これらの透かし除去モデルを発見し,それらの透かし挙動を復元するミニマックス定式化を提案する。
本手法は,パラメトリックな変化と多数のウォーターマーク除去攻撃に対するモデル透かしの堅牢性を向上させる。
論文 参考訳(メタデータ) (2023-09-09T12:46:08Z) - Safe and Robust Watermark Injection with a Single OoD Image [90.71804273115585]
高性能なディープニューラルネットワークをトレーニングするには、大量のデータと計算リソースが必要である。
安全で堅牢なバックドア型透かし注入法を提案する。
我々は,透かし注入時のモデルパラメータのランダムな摂動を誘導し,一般的な透かし除去攻撃に対する防御を行う。
論文 参考訳(メタデータ) (2023-09-04T19:58:35Z) - ReMark: Receptive Field based Spatial WaterMark Embedding Optimization
using Deep Network [23.357707056321534]
難解な透かしを埋め込むための新しいディープラーニングアーキテクチャについて検討する。
提案手法は, 衝突歪みを含む透かしの一般的な歪みに対して頑健である。
論文 参考訳(メタデータ) (2023-05-11T13:21:29Z) - Did You Train on My Dataset? Towards Public Dataset Protection with
Clean-Label Backdoor Watermarking [54.40184736491652]
本稿では,公開データの保護のための一般的な枠組みとして機能するバックドアベースの透かし手法を提案する。
データセットに少数の透かしサンプルを挿入することにより、我々のアプローチは、ディフェンダーが設定した秘密関数を暗黙的に学習することを可能にする。
この隠れた機能は、データセットを違法に使用するサードパーティモデルを追跡するための透かしとして使用できる。
論文 参考訳(メタデータ) (2023-03-20T21:54:30Z) - Untargeted Backdoor Watermark: Towards Harmless and Stealthy Dataset
Copyright Protection [69.59980270078067]
我々は,異常なモデル行動が決定論的でない,未目標のバックドア透かし方式を探索する。
また、提案した未ターゲットのバックドア透かしをデータセットのオーナシップ検証に利用する方法について論じる。
論文 参考訳(メタデータ) (2022-09-27T12:56:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。