論文の概要: Domain Watermark: Effective and Harmless Dataset Copyright Protection is
Closed at Hand
- arxiv url: http://arxiv.org/abs/2310.14942v1
- Date: Mon, 9 Oct 2023 11:23:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-29 15:58:34.133389
- Title: Domain Watermark: Effective and Harmless Dataset Copyright Protection is
Closed at Hand
- Title(参考訳): ドメインウォーターマーク: 有効かつ無害なデータセットの著作権保護が手元に閉鎖される
- Authors: Junfeng Guo, Yiming Li, Lixu Wang, Shu-Tao Xia, Heng Huang, Cong Liu,
Bo Li
- Abstract要約: バックドアベースのデータセットオーナシップ検証(DOV)は現在、オープンソースデータセットの著作権を保護するための唯一の実現可能なアプローチである。
我々は、(保護されたデータセットでトレーニングされた)ウォーターマークされたモデルを、良質なモデルによって誤って分類されるであろう、いくつかの難しい'サンプルを正しく分類する。
- 参考スコア(独自算出の注目度): 96.26251471253823
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The prosperity of deep neural networks (DNNs) is largely benefited from
open-source datasets, based on which users can evaluate and improve their
methods. In this paper, we revisit backdoor-based dataset ownership
verification (DOV), which is currently the only feasible approach to protect
the copyright of open-source datasets. We reveal that these methods are
fundamentally harmful given that they could introduce malicious
misclassification behaviors to watermarked DNNs by the adversaries. In this
paper, we design DOV from another perspective by making watermarked models
(trained on the protected dataset) correctly classify some `hard' samples that
will be misclassified by the benign model. Our method is inspired by the
generalization property of DNNs, where we find a \emph{hardly-generalized
domain} for the original dataset (as its \emph{domain watermark}). It can be
easily learned with the protected dataset containing modified samples.
Specifically, we formulate the domain generation as a bi-level optimization and
propose to optimize a set of visually-indistinguishable clean-label modified
data with similar effects to domain-watermarked samples from the
hardly-generalized domain to ensure watermark stealthiness. We also design a
hypothesis-test-guided ownership verification via our domain watermark and
provide the theoretical analyses of our method. Extensive experiments on three
benchmark datasets are conducted, which verify the effectiveness of our method
and its resistance to potential adaptive methods. The code for reproducing main
experiments is available at
\url{https://github.com/JunfengGo/Domain-Watermark}.
- Abstract(参考訳): ディープニューラルネットワーク(DNN)の繁栄は、ユーザがメソッドを評価し改善できるオープンソースデータセットから大きく恩恵を受けている。
本稿では,オープンソースデータセットの著作権を保護するための唯一の有効なアプローチである,バックドアベースのデータセット所有権検証(dov)を再検討する。
これらの手法は,悪質な誤分類行為を敵のDNNにもたらしうるため,基本的に有害であることが明らかとなった。
本稿では,防犯データセット上でトレーニングされた)透かし付きモデルを用いて,良性モデルによって誤分類される「ハード」サンプルを正しく分類することにより,別の視点からdovを設計する。
この手法はdnnsの一般化特性に触発され、元のデータセットに対して \emph{hardly-generalized domain} を見つける( \emph{domain watermark} として)。
修正されたサンプルを含む保護データセットで簡単に学習できる。
具体的には、二段階最適化としてドメイン生成を定式化し、不一般化ドメインのドメイン透かしサンプルと類似した効果を持つ視覚的に区別できないクリーンラベル修正データのセットを最適化し、透かしのステルス性を確保することを提案する。
また,仮説テストによる所有権検証をドメイン透かしで設計し,その理論的解析を行う。
提案手法の有効性と潜在的な適応手法に対する耐性を検証した3つのベンチマークデータセットの大規模な実験を行った。
主な実験を再現するコードは \url{https://github.com/junfenggo/domain-watermark} で入手できる。
関連論文リスト
- Did You Train on My Dataset? Towards Public Dataset Protection with
Clean-Label Backdoor Watermarking [54.40184736491652]
本稿では,公開データの保護のための一般的な枠組みとして機能するバックドアベースの透かし手法を提案する。
データセットに少数の透かしサンプルを挿入することにより、我々のアプローチは、ディフェンダーが設定した秘密関数を暗黙的に学習することを可能にする。
この隠れた機能は、データセットを違法に使用するサードパーティモデルを追跡するための透かしとして使用できる。
論文 参考訳(メタデータ) (2023-03-20T21:54:30Z) - Untargeted Backdoor Watermark: Towards Harmless and Stealthy Dataset
Copyright Protection [69.59980270078067]
我々は,異常なモデル行動が決定論的でない,未目標のバックドア透かし方式を探索する。
また、提案した未ターゲットのバックドア透かしをデータセットのオーナシップ検証に利用する方法について論じる。
論文 参考訳(メタデータ) (2022-09-27T12:56:56Z) - Black-box Dataset Ownership Verification via Backdoor Watermarking [67.69308278379957]
我々は、リリースデータセットの保護を、(目立たしい)サードパーティモデルのトレーニングに採用されているかどうかの検証として定式化する。
バックドアの透かしを通じて外部パターンを埋め込んでオーナシップの検証を行い,保護することを提案する。
具体的には、有毒なバックドア攻撃(例えばBadNets)をデータセットのウォーターマーキングに利用し、データセット検証のための仮説テストガイダンスメソッドを設計する。
論文 参考訳(メタデータ) (2022-08-04T05:32:20Z) - A Free Lunch for Unsupervised Domain Adaptive Object Detection without
Source Data [69.091485888121]
教師なしドメイン適応(unsupervised domain adaptation) ソースとターゲットのドメインデータは自由に利用でき、通常、ドメイン間のギャップを減らすために一緒に訓練される。
ノイズの多いラベルで学習する問題にモデル化することで,ソースデータのないドメイン適応オブジェクト検出(SFOD)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-10T01:42:35Z) - Open-sourced Dataset Protection via Backdoor Watermarking [87.15630326131901]
本稿では,オープンソースの画像分類データセットを保護するために,Emphbackdoor Embeddingベースのデータセット透かし手法を提案する。
疑わしい第三者モデルによって生成される後続確率に基づいて,仮説テストガイド法を用いてデータセット検証を行う。
論文 参考訳(メタデータ) (2020-10-12T16:16:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。