論文の概要: ChainMarks: Securing DNN Watermark with Cryptographic Chain
- arxiv url: http://arxiv.org/abs/2505.04977v2
- Date: Tue, 03 Jun 2025 17:16:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 01:42:09.106573
- Title: ChainMarks: Securing DNN Watermark with Cryptographic Chain
- Title(参考訳): ChainMarks: 暗号チェインによるDNN透かしのセキュア化
- Authors: Brian Choi, Shu Wang, Isabelle Choi, Kun Sun,
- Abstract要約: ディープニューラルネットワーク(DNN)モデルは、モデル所有者の知的特性を保護するために使用されている。
近年の研究では、既存の透かし方式は透かし除去やあいまいさ攻撃に弱いことが示されている。
トリガ入力に暗号チェーンを導入することにより,セキュアで堅牢な透かしを生成するChainMarksを提案する。
- 参考スコア(独自算出の注目度): 11.692176144467513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the widespread deployment of deep neural network (DNN) models, dynamic watermarking techniques are being used to protect the intellectual property of model owners. However, recent studies have shown that existing watermarking schemes are vulnerable to watermark removal and ambiguity attacks. Besides, the vague criteria for determining watermark presence further increase the likelihood of such attacks. In this paper, we propose a secure DNN watermarking scheme named ChainMarks, which generates secure and robust watermarks by introducing a cryptographic chain into the trigger inputs and utilizes a two-phase Monte Carlo method for determining watermark presence. First, ChainMarks generates trigger inputs as a watermark dataset by repeatedly applying a hash function over a secret key, where the target labels associated with trigger inputs are generated from the digital signature of model owner. Then, the watermarked model is produced by training a DNN over both the original and watermark datasets. To verify watermarks, we compare the predicted labels of trigger inputs with the target labels and determine ownership with a more accurate decision threshold that considers the classification probability of specific models. Experimental results show that ChainMarks exhibits higher levels of robustness and security compared to state-of-the-art watermarking schemes. With a better marginal utility, ChainMarks provides a higher probability guarantee of watermark presence in DNN models with the same level of watermark accuracy.
- Abstract(参考訳): ディープニューラルネットワーク(DNN)モデルの普及に伴い、モデル所有者の知的財産を保護するために動的透かし技術が使用されている。
しかし、最近の研究では、既存の透かし方式は透かし除去やあいまいさ攻撃に弱いことが示されている。
さらに、透かしの存在を決定する曖昧な基準は、そのような攻撃の可能性をさらに高めている。
本稿では,暗号チェーンをトリガ入力に導入することでセキュアで堅牢な透かしを生成する,ChainMarksというセキュアなDNN透かし方式を提案し,二相モンテカルロ法を用いて透かしの存在を判定する。
まず、ChainMarksはシークレットキーにハッシュ関数を繰り返し適用することにより、ウォーターマークデータセットとしてトリガー入力を生成し、モデル所有者のデジタル署名からトリガー入力に関連するターゲットラベルを生成する。
次に、透かしモデルを作成し、元のデータセットと透かしデータセットの両方でDNNをトレーニングする。
透かしを検証するために、予測されたトリガー入力のラベルとターゲットラベルを比較し、特定のモデルの分類確率を考慮したより正確な決定しきい値でオーナシップを決定する。
実験結果から,ChainMarksは最先端の透かし方式に比べて,ロバスト性とセキュリティのレベルが高いことが示された。
ChainMarksはより優れた限界効用により、同じレベルの透かし精度を持つDNNモデルにおける透かしの存在を高い確率で保証する。
関連論文リスト
- CLUE-MARK: Watermarking Diffusion Models using CLWE [13.010337595004708]
本稿では,拡散モデルに対する最初の検出不能な透かし方式であるCLUE-Markを紹介する。
CLUE-Markは、ウォーターマークされたモデルの変更を一切必要とせず、計算効率が良く、モデル出力の品質に影響を与えないことが保証されている。
CLUE-Markは、最近のステガノグラフィー攻撃では検出や除去ができない。
論文 参考訳(メタデータ) (2024-11-18T10:03:01Z) - FreeMark: A Non-Invasive White-Box Watermarking for Deep Neural Networks [5.937758152593733]
FreeMarkはディープニューラルネットワーク(DNN)を透かし出す新しいフレームワーク
従来の透かし法とは異なり、FreeMarkは、勾配降下を用いた予め生成された透かしベクトルとホストモデルから秘密鍵を革新的に生成する。
FreeMarkは、高い透かし容量を維持しながら、様々な透かし除去攻撃に効果的に抵抗することを示した。
論文 参考訳(メタデータ) (2024-09-16T05:05:03Z) - DeepEclipse: How to Break White-Box DNN-Watermarking Schemes [60.472676088146436]
既存のホワイトボックスの透かし除去方式とは大きく異なる難読化手法を提案する。
DeepEclipseは、下層の透かしスキームについて事前に知ることなく、透かし検出を回避できる。
評価の結果,DeepEclipseは複数のホワイトボックス透かし方式に優れていることがわかった。
論文 参考訳(メタデータ) (2024-03-06T10:24:47Z) - ClearMark: Intuitive and Robust Model Watermarking via Transposed Model
Training [50.77001916246691]
本稿では,人間の直感的な評価を目的とした最初のDNN透かし手法であるClearMarkを紹介する。
ClearMarkは目に見える透かしを埋め込んで、厳格な値閾値なしで人間の意思決定を可能にする。
8,544ビットの透かし容量は、現存する最強の作品に匹敵する。
論文 参考訳(メタデータ) (2023-10-25T08:16:55Z) - Towards Robust Model Watermark via Reducing Parametric Vulnerability [57.66709830576457]
バックドアベースのオーナシップ検証が最近人気となり,モデルオーナがモデルをウォーターマークすることが可能になった。
本研究では,これらの透かし除去モデルを発見し,それらの透かし挙動を復元するミニマックス定式化を提案する。
本手法は,パラメトリックな変化と多数のウォーターマーク除去攻撃に対するモデル透かしの堅牢性を向上させる。
論文 参考訳(メタデータ) (2023-09-09T12:46:08Z) - An Unforgeable Publicly Verifiable Watermark for Large Language Models [84.2805275589553]
現在の透かし検出アルゴリズムは、透かし生成プロセスで使用される秘密鍵を必要としており、公開検出中にセキュリティ違反や偽造の影響を受ける。
両段階で同じキーを使用するのではなく、2つの異なるニューラルネットワークを用いて透かしの生成と検出を行う。
論文 参考訳(メタデータ) (2023-07-30T13:43:27Z) - Piracy-Resistant DNN Watermarking by Block-Wise Image Transformation
with Secret Key [15.483078145498085]
提案手法は学習可能な変換画像を用いてモデルに透かしパターンを埋め込む。
海賊に耐性があるため、元のウォーターマークは海賊版ウォーターマークでは上書きできない。
その結果,高い透かし検出精度を維持しつつ,微調整や刈り込み攻撃に対して弾力性を示した。
論文 参考訳(メタデータ) (2021-04-09T08:21:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。