論文の概要: Transferable Multi-Bit Watermarking Across Frozen Diffusion Models via Latent Consistency Bridges
- arxiv url: http://arxiv.org/abs/2603.20304v1
- Date: Thu, 19 Mar 2026 13:13:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:38.823123
- Title: Transferable Multi-Bit Watermarking Across Frozen Diffusion Models via Latent Consistency Bridges
- Title(参考訳): 連続橋梁による凍結拡散モデル間の移動可能なマルチビット透かし
- Authors: Hong-Hanh Nguyen-Le, Van-Tuan Tran, Thuc D. Nguyen, Nhien-An Le-Khac,
- Abstract要約: DiffMarkは、シングルパスマルチビット検出、画像ごとのキーフレキシビリティ、およびクロスモデル転送性を提供するプラグイン・アンド・プレイの透かし方式である。
DiffMarkはまた、歪み、再生、敵攻撃に対する競争力のある透かしの堅牢性を維持している。
- 参考スコア(独自算出の注目度): 1.189955933770711
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As diffusion models (DMs) enable photorealistic image generation at unprecedented scale, watermarking techniques have become essential for provenance establishment and accountability. Existing methods face challenges: sampling-based approaches operate on frozen models but require costly $N$-step Denoising Diffusion Implicit Models (DDIM) inversion (typically N=50) for zero-bit-only detection; fine-tuning-based methods achieve fast multi-bit extraction but couple the watermark to a specific model checkpoint, requiring retraining for each architecture. We propose DiffMark, a plug-and-play watermarking method that offers three key advantages over existing approaches: single-pass multi-bit detection, per-image key flexibility, and cross-model transferability. Rather than encoding the watermark into the initial noise vector, DiffMark injects a persistent learned perturbation $δ$ at every denoising step of a completely frozen DM. The watermark signal accumulates in the final denoised latent $z_0$ and is recovered in a single forward pass. The central challenge of backpropagating gradients through a frozen UNet without traversing the full denoising chain is addressed by employing Latent Consistency Models (LCM) as a differentiable training bridge. This reduces the number of gradient steps from 50 DDIM to 4 LCM and enables a single-pass detection at 16.4 ms, a 45x speedup over sampling-based methods. Moreover, by this design, the encoder learns to map any runtime secret to a unique perturbation at inference time, providing genuine per-image key flexibility and transferability to unseen diffusion-based architectures without per-model fine-tuning. Although achieving these advantages, DiffMark also maintains competitive watermark robustness against distortion, regeneration, and adversarial attacks.
- Abstract(参考訳): 拡散モデル(DM)は前例のないスケールで光リアルな画像生成を可能にするため、透かし技術は証明の確立と説明責任に欠かせないものとなっている。
既存の手法では、サンプリングベースのアプローチはフリーズモデルで動作しているが、コストがかかる$N$-step Denoising Diffusion Implicit Models (DDIM)インバージョン(典型的にはN=50)をゼロビットで検出する。
DiffMarkは,シングルパスマルチビット検出,画像ごとのフレキシビリティ,およびクロスモデル転送性という,既存のアプローチに対する3つのアドバンテージを提供する,プラグアンドプレイの透かし方式である。
ウォーターマークを初期ノイズベクトルに符号化する代わりに、完全に凍結されたDMの全てのデノイングステップにおいて、DiffMarkは永続的に学習された摂動を$δ$で注入する。
透かし信号は最後の復号子であるz_0$に蓄積され、単一の前方通過で回収される。
フルデノナイジングチェーンをトラバースすることなく、凍結したUNetを通して勾配をバックプロパゲートするという中心的な課題は、LCM(Latent Consistency Models)を差別化可能なトレーニングブリッジとして利用することで解決される。
これにより、勾配ステップを50 DDIMから4 LCMに減らし、16.4 msでのシングルパス検出が可能となり、サンプリングベースの方法よりも45倍高速化された。
さらに、この設計により、エンコーダは、任意のランタイムシークレットを推論時にユニークな摂動にマッピングすることを学び、モデルごとの微調整なしに、真の画像ごとのキーフレキシビリティとトランスファービリティを提供する。
これらの利点を達成する一方で、ディフマークは歪み、再生、敵攻撃に対する競争力のある透かしも維持している。
関連論文リスト
- OSI: One-step Inversion Excels in Extracting Diffusion Watermarks [56.210696479553945]
ガウスシェーディングスタイルの透かしを抽出する手法であるワンステップインバージョン(OSI)を提案する。
OSIは、透かし抽出を学習可能な記号分類問題として再構成し、初期雑音の正確な回帰を不要にする。
我々のOSIは,20倍高速で,抽出精度が向上し,透かしペイロード容量が2倍になる多段拡散インバージョン法を著しく上回っている。
論文 参考訳(メタデータ) (2026-02-10T07:43:16Z) - T2SMark: Balancing Robustness and Diversity in Noise-as-Watermark for Diffusion Models [89.29541056113442]
T2SMarkはTail-Truncated Smpling(TTS)に基づく2段階の透かし方式である
U-NetとDiTのバックボーンを用いた拡散モデル上でのT2SMarkの評価を行った。
論文 参考訳(メタデータ) (2025-10-25T16:55:55Z) - OptMark: Robust Multi-bit Diffusion Watermarking via Inference Time Optimization [66.69924980864053]
拡散復調過程の中間潜水器に頑健なマルチビット透かしを埋め込む最適化手法である OptMark を提案する。
OptMarkは、生成攻撃に対して早期に構造的な透かしを挿入し、画像変換に耐えるために遅れて詳細な透かしを挿入する。
実験結果から,OptMarkは有意変換,幾何変換,編集,再生攻撃に対する堅牢なレジリエンスを確保しつつ,目に見えないマルチビット透かしを実現することが示された。
論文 参考訳(メタデータ) (2025-08-29T15:50:59Z) - DiffMark: Diffusion-based Robust Watermark Against Deepfakes [49.05095089309156]
ディープフェイクは、悪意のある顔操作を通じて、重大なセキュリティとプライバシーの脅威を引き起こす。
既存の透かし法はディープフェイク操作に対して十分な堅牢性を欠いていることが多い。
本稿では拡散モデルに基づく新しいロバストな透かしフレームワークDiffMarkを提案する。
論文 参考訳(メタデータ) (2025-07-02T07:29:33Z) - GaussMarker: Robust Dual-Domain Watermark for Diffusion Models [9.403937469402871]
GaussMarkerは8つの画像歪みと3つのバージョンにわたる4つの高度な攻撃の下で、最先端のパフォーマンスを効率的に達成する。
本稿では,パイプライン型インジェクタを用いて空間領域と周波数領域の両方に透かしを連続的に埋め込む方式として,最初のデュアルドメインDM透かし手法を提案する。
論文 参考訳(メタデータ) (2025-06-13T03:45:15Z) - Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文 参考訳(メタデータ) (2023-10-01T05:07:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。