論文の概要: T2SMark: Balancing Robustness and Diversity in Noise-as-Watermark for Diffusion Models
- arxiv url: http://arxiv.org/abs/2510.22366v1
- Date: Sat, 25 Oct 2025 16:55:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 17:41:21.956779
- Title: T2SMark: Balancing Robustness and Diversity in Noise-as-Watermark for Diffusion Models
- Title(参考訳): T2SMark:拡散モデルにおけるノイズ・アズ・ウォーターマークのロバスト性と多様性のバランス
- Authors: Jindong Yang, Han Fang, Weiming Zhang, Nenghai Yu, Kejiang Chen,
- Abstract要約: T2SMarkはTail-Truncated Smpling(TTS)に基づく2段階の透かし方式である
U-NetとDiTのバックボーンを用いた拡散モデル上でのT2SMarkの評価を行った。
- 参考スコア(独自算出の注目度): 89.29541056113442
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models have advanced rapidly in recent years, producing high-fidelity images while raising concerns about intellectual property protection and the misuse of generative AI. Image watermarking for diffusion models, particularly Noise-as-Watermark (NaW) methods, encode watermark as specific standard Gaussian noise vector for image generation, embedding the infomation seamlessly while maintaining image quality. For detection, the generation process is inverted to recover the initial noise vector containing the watermark before extraction. However, existing NaW methods struggle to balance watermark robustness with generation diversity. Some methods achieve strong robustness by heavily constraining initial noise sampling, which degrades user experience, while others preserve diversity but prove too fragile for real-world deployment. To address this issue, we propose T2SMark, a two-stage watermarking scheme based on Tail-Truncated Sampling (TTS). Unlike prior methods that simply map bits to positive or negative values, TTS enhances robustness by embedding bits exclusively in the reliable tail regions while randomly sampling the central zone to preserve the latent distribution. Our two-stage framework then ensures sampling diversity by integrating a randomly generated session key into both encryption pipelines. We evaluate T2SMark on diffusion models with both U-Net and DiT backbones. Extensive experiments show that it achieves an optimal balance between robustness and diversity. Our code is available at \href{https://github.com/0xD009/T2SMark}{https://github.com/0xD009/T2SMark}.
- Abstract(参考訳): 近年,拡散モデルが急速に発展し,知的財産保護や生成AIの誤用への懸念が高まっている。
拡散モデルのための画像透かし、特にノイズ・アズ・ウォーターマーク(NaW)法は、透かしを画像生成のための特定の標準ガウスノイズベクトルとしてエンコードし、画像品質を維持しながらインフォメーションをシームレスに埋め込む。
検出には、生成工程を反転して、抽出前の透かしを含む初期ノイズベクトルを復元する。
しかし、既存のNaW法は、透かしの堅牢性と世代多様性のバランスをとるのに苦労している。
ユーザエクスペリエンスを低下させる初期ノイズサンプリングを厳しく制限する手法や、多様性を保ちながら現実のデプロイメントには脆弱すぎることを示す手法がある。
この問題に対処するため,T2SMarkを提案する。
ビットを正あるいは負の値に単純にマッピングする従来の方法とは異なり、TSSは信頼できる尾部領域にのみビットを埋め込むことでロバスト性を高め、中央領域をランダムにサンプリングして潜伏分布を保存する。
次に、ランダムに生成されたセッションキーを両方の暗号化パイプラインに統合することにより、サンプリングの多様性を保証する。
U-NetとDiTのバックボーンを用いた拡散モデル上でのT2SMarkの評価を行った。
大規模な実験により、頑健性と多様性の最適なバランスが達成された。
我々のコードは \href{https://github.com/0xD009/T2SMark}{https://github.com/0xD009/T2SMark} で入手できる。
関連論文リスト
- Enhancing Robustness in Post-Processing Watermarking: An Ensemble Attack Network Using CNNs and Transformers [46.00417078548415]
本研究は,訓練中にアンサンブル攻撃ネットワークを組み込むことにより,後処理の透かしに着目し,その堅牢性を高めることを目的とする。
我々は、CNNとTransformerを用いて、空間領域と周波数領域の両方で攻撃ネットワークの様々なバージョンを構築した。
その結果、空間領域におけるCNNベースの攻撃ネットワークと周波数領域におけるトランスフォーマーベースの攻撃ネットワークを組み合わせることで、ウォーターマーキングモデルにおいて最もロバスト性が高いことがわかった。
論文 参考訳(メタデータ) (2025-09-03T04:28:48Z) - OptMark: Robust Multi-bit Diffusion Watermarking via Inference Time Optimization [66.69924980864053]
拡散復調過程の中間潜水器に頑健なマルチビット透かしを埋め込む最適化手法である OptMark を提案する。
OptMarkは、生成攻撃に対して早期に構造的な透かしを挿入し、画像変換に耐えるために遅れて詳細な透かしを挿入する。
実験結果から,OptMarkは有意変換,幾何変換,編集,再生攻撃に対する堅牢なレジリエンスを確保しつつ,目に見えないマルチビット透かしを実現することが示された。
論文 参考訳(メタデータ) (2025-08-29T15:50:59Z) - DiffMark: Diffusion-based Robust Watermark Against Deepfakes [49.05095089309156]
ディープフェイクは、悪意のある顔操作を通じて、重大なセキュリティとプライバシーの脅威を引き起こす。
既存の透かし法はディープフェイク操作に対して十分な堅牢性を欠いていることが多い。
本稿では拡散モデルに基づく新しいロバストな透かしフレームワークDiffMarkを提案する。
論文 参考訳(メタデータ) (2025-07-02T07:29:33Z) - GaussMarker: Robust Dual-Domain Watermark for Diffusion Models [9.403937469402871]
GaussMarkerは8つの画像歪みと3つのバージョンにわたる4つの高度な攻撃の下で、最先端のパフォーマンスを効率的に達成する。
本稿では,パイプライン型インジェクタを用いて空間領域と周波数領域の両方に透かしを連続的に埋め込む方式として,最初のデュアルドメインDM透かし手法を提案する。
論文 参考訳(メタデータ) (2025-06-13T03:45:15Z) - NOFT: Test-Time Noise Finetune via Information Bottleneck for Highly Correlated Asset Creation [70.96827354717459]
拡散モデルは、テキスト・ツー・イメージ(T2I)と画像・ツー・イメージ(I2I)を生成する強力なツールを提供する。
本研究では,高相関・多彩な画像を生成するため,安定拡散を用いたノイズファインチューンNOFTモジュールを提案する。
論文 参考訳(メタデータ) (2025-05-18T05:09:47Z) - Gaussian Shading++: Rethinking the Realistic Deployment Challenge of Performance-Lossless Image Watermark for Diffusion Models [66.54457339638004]
著作権保護と不適切なコンテンツ生成は、拡散モデルの実装に課題をもたらす。
本研究では,実世界の展開に適した拡散モデル透かし手法を提案する。
Gaussian Shading++はパフォーマンスのロスレス性を維持するだけでなく、ロバスト性の観点からも既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2025-04-21T11:18:16Z) - SuperMark: Robust and Training-free Image Watermarking via Diffusion-based Super-Resolution [27.345134138673945]
我々は、堅牢でトレーニング不要な透かしフレームワークであるSuperMarkを提案する。
SuperMarkは既存の手法を使って初期ガウスノイズに透かしを埋め込む。
次に、トレーニング済みの超解像モデルを適用して、透かしのノイズを消音し、最終的な透かしの画像を生成する。
抽出には、透かし画像がDDIM変換により初期透かしノイズに逆戻りされ、埋め込み透かしが抽出される。
実験により、SuperMarkは既存のメソッドに匹敵する忠実性を達成し、ロバスト性を大幅に改善した。
論文 参考訳(メタデータ) (2024-12-13T11:20:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。