論文の概要: PT-Mark: Invisible Watermarking for Text-to-image Diffusion Models via Semantic-aware Pivotal Tuning
- arxiv url: http://arxiv.org/abs/2504.10853v2
- Date: Fri, 18 Apr 2025 04:58:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-28 12:19:25.510336
- Title: PT-Mark: Invisible Watermarking for Text-to-image Diffusion Models via Semantic-aware Pivotal Tuning
- Title(参考訳): PT-Mark:意味認識型Pivotal Tuningによるテキスト・画像拡散モデルの可視な透かし
- Authors: Yaopeng Wang, Huiyu Xu, Zhibo Wang, Jiacheng Du, Zhichao Li, Yiming Li, Qiu Wang, Kui Ren,
- Abstract要約: 本稿ではセマンティック・アウェアなPivotal Tuning Watermarks(PT-Mark)を紹介する。
PT-Markは拡散画像の意味と透かしのトレーサビリティの両方を保存している。
最先端の透かし法に比べてセマンティックな保存性能が10%向上した。
- 参考スコア(独自算出の注目度): 19.170393134039568
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Watermarking for diffusion images has drawn considerable attention due to the widespread use of text-to-image diffusion models and the increasing need for their copyright protection. Recently, advanced watermarking techniques, such as Tree Ring, integrate watermarks by embedding traceable patterns (e.g., Rings) into the latent distribution during the diffusion process. Such methods disrupt the original semantics of the generated images due to the inevitable distribution shift caused by the watermarks, thereby limiting their practicality, particularly in digital art creation. In this work, we present Semantic-aware Pivotal Tuning Watermarks (PT-Mark), a novel invisible watermarking method that preserves both the semantics of diffusion images and the traceability of the watermark. PT-Mark preserves the original semantics of the watermarked image by gradually aligning the generation trajectory with the original (pivotal) trajectory while maintaining the traceable watermarks during whole diffusion denoising process. To achieve this, we first compute the salient regions of the watermark at each diffusion denoising step as a spatial prior to identify areas that can be aligned without disrupting the watermark pattern. Guided by the region, we then introduce an additional pivotal tuning branch that optimizes the text embedding to align the semantics while preserving the watermarks. Extensive evaluations demonstrate that PT-Mark can preserve the original semantics of the diffusion images while integrating robust watermarks. It achieves a 10% improvement in the performance of semantic preservation (i.e., SSIM, PSNR, and LPIPS) compared to state-of-the-art watermarking methods, while also showing comparable robustness against real-world perturbations and four times greater efficiency.
- Abstract(参考訳): 拡散画像の透かしは、テキスト・画像拡散モデルの普及と著作権保護の必要性の高まりにより、かなりの注目を集めている。
近年,ツリーリングなどの高度な透かし技術は,拡散過程中にトレーサブルパターン(例えばリング)を潜伏分布に埋め込むことによって透かしを統合する。
このような手法は、透かしによって生じる避けられない分布シフトによって生成された画像の本来の意味を損なうため、特にデジタルアート作成において、その実用性を制限する。
本研究では,拡散画像のセマンティクスと透かしのトレーサビリティを両立させる新しい透かし手法であるセマンティック・アウェアのPivotal Tuning Watermarks (PT-Mark)を提案する。
PT-Markは、全拡散復調過程において、トレーサブルな透かしを維持しながら、生成軌跡を元の(ピボタル)軌跡と徐々に整列させることにより、透かし画像の本来の意味を保っている。
そこで我々はまず,各拡散音化段階における透かしの健全な領域を空間として計算し,透かしパターンを乱すことなく整列可能な領域を特定する。
地域によってガイドされ、テキスト埋め込みを最適化し、透かしを保存しながらセマンティクスを整列させる、追加のピボットチューニングブランチを導入します。
広範囲な評価により,PT-Markは,ロバストな透かしを統合しながら拡散画像の本来の意味を保存できることが示されている。
SSIM, PSNR, LPIPSのセマンティック保存性能は, 最先端の透かし法に比べて10%向上し, 実世界の摂動に匹敵するロバスト性を示し, 効率も4倍に向上した。
関連論文リスト
- Forging and Removing Latent-Noise Diffusion Watermarks Using a Single Image [24.513881574366046]
従来の透かし方式は、初期ノイズに秘密鍵を埋め込む。
拡散モデルウェイトへのアクセスを前提としないブラックボックス逆襲攻撃を提案する。
また,この領域を抜け出すために摂動を学習することで,透かし除去にも同様のアプローチが適用可能であることを示す。
論文 参考訳(メタデータ) (2025-04-27T18:29:26Z) - Bridging Knowledge Gap Between Image Inpainting and Large-Area Visible Watermark Removal [57.84348166457113]
本稿では,事前学習した画像の塗装モデルの表現能力を活用する新しい特徴適応フレームワークを提案する。
本手法は, 透かしの残像の残像を塗布バックボーンモデルに流し込むことにより, 透かしと透かし除去の知識ギャップを埋めるものである。
高品質な透かしマスクへの依存を緩和するために,粗い透かしマスクを用いて推論プロセスを導出する新たな訓練パラダイムを導入する。
論文 参考訳(メタデータ) (2025-04-07T02:37:14Z) - SEAL: Semantic Aware Image Watermarking [26.606008778795193]
本稿では,生成した画像のセマンティック情報を透かしに直接埋め込む新しい透かし手法を提案する。
キーパターンは、局所性に敏感なハッシュを用いて画像のセマンティック埋め込みから推測することができる。
以上の結果から,画像生成モデルによるリスクを軽減できる可能性が示唆された。
論文 参考訳(メタデータ) (2025-03-15T15:29:05Z) - SuperMark: Robust and Training-free Image Watermarking via Diffusion-based Super-Resolution [27.345134138673945]
我々は、堅牢でトレーニング不要な透かしフレームワークであるSuperMarkを提案する。
SuperMarkは既存の手法を使って初期ガウスノイズに透かしを埋め込む。
次に、トレーニング済みの超解像モデルを適用して、透かしのノイズを消音し、最終的な透かしの画像を生成する。
抽出には、透かし画像がDDIM変換により初期透かしノイズに逆戻りされ、埋め込み透かしが抽出される。
実験により、SuperMarkは既存のメソッドに匹敵する忠実性を達成し、ロバスト性を大幅に改善した。
論文 参考訳(メタデータ) (2024-12-13T11:20:59Z) - Shallow Diffuse: Robust and Invisible Watermarking through Low-Dimensional Subspaces in Diffusion Models [10.726987194250116]
拡散モデル出力にロバストで見えない透かしを埋め込む新しい透かし技術であるShallow Diffuseを導入する。
我々の理論的および経験的分析により,浅度拡散はデータ生成の一貫性と透かしの検出可能性を大幅に向上させることが示された。
論文 参考訳(メタデータ) (2024-10-28T14:51:04Z) - Image Watermarks are Removable Using Controllable Regeneration from Clean Noise [26.09012436917272]
透かし技法の重要な特徴は、様々な操作に対する頑丈さである。
本稿では,最先端の透かし手法を効果的に無効化できる透かし除去手法を提案する。
本手法は,既存の再生手法と比較して,視覚的整合性/品質の向上と透かし除去性能の向上を実現している。
論文 参考訳(メタデータ) (2024-10-07T20:04:29Z) - Removing Interference and Recovering Content Imaginatively for Visible
Watermark Removal [63.576748565274706]
本研究では,Removing Interference and Recovering Content Imaginatively (RIRCI)フレームワークについて紹介する。
RIRCIは2段階のアプローチを具現化しており、最初のフェーズは透かし成分の識別と分離に焦点を当て、次のフェーズは背景コンテンツの復元に焦点を当てている。
本モデルでは,半透明透かしの下の固有背景情報を完全に探索できるデュアルパスネットワークを用いる。
論文 参考訳(メタデータ) (2023-12-22T02:19:23Z) - FT-Shield: A Watermark Against Unauthorized Fine-tuning in Text-to-Image Diffusion Models [64.89896692649589]
テキスト・画像拡散モデルの微調整に適した透かしシステムであるFT-Shieldを提案する。
FT-Shieldは新しい透かしの生成と検出戦略を設計することで著作権保護の課題に対処する。
論文 参考訳(メタデータ) (2023-10-03T19:50:08Z) - WMFormer++: Nested Transformer for Visible Watermark Removal via Implict
Joint Learning [68.00975867932331]
既存の透かし除去法は主にタスク固有のデコーダブランチを持つUNetに依存している。
両分野の情報を包括的に統合するために,暗黙的な共同学習パラダイムを導入する。
その結果、既存の最先端手法をはるかに上回る、我々のアプローチの顕著な優位性を示した。
論文 参考訳(メタデータ) (2023-08-20T07:56:34Z) - Tree-Ring Watermarks: Fingerprints for Diffusion Images that are
Invisible and Robust [55.91987293510401]
生成モデルのアウトプットを透かしは、著作権をトレースし、AI生成コンテンツによる潜在的な害を防ぐ重要なテクニックである。
本稿では,拡散モデル出力を頑健にフィンガープリントするTree-Ring Watermarkingという新しい手法を提案する。
私たちの透かしは画像空間に意味的に隠れており、現在デプロイされている透かしよりもはるかに堅牢です。
論文 参考訳(メタデータ) (2023-05-31T17:00:31Z) - Watermarking Images in Self-Supervised Latent Spaces [75.99287942537138]
我々は,自己教師型アプローチに照らして,事前学習した深層ネットワークに基づく透かし手法を再検討する。
我々は、マーク時間におけるデータの増大を利用して、マークとバイナリのメッセージをその潜在空間に埋め込む方法を提案する。
論文 参考訳(メタデータ) (2021-12-17T15:52:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。