論文の概要: SAT-LDM: Provably Generalizable Image Watermarking for Latent Diffusion Models with Self-Augmented Training
- arxiv url: http://arxiv.org/abs/2501.00463v1
- Date: Tue, 31 Dec 2024 14:22:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 17:16:42.970451
- Title: SAT-LDM: Provably Generalizable Image Watermarking for Latent Diffusion Models with Self-Augmented Training
- Title(参考訳): SAT-LDM:自己増強訓練による潜時拡散モデルのための一般化可能な画像透かし
- Authors: Lu Zhang, Liang Zeng,
- Abstract要約: 自己拡張訓練(SAT-LDM)を用いた潜時拡散モデルのための実証可能な一般化可能な画像透かし手法を提案する。
SAT-LDMは,様々なプロンプトにまたがる透かし画像の品質を著しく向上させながら,堅牢な透かしを実現する。
- 参考スコア(独自算出の注目度): 5.843685166920157
- License:
- Abstract: The proliferation of AI-generated images necessitates effective watermarking to protect intellectual property and identify fake content. While existing training-based watermarking methods show promise, they often struggle with generalization across diverse prompts and tend to produce noticeable artifacts. To this end, we introduce a provably generalizable image watermarking method for Latent Diffusion Models with Self-Augmented Training (SAT-LDM), which aligns the training and testing phases by a free generation distribution to bolster the watermarking module's generalization capabilities. We theoretically consolidate our method by proving that the free generation distribution contributes to its tight generalization bound without the need to collect new data. Extensive experimental results show that SAT-LDM achieves robust watermarking while significantly improving the quality of watermarked images across diverse prompts. Furthermore, we conduct experimental analyses to demonstrate the strong generalization abilities of SAT-LDM. We hope our method offers a practical and convenient solution for securing high-fidelity AI-generated content.
- Abstract(参考訳): AI生成画像の拡散は、知的財産を保護し、偽のコンテンツを識別するために効果的な透かしを必要とする。
既存のトレーニングベースの透かし手法は有望であるが、様々なプロンプトをまたいだ一般化に苦慮し、顕著な成果物を生み出す傾向がある。
そこで本研究では,自己拡張トレーニング(SAT-LDM)を用いた潜時拡散モデルに対する画像透かし手法を提案する。
提案手法は,新たなデータ収集を必要とせずに,自由生成分布がその厳密な一般化に寄与することを証明し,理論的に統合する。
その結果,SAT-LDMは強い透かしを実現するとともに,様々なプロンプトで透かし画像の品質を著しく向上させることがわかった。
さらに,SAT-LDMの強い一般化能力を示す実験的検討を行った。
我々の方法では、高忠実度AI生成コンテンツを確保するための実用的で便利なソリューションが提供されることを願っている。
関連論文リスト
- FAMSeC: A Few-shot-sample-based General AI-generated Image Detection Method [26.08924851795572]
本稿では,LoRAをベースとしたForgery Awareness ModuleとSemantic特徴誘導型コントラスト学習戦略に基づく汎用AI生成画像検出手法であるFAMSeCを提案する。
実験によると、FAMSeCは最先端の手法より優れており、トレーニングサンプルの0.56%で分類精度が14.55%向上している。
論文 参考訳(メタデータ) (2024-10-17T02:21:43Z) - Towards Effective User Attribution for Latent Diffusion Models via Watermark-Informed Blending [54.26862913139299]
我々は、ウォーターマークインフォームドブレンディング(TEAWIB)による潜伏拡散モデルに対する効果的なユーザ属性に向けた新しいフレームワークを提案する。
TEAWIBは、ユーザ固有の透かしを生成モデルにシームレスに統合する、ユニークな準備可能な構成アプローチを取り入れている。
TEAWIBの有効性を検証し、知覚的品質と帰属精度で最先端の性能を示す実験を行った。
論文 参考訳(メタデータ) (2024-09-17T07:52:09Z) - Contrasting Deepfakes Diffusion via Contrastive Learning and Global-Local Similarities [88.398085358514]
Contrastive Deepfake Embeddings (CoDE)は、ディープフェイク検出に特化した新しい埋め込み空間である。
CoDEは、グローバルローカルな類似性をさらに強化することで、対照的な学習を通じて訓練される。
論文 参考訳(メタデータ) (2024-07-29T18:00:10Z) - Safe-SD: Safe and Traceable Stable Diffusion with Text Prompt Trigger for Invisible Generative Watermarking [20.320229647850017]
安定拡散(SD)モデルは一般的に画像合成とパーソナライズされた編集の分野で栄えている。
AIが作成したコンテンツを公開プラットフォームに公開することで、法的および倫理的リスクが高まる可能性がある。
本研究では,透かしを認識不能な構造に適応させる,安全かつ高追従性安定拡散フレームワーク(SafeSD)を提案する。
論文 参考訳(メタデータ) (2024-07-18T05:53:17Z) - JIGMARK: A Black-Box Approach for Enhancing Image Watermarks against Diffusion Model Edits [76.25962336540226]
JIGMARKは、コントラスト学習による堅牢性を高める、第一級の透かし技術である。
本評価の結果,JIGMARKは既存の透かし法をはるかに上回っていることがわかった。
論文 参考訳(メタデータ) (2024-06-06T03:31:41Z) - Diffusion-Based Hierarchical Image Steganography [60.69791384893602]
Hierarchical Image Steganographyは、複数のイメージを単一のコンテナに埋め込むセキュリティとキャパシティを高める新しい方法である。
フローモデルの可逆性とともに拡散モデルの堅牢性を利用する。
この革新的な構造は、コンテナイメージを自律的に生成し、複数の画像やテキストを安全かつ効率的に隠蔽することができる。
論文 参考訳(メタデータ) (2024-05-19T11:29:52Z) - AquaLoRA: Toward White-box Protection for Customized Stable Diffusion Models via Watermark LoRA [67.68750063537482]
拡散モデルは高品質な画像の生成において顕著な成功を収めた。
最近の研究は、SDモデルがポストホック法医学のための透かし付きコンテンツを出力できるようにすることを目的としている。
このシナリオにおける最初の実装としてtextttmethod を提案する。
論文 参考訳(メタデータ) (2024-05-18T01:25:47Z) - Mixture of Low-rank Experts for Transferable AI-Generated Image Detection [18.631006488565664]
生成モデルは、最小限の専門知識を持つ写真リアリスティック画像の飛躍的な飛躍を見せ、オンライン情報の真正性に対する懸念を喚起している。
本研究の目的は,多様なソースからの画像を識別できる,汎用的なAI生成画像検出器を開発することである。
事前学習された視覚言語モデルのゼロショット転送性に着想を得て、未知の領域を一般化するために、CLIP-ViTの非自明な視覚世界知識と記述的習熟度を活用することを目指す。
論文 参考訳(メタデータ) (2024-04-07T09:01:50Z) - Intellectual Property Protection of Diffusion Models via the Watermark
Diffusion Process [22.38407658885059]
本稿では,タスク生成時に透かしを印字せずに拡散モデルに新しい透かし手法であるWDMを紹介する。
タスク生成のための標準的な拡散プロセスと並行して、透かしを埋め込むための透かし拡散プロセス(WDP)を同時に学習するモデルを訓練する。
論文 参考訳(メタデータ) (2023-06-06T06:31:07Z) - Watermarking Images in Self-Supervised Latent Spaces [75.99287942537138]
我々は,自己教師型アプローチに照らして,事前学習した深層ネットワークに基づく透かし手法を再検討する。
我々は、マーク時間におけるデータの増大を利用して、マークとバイナリのメッセージをその潜在空間に埋め込む方法を提案する。
論文 参考訳(メタデータ) (2021-12-17T15:52:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。