論文の概要: Breaking Semantic-Aware Watermarks via LLM-Guided Coherence-Preserving Semantic Injection
- arxiv url: http://arxiv.org/abs/2602.21593v1
- Date: Wed, 25 Feb 2026 05:38:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.715547
- Title: Breaking Semantic-Aware Watermarks via LLM-Guided Coherence-Preserving Semantic Injection
- Title(参考訳): LLM-Guided Coherence-Preserving Semantic Injectionによるセマンティック・アウェアの透かし
- Authors: Zheng Gao, Xiaoyu Li, Zhicheng Bao, Xiaoyan Feng, Jiaojiao Jiang,
- Abstract要約: 従来のノイズ層ベースの透かしは、組込み信号を回復できる逆攻撃に弱いままである。
近年のコンテンツ対応セマンティック透かし方式は、透かし信号をハイレベルな画像意味論に結び付け、グローバルな一貫性を損なうような局所的な編集を制限している。
埋め込み空間類似性制約下でのLLM誘導のセマンティック操作を利用するコヒーレンス保存セマンティックインジェクション(CSI)アタックを導入する。
- 参考スコア(独自算出の注目度): 6.443002210168185
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative images have proliferated on Web platforms in social media and online copyright distribution scenarios, and semantic watermarking has increasingly been integrated into diffusion models to support reliable provenance tracking and forgery prevention for web content. Traditional noise-layer-based watermarking, however, remains vulnerable to inversion attacks that can recover embedded signals. To mitigate this, recent content-aware semantic watermarking schemes bind watermark signals to high-level image semantics, constraining local edits that would otherwise disrupt global coherence. Yet, large language models (LLMs) possess structured reasoning capabilities that enable targeted exploration of semantic spaces, allowing locally fine-grained but globally coherent semantic alterations that invalidate such bindings. To expose this overlooked vulnerability, we introduce a Coherence-Preserving Semantic Injection (CSI) attack that leverages LLM-guided semantic manipulation under embedding-space similarity constraints. This alignment enforces visual-semantic consistency while selectively perturbing watermark-relevant semantics, ultimately inducing detector misclassification. Extensive empirical results show that CSI consistently outperforms prevailing attack baselines against content-aware semantic watermarking, revealing a fundamental security weakness of current semantic watermark designs when confronted with LLM-driven semantic perturbations.
- Abstract(参考訳): ソーシャルメディアやオンライン著作権配信のシナリオにおいて、生成画像はWebプラットフォーム上で増大し、セマンティックな透かしは、信頼性の高いプロファイランス追跡とWebコンテンツの偽造防止をサポートするために拡散モデルに統合されつつある。
しかし、従来のノイズ層ベースの透かしは、組込み信号の復元が可能な逆攻撃に弱いままである。
これを軽減するため、近年のコンテンツ対応セマンティック透かし方式は、透かし信号をハイレベルな画像意味論に結合し、グローバルな一貫性を損なうような局所的な編集を制限している。
しかし、大きな言語モデル(LLM)は、セマンティック空間をターゲットとした探索を可能にする構造的推論機能を持ち、局所的にきめ細やかだが、そのようなバインディングを無効にするグローバルなセマンティックな変更を可能にする。
この脆弱性を明らかにするために,LLM誘導のセマンティック操作を組込み空間類似性制約下で活用するCoherence-Preserving Semantic Injection (CSI)攻撃を導入する。
このアライメントは、透かし関連セマンティクスを選択的に摂動しながら視覚的セマンティクスを強制し、最終的に検出器の誤分類を引き起こす。
大規模な実証実験の結果、CSIはコンテンツ認識型セマンティック透かしに対する攻撃ベースラインを一貫して上回り、LCMによるセマンティック摂動に直面した場合、現在のセマンティック透かし設計の基本的なセキュリティ上の弱点を明らかにする。
関連論文リスト
- SemBind: Binding Diffusion Watermarks to Semantics Against Black-Box Forgery Attacks [74.76909939060833]
ブラックボックスの偽造攻撃は、証明と信頼に非常に大きなリスクをもたらす。
ブラックボックス偽造に抵抗する潜伏型透かしのフレームワークであるSemBindを提案する。
我々は,SemBindが有効である抗偽造の変異が,ブラックボックス偽造の誤認を著しく減少させることを示した。
論文 参考訳(メタデータ) (2026-01-28T07:02:40Z) - From Essence to Defense: Adaptive Semantic-aware Watermarking for Embedding-as-a-Service Copyright Protection [24.55335024940469]
Embeddings-as-a-Service (E)は、Webプラットフォームにおける商業パラダイムとして成功している。
以前の研究では、Eは模倣攻撃に弱いことが判明している。
著作権保護のための意味に基づく新しい透かしパラダイムであるSemMarkを提案する。
論文 参考訳(メタデータ) (2025-12-18T11:50:38Z) - StableGuard: Towards Unified Copyright Protection and Tamper Localization in Latent Diffusion Models [55.05404953041403]
拡散生成プロセスにバイナリ透かしをシームレスに統合する新しいフレームワークを提案する。
画像の忠実さ、透かしの検証、ローカライゼーションの改ざんにおいて、StableGuardは一貫して最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-09-22T16:35:19Z) - Defending LLM Watermarking Against Spoofing Attacks with Contrastive Representation Learning [34.76886510334969]
ピギーバック攻撃は、元々の透かしを保ったままのヘイトスピーチに変換する透かしテキストの意味を悪意的に変更することができる。
そこで本稿では,元来の意味を保ちつつ,与えられた目標テキストに透かしを埋め込む意味認識型透かしアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-09T04:38:17Z) - MarkPlugger: Generalizable Watermark Framework for Latent Diffusion Models without Retraining [48.41130825143742]
AI生成コンテンツ(AIGC)の急速な発展期には、潜伏拡散モデル(LDM)の迅速な反復と修正により、ウォーターマークモデルによる再トレーニングがコストがかかる。
我々は,LDMの再学習を伴わない汎用的なプラグイン・アンド・プレイ・ウォーターマーク・フレームワークであるMarkPluggerを提案する。
実験結果から,本手法は画像品質と透かし回収率を効果的に調和させることがわかった。
論文 参考訳(メタデータ) (2024-04-08T15:29:46Z) - WatME: Towards Lossless Watermarking Through Lexical Redundancy [58.61972059246715]
本研究では,認知科学レンズを用いた大規模言語モデル(LLM)の異なる機能に対する透かしの効果を評価する。
透かしをシームレスに統合するための相互排他型透かし(WatME)を導入する。
論文 参考訳(メタデータ) (2023-11-16T11:58:31Z) - Exploring Structure Consistency for Deep Model Watermarking [122.38456787761497]
Deep Neural Network(DNN)の知的財産権(IP)は、代理モデルアタックによって簡単に盗まれる。
本稿では,新しい構造整合モデルウォーターマーキングアルゴリズムを設計した新しい透かし手法,すなわち構造整合性'を提案する。
論文 参考訳(メタデータ) (2021-08-05T04:27:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。