論文の概要: From Essence to Defense: Adaptive Semantic-aware Watermarking for Embedding-as-a-Service Copyright Protection
- arxiv url: http://arxiv.org/abs/2512.16439v1
- Date: Thu, 18 Dec 2025 11:50:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:32.037252
- Title: From Essence to Defense: Adaptive Semantic-aware Watermarking for Embedding-as-a-Service Copyright Protection
- Title(参考訳): エンベディング・アズ・ア・サービス保護のための適応的セマンティック・アウェア・ウォーターマーキング
- Authors: Hao Li, Yubing Ren, Yanan Cao, Yingjie Li, Fang Fang, Xuebin Wang,
- Abstract要約: Embeddings-as-a-Service (E)は、Webプラットフォームにおける商業パラダイムとして成功している。
以前の研究では、Eは模倣攻撃に弱いことが判明している。
著作権保護のための意味に基づく新しい透かしパラダイムであるSemMarkを提案する。
- 参考スコア(独自算出の注目度): 24.55335024940469
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Benefiting from the superior capabilities of large language models in natural language understanding and generation, Embeddings-as-a-Service (EaaS) has emerged as a successful commercial paradigm on the web platform. However, prior studies have revealed that EaaS is vulnerable to imitation attacks. Existing methods protect the intellectual property of EaaS through watermarking techniques, but they all ignore the most important properties of embedding: semantics, resulting in limited harmlessness and stealthiness. To this end, we propose SemMark, a novel semantic-based watermarking paradigm for EaaS copyright protection. SemMark employs locality-sensitive hashing to partition the semantic space and inject semantic-aware watermarks into specific regions, ensuring that the watermark signals remain imperceptible and diverse. In addition, we introduce the adaptive watermark weight mechanism based on the local outlier factor to preserve the original embedding distribution. Furthermore, we propose Detect-Sampling and Dimensionality-Reduction attacks and construct four scenarios to evaluate the watermarking method. Extensive experiments are conducted on four popular NLP datasets, and SemMark achieves superior verifiability, diversity, stealthiness, and harmlessness.
- Abstract(参考訳): 自然言語の理解と生成における大規模言語モデルの優れた能力から、Embings-as-a-Service(EaaS)は、Webプラットフォームにおける商業的パラダイムとして成功している。
しかし、以前の研究では、EaaSは模倣攻撃に弱いことが判明している。
既存の方法は透かし技術によってEaaSの知的財産を保護するが、それらはすべて埋め込みの最も重要な性質を無視している。
この目的のために、我々は、EaaS著作権保護のための新しい意味に基づく透かしパラダイムであるSemMarkを提案する。
SemMarkは、セマンティック空間を分割し、セマンティックアウェアな透かしを特定の領域に注入するために、局所性に敏感なハッシュを使用しており、透かし信号が認識不能で多様であることを保証する。
また,元の埋め込み分布を保存するために,局所的な外れ係数に基づく適応的な透かし重み機構を導入する。
さらに,検出サンプリングと次元縮小攻撃を提案し,透かし手法を評価するために4つのシナリオを構築した。
一般的な4つのNLPデータセットで大規模な実験が行われ、SemMarkは優れた妥当性、多様性、ステルスネス、無害性を達成している。
関連論文リスト
- RegionMarker: A Region-Triggered Semantic Watermarking Framework for Embedding-as-a-Service Copyright Protection [17.698200495214795]
RegionMarkerは低次元空間内のトリガ領域を定義し、これらの領域に関連するテキスト埋め込みに透かしを注入する。
トリガ領域全体に透かしを埋め込んでテキストを埋め込むことで、RereaMarkerはパラフレージングとディメンションと摂動攻撃の両方に耐性がある。
論文 参考訳(メタデータ) (2025-11-17T13:04:36Z) - StableGuard: Towards Unified Copyright Protection and Tamper Localization in Latent Diffusion Models [55.05404953041403]
拡散生成プロセスにバイナリ透かしをシームレスに統合する新しいフレームワークを提案する。
画像の忠実さ、透かしの検証、ローカライゼーションの改ざんにおいて、StableGuardは一貫して最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-09-22T16:35:19Z) - Your Semantic-Independent Watermark is Fragile: A Semantic Perturbation Attack against EaaS Watermark [5.2431999629987]
様々な研究が、Eサービスの著作権を保護するためのバックドアベースの透かし方式を提案している。
本稿では,従来の透かし方式が意味非依存の特徴を持つことを示すとともに,セマンティック摂動攻撃(SPA)を提案する。
我々の理論的および実験的分析は、この意味に依存しない性質が、現在の透かしスキームを適応攻撃に脆弱にし、セマンティック摂動テストを利用して透かし検証を回避していることを示している。
論文 参考訳(メタデータ) (2024-11-14T11:06:34Z) - Robust and Minimally Invasive Watermarking for EaaS [50.08021440235581]
組み込み・アズ・ア・サービス(Eding)はAIアプリケーションにおいて重要な役割を担っている。
編集はモデル抽出攻撃に対して脆弱であり、著作権保護の必要性を強調している。
そこで我々は,Edingの著作権保護を堅牢にするための新しい埋め込み専用透かし (ESpeW) 機構を提案する。
論文 参考訳(メタデータ) (2024-10-23T04:34:49Z) - A Resilient and Accessible Distribution-Preserving Watermark for Large Language Models [65.40460716619772]
本研究は,textbfDistribution-textbf Preserving (DiP)ウォーターマークの重要性に焦点をあてる。
現在の戦略とは対照的に,提案したDiPmarkは透かし中に元のトークン分布を同時に保存する。
言語モデルAPIにアクセスせずに検出可能で(アクセス可能)、トークンの適度な変更に対して確実に堅牢である。
論文 参考訳(メタデータ) (2023-10-11T17:57:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。