論文の概要: VertMark: A Unified Training-Free Robust Watermarking Framework for Vertical Domain Pre-trained Language Models
- arxiv url: http://arxiv.org/abs/2605.02557v1
- Date: Mon, 04 May 2026 13:08:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.292685
- Title: VertMark: A Unified Training-Free Robust Watermarking Framework for Vertical Domain Pre-trained Language Models
- Title(参考訳): VertMark: 垂直ドメイン事前訓練言語モデルのための統一トレーニング自由ロバストな透かしフレームワーク
- Authors: Cong Kong, Xin Cheng, Zhaoxia Yin, Shuai Li, Jie Zhang, Weiming Zhang,
- Abstract要約: VertMarkは、複数の垂直ドメインVPLMにわたる著作権検証のためのトレーニングフリーで堅牢な透かしフレームワークである。
低周波トリガートークンと高周波ドメイン関連ワードの間に隠された意味的等価性を確立することで、所有権を符号化した透かしを埋め込む。
様々な攻撃に対して強い堅牢性を示し、その実用的価値を強調し、VPLMの著作権保護を強く保護している。
- 参考スコア(独自算出の注目度): 29.069328273336577
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the application of vertical domain pre-trained language models (VPLMs) in specialized fields such as medical, finance, and law, model parameters and inference capabilities have become important digital assets. Achieving traceable copyright verification for VPLMs has become an urgent challenge. Existing copyright verification methods primarily rely on embedding backdoor watermarks into models. However, most of these methods require additional training, suffer from inefficient watermark embedding, and lack scalable designs for multiple vertical domains. To address these limitations, we propose VertMark, the first unified training-free and robust watermarking framework for copyright verification across multiple vertical domain VPLMs. The framework embeds ownership-encoded watermarks by establishing a hidden semantic equivalence between low-frequency trigger tokens and high-frequency domain-relevant words via a training-free parameter replacement strategy. Experiments demonstrate that VertMark can achieve efficient watermark embedding and reliable watermark verification for both text understanding and text generation downstream tasks in the medical, financial, and legal domains, with negligible impact on model performance. Moreover, VertMark exhibits strong robustness against various attacks (e.g., pruning and quantization), highlighting its practical value and providing strong protection for the copyright security of VPLMs.
- Abstract(参考訳): 医学、金融、法学などの専門分野における垂直領域事前学習言語モデル(VPLM)の適用により、モデルパラメータと推論能力は重要なデジタル資産となった。
VPLMのトレーサブルな著作権認証を取得することは、緊急の課題となっている。
既存の著作権検証方法は、主にモデルにバックドアの透かしを埋め込むことに依存している。
しかし、これらの手法の多くは追加の訓練を必要とし、非効率な透かし埋め込みに悩まされ、複数の垂直領域に対するスケーラブルな設計が欠如している。
この制限に対処するため、複数の垂直ドメインVPLM間で著作権検証を行うための、最初の統合トレーニングフリーで堅牢な透かしフレームワークであるVertMarkを提案する。
このフレームワークは、トレーニングフリーパラメータ置換戦略により、低周波トリガートークンと高周波ドメイン関連語とのセマンティックな等価性を確立することによって、オーナシップエンコードされた透かしを埋め込む。
実験により、VertMarkは、医療、財務、法的な領域におけるテキスト理解とテキスト生成の両方の下流タスクに対して、効果的な透かし埋め込みと信頼性のある透かし検証を、モデルの性能に無視的に影響を及ぼすことを示した。
さらにVertMarkは、様々な攻撃(例えば、プルーニングと量子化)に対して強力な堅牢性を示し、その実用的価値を強調し、VPLMの著作権保護を強く保護している。
関連論文リスト
- WMVLM: Evaluating Diffusion Model Image Watermarking via Vision-Language Models [79.32764976020435]
拡散モデルから生成された画像を保護するためには,デジタル透かしが不可欠である。
従来の透かし評価手法では,残余と意味の両方の透かしの統一的な枠組みが欠如していた。
我々は,視覚言語モデルを用いた拡散モデル画像透かしのための最初の統一的・解釈可能な評価フレームワークLMを提案する。
論文 参考訳(メタデータ) (2026-01-29T12:14:32Z) - From Essence to Defense: Adaptive Semantic-aware Watermarking for Embedding-as-a-Service Copyright Protection [24.55335024940469]
Embeddings-as-a-Service (E)は、Webプラットフォームにおける商業パラダイムとして成功している。
以前の研究では、Eは模倣攻撃に弱いことが判明している。
著作権保護のための意味に基づく新しい透かしパラダイムであるSemMarkを提案する。
論文 参考訳(メタデータ) (2025-12-18T11:50:38Z) - SEAL: Subspace-Anchored Watermarks for LLM Ownership [12.022506016268112]
大規模言語モデルのためのサブスペース型透かしフレームワークSEALを提案する。
SEALはモデルの潜在表現空間に直接マルチビットシグネチャを埋め込んで、ホワイトボックスとブラックボックスの検証シナリオをサポートする。
我々は、SEALの優れた効率、忠実性、効率、堅牢性を示すために、複数のベンチマークデータセットと6つの著名なLCMに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2025-11-14T14:44:11Z) - Character-Level Perturbations Disrupt LLM Watermarks [64.60090923837701]
我々は,Large Language Model (LLM)ウォーターマーキングのためのシステムモデルを定式化する。
我々は、透かし検出器への限られたアクセスに制約された2つの現実的な脅威モデルの特徴付けを行う。
我々は,最も制限的な脅威モデルの下で,キャラクタレベルの摂動が透かし除去に著しく有効であることを実証した。
現実的な制約下での透かし除去における文字レベルの摂動の優位性と遺伝的アルゴリズム(GA)の有効性を実験的に検証した。
論文 参考訳(メタデータ) (2025-09-11T02:50:07Z) - Hot-Swap MarkBoard: An Efficient Black-box Watermarking Approach for Large-scale Model Distribution [14.60627694687767]
本稿では,効率的な透かし手法であるHot-Swap MarkBoardを提案する。
ユーザ固有の$n$-bitバイナリシグネチャを、独立して複数の透かしを埋め込むことでエンコードする。
この方法はブラックボックス検証をサポートし、様々なモデルアーキテクチャと互換性がある。
論文 参考訳(メタデータ) (2025-07-28T09:14:21Z) - EmMark: Robust Watermarks for IP Protection of Embedded Quantized Large
Language Models [21.28690053570814]
本稿では,リソース制約されたエッジデバイス上に展開された組み込み大言語モデルの知的財産権(IP)を保護するための新しい透かしフレームワークであるEmMarkを紹介する。
悪意のあるエンドユーザーによって引き起こされるIP盗難のリスクに対処するため、EmMarkは、所有者がウォーターマークされたモデルの重みを問い合わせ、挿入されたシグネチャをマッチングすることで、所有権を認証することを可能にする。
論文 参考訳(メタデータ) (2024-02-27T23:30:17Z) - ClearMark: Intuitive and Robust Model Watermarking via Transposed Model
Training [50.77001916246691]
本稿では,人間の直感的な評価を目的とした最初のDNN透かし手法であるClearMarkを紹介する。
ClearMarkは目に見える透かしを埋め込んで、厳格な値閾値なしで人間の意思決定を可能にする。
8,544ビットの透かし容量は、現存する最強の作品に匹敵する。
論文 参考訳(メタデータ) (2023-10-25T08:16:55Z) - A Resilient and Accessible Distribution-Preserving Watermark for Large Language Models [65.40460716619772]
本研究は,textbfDistribution-textbf Preserving (DiP)ウォーターマークの重要性に焦点をあてる。
現在の戦略とは対照的に,提案したDiPmarkは透かし中に元のトークン分布を同時に保存する。
言語モデルAPIにアクセスせずに検出可能で(アクセス可能)、トークンの適度な変更に対して確実に堅牢である。
論文 参考訳(メタデータ) (2023-10-11T17:57:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。