Fugu-MT 論文翻訳(概要): EmbTracker: Traceable Black-box Watermarking for Federated Language Models

論文の概要: EmbTracker: Traceable Black-box Watermarking for Federated Language Models

arxiv url: http://arxiv.org/abs/2603.12089v1
Date: Thu, 12 Mar 2026 15:57:32 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-13 14:46:26.197736
Title: EmbTracker: Traceable Black-box Watermarking for Federated Language Models
Title（参考訳）: EmbTracker: フェデレーション言語モデルのためのトレース可能なブラックボックス透かし
Authors: Haodong Zhao, Jinming Hu, Yijie Bai, Tian Dong, Wei Du, Zhuosheng Zhang, Yanjiao Chen, Haojin Zhu, Gongshen Liu,
Abstract要約: フェデレート言語モデル(FedLM)は、生データを共有せずに協調的な学習を可能にするが、重大な脆弱性を導入する。我々は,サーバサイドでトレーサブルなブラックボックス透かしフレームワークであるEmbTrackerを提案する。
参考スコア（独自算出の注目度）: 41.35196057964303
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Federated Language Model (FedLM) allows a collaborative learning without sharing raw data, yet it introduces a critical vulnerability, as every untrustworthy client may leak the received functional model instance. Current watermarking schemes for FedLM often require white-box access and client-side cooperation, providing only group-level proof of ownership rather than individual traceability. We propose EmbTracker, a server-side, traceable black-box watermarking framework specifically designed for FedLMs. EmbTracker achieves black-box verifiability by embedding a backdoor-based watermark detectable through simple API queries. Client-level traceability is realized by injecting unique identity-specific watermarks into the model distributed to each client. In this way, a leaked model can be attributed to a specific culprit, ensuring robustness even against non-cooperative participants. Extensive experiments on various language and vision-language models demonstrate that EmbTracker achieves robust traceability with verification rates near 100\%, high resilience against removal attacks (fine-tuning, pruning, quantization), and negligible impact on primary task performance (typically within 1-2\%).
Abstract（参考訳）: フェデレート言語モデル(FedLM)は、生データを共有せずに協調的な学習を可能にするが、信頼できないすべてのクライアントが受信した機能モデルインスタンスをリークする可能性があるため、重大な脆弱性をもたらす。現在のFedLMの透かし方式は、ホワイトボックスアクセスとクライアント側の協力を必要とし、個々のトレーサビリティよりもグループレベルのオーナシップの証明を提供する。我々は,サーバサイドでトレーサブルなブラックボックス透かしフレームワークであるEmbTrackerを提案する。 EmbTrackerは、シンプルなAPIクエリで検出可能なバックドアベースの透かしを埋め込むことで、ブラックボックスの検証性を実現する。クライアントレベルのトレーサビリティは、各クライアントに配布されるモデルにユニークなID固有の透かしを注入することで実現されます。このようにして、流出したモデルは特定の犯人に帰属し、非協力的参加者に対しても堅牢性を確保することができる。様々な言語および視覚言語モデルに対する大規模な実験により、EmbTrackerは100倍近い検証率で堅牢なトレーサビリティ、除去攻撃に対する高いレジリエンス(微細チューニング、プルーニング、量子化)、およびプライマリタスクのパフォーマンス(典型的には1～2倍以内)で無視できない影響を達成している。

論文の概要: EmbTracker: Traceable Black-box Watermarking for Federated Language Models

関連論文リスト