論文の概要: EmbTracker: Traceable Black-box Watermarking for Federated Language Models
- arxiv url: http://arxiv.org/abs/2603.12089v1
- Date: Thu, 12 Mar 2026 15:57:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.197736
- Title: EmbTracker: Traceable Black-box Watermarking for Federated Language Models
- Title(参考訳): EmbTracker: フェデレーション言語モデルのためのトレース可能なブラックボックス透かし
- Authors: Haodong Zhao, Jinming Hu, Yijie Bai, Tian Dong, Wei Du, Zhuosheng Zhang, Yanjiao Chen, Haojin Zhu, Gongshen Liu,
- Abstract要約: フェデレート言語モデル(FedLM)は、生データを共有せずに協調的な学習を可能にするが、重大な脆弱性を導入する。
我々は,サーバサイドでトレーサブルなブラックボックス透かしフレームワークであるEmbTrackerを提案する。
- 参考スコア(独自算出の注目度): 41.35196057964303
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Federated Language Model (FedLM) allows a collaborative learning without sharing raw data, yet it introduces a critical vulnerability, as every untrustworthy client may leak the received functional model instance. Current watermarking schemes for FedLM often require white-box access and client-side cooperation, providing only group-level proof of ownership rather than individual traceability. We propose EmbTracker, a server-side, traceable black-box watermarking framework specifically designed for FedLMs. EmbTracker achieves black-box verifiability by embedding a backdoor-based watermark detectable through simple API queries. Client-level traceability is realized by injecting unique identity-specific watermarks into the model distributed to each client. In this way, a leaked model can be attributed to a specific culprit, ensuring robustness even against non-cooperative participants. Extensive experiments on various language and vision-language models demonstrate that EmbTracker achieves robust traceability with verification rates near 100\%, high resilience against removal attacks (fine-tuning, pruning, quantization), and negligible impact on primary task performance (typically within 1-2\%).
- Abstract(参考訳): フェデレート言語モデル(FedLM)は、生データを共有せずに協調的な学習を可能にするが、信頼できないすべてのクライアントが受信した機能モデルインスタンスをリークする可能性があるため、重大な脆弱性をもたらす。
現在のFedLMの透かし方式は、ホワイトボックスアクセスとクライアント側の協力を必要とし、個々のトレーサビリティよりもグループレベルのオーナシップの証明を提供する。
我々は,サーバサイドでトレーサブルなブラックボックス透かしフレームワークであるEmbTrackerを提案する。
EmbTrackerは、シンプルなAPIクエリで検出可能なバックドアベースの透かしを埋め込むことで、ブラックボックスの検証性を実現する。
クライアントレベルのトレーサビリティは、各クライアントに配布されるモデルにユニークなID固有の透かしを注入することで実現されます。
このようにして、流出したモデルは特定の犯人に帰属し、非協力的参加者に対しても堅牢性を確保することができる。
様々な言語および視覚言語モデルに対する大規模な実験により、EmbTrackerは100倍近い検証率で堅牢なトレーサビリティ、除去攻撃に対する高いレジリエンス(微細チューニング、プルーニング、量子化)、およびプライマリタスクのパフォーマンス(典型的には1~2倍以内)で無視できない影響を達成している。
関連論文リスト
- BlackCATT: Black-box Collusion Aware Traitor Tracing in Federated Learning [51.251962154210474]
フェデレートラーニング: BlackCATT におけるブラックボックストレーサトレースのための一般的なコラシオン耐性埋め込み法を提案する。
実験により,異なるアーキテクチャやデータセットにまたがる提案手法の有効性が確認された。
メインタスクの更新不整合に苦しむモデルに対して,提案したBlackCATT+FRには機能正規化が組み込まれている。
論文 参考訳(メタデータ) (2026-02-12T16:26:57Z) - Who Leaked the Model? Tracking IP Infringers in Accountable Federated Learning [51.26221422507554]
Federated Learning (FL) は、大規模で分散したクライアントからのデータと計算リソースを調整する効果的な協調学習フレームワークである。
このようなコラボレーションは、個々のユーザではなく、パーティー全体によって保護され、共有されるべきモデルパラメータによって表現される非自明な知的財産(IP)をもたらす。
このようなIPリークをブロックするためには、IPを共有モデルで識別し、最初にリークした匿名の侵害者を特定することが不可欠である。
本稿では,説明責任FLの要件を満たすために,Dudeable Unique Watermarking (DUW)を提案する。
論文 参考訳(メタデータ) (2023-12-06T00:47:55Z) - FedGT: Identification of Malicious Clients in Federated Learning with Secure Aggregation [69.75513501757628]
FedGTは、フェデレーション学習における悪意のあるクライアントを安全なアグリゲーションで識別するための新しいフレームワークである。
我々はPillutlaらによって最近提案された幾何的中央値に基づいて,FedGTがプライベートロバストアグリゲーションアプローチを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2023-05-09T14:54:59Z) - FedTracker: Furnishing Ownership Verification and Traceability for
Federated Learning Model [33.03362469978148]
Federated Learning(FL)は、複数のクライアントがローカルデータを共有せずにグローバルモデルを共同でトレーニングできる分散機械学習パラダイムである。
これにより、悪意のあるクライアントによる不正なモデル配布や再販のリスクが生じ、FLグループの知的財産権が損なわれる。
オーナシップ検証とトレーサビリティの両方を提供する最初のFLモデル保護フレームワークであるFedTrackerを紹介します。
論文 参考訳(メタデータ) (2022-11-14T07:40:35Z) - CrowdGuard: Federated Backdoor Detection in Federated Learning [39.58317527488534]
本稿では,フェデレートラーニングにおけるバックドア攻撃を効果的に軽減する新しい防御機構であるCrowdGuardを提案する。
CrowdGuardでは、サーバロケーションのスタック化されたクラスタリングスキームを使用して、クライアントからのフィードバックに対するレジリエンスを高めている。
評価結果は、CrowdGuardがさまざまなシナリオで100%正の正の正の正の負の負の負の値を達成することを示す。
論文 参考訳(メタデータ) (2022-10-14T11:27:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。