論文の概要: Green-Red Watermarking for Recommender Systems
- arxiv url: http://arxiv.org/abs/2604.23568v1
- Date: Sun, 26 Apr 2026 07:16:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.434911
- Title: Green-Red Watermarking for Recommender Systems
- Title(参考訳): レコメンダシステムのグリーンレッド透かし
- Authors: Lei Zhou, Min Gao, Zongwei Wang, Yibing Bai, Wentao Li,
- Abstract要約: GREWは、レコメンダシステムのための新しいグリーン・リード・ウォーターマーキングフレームワークである。
シークレットキーを使用してアイテムスペースを"グリーン"アイテムに分割し、ソフトプロモーションと"レッド"アイテムをアンカーとして使用することで、パラダイムを脆弱な記憶から、秘密のキー制御された出力バイアスに移行する。
GREWは、既存のベースラインと比較して、強力なオーナシップの検証と抽出攻撃に対する堅牢性を実現している。
- 参考スコア(独自算出の注目度): 8.997062424915711
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The widespread open-sourcing of advanced recommendation algorithms and the rising threat of model extraction attacks have made safeguarding the intellectual property of recommender systems an imperative task. While watermarking serves as a potent defense, existing methods primarily rely on forcing models to memorize pre-defined interaction patterns. Such memorization-based approaches often require excessive synthetic data injection and are vulnerable to removal attacks due to their detectable statistical deviations from natural user behavior. To address these limitations, we propose GREW, a novel Green-REd Watermarking framework for recommender systems. GREW leverages a secret key to partition the item space into "green" items for soft promotion and "red" items as anchors, thereby shifting the paradigm from fragile memorization to a stealthy, key-controlled output bias. By integrating watermark signals directly into the intrinsic ranking process, GREW employs three recommendation-tailored modules: (1) Semantic-Consistent Hashing, which utilizes the secret key to cluster green items for performance-aware stealthiness; (2) Decision-Aligned Masking, which confines signal injection to the competitive item subset to preserve ranking logic; and (3) Confidence-Aware Scaling, which dynamically modulates injection intensity based on model uncertainty. Ownership verification is performed via statistical hypothesis testing on aggregated black-box outputs, enabled by the keyed re-partitioning of the item space. Experiments on multiple base models demonstrate that GREW achieves strong ownership verification and robustness against extraction attacks compared to existing baselines while requiring no data injection. Our code is available at https://github.com/Loche2/GREW.
- Abstract(参考訳): 高度なレコメンデーションアルゴリズムの幅広いオープンソース化と、モデル抽出攻撃の脅威の高まりにより、レコメンデーターシステムの知的財産権の保護が必須課題となっている。
ウォーターマーキングは強力な防御手段として機能するが、既存の手法は主に事前に定義された相互作用パターンを記憶させるモデルに頼っている。
このような記憶に基づくアプローチは、しばしば過剰な合成データ注入を必要とし、自然のユーザ行動から検出可能な統計的逸脱による攻撃に対して脆弱である。
これらの制約に対処するため,推奨システムのための新しいグリーンリード透かしフレームワークであるGREWを提案する。
GREWは秘密鍵を利用してアイテム空間を「グリーン」のアイテムに分割し、ソフトプロモーションと「レッド」のアイテムをアンカーとして扱う。
1)グリーンアイテムをクラスタリングするための秘密鍵を利用するセマンティック・一貫性・ハッシュ,(2)競合するアイテムサブセットに信号注入を限定してランキングロジックを保存する決定的マスキング,(3)モデルの不確実性に基づいてインジェクション強度を動的に変調する信頼性・アウェアスケーリング,である。
オーナシップ検証は、アイテム空間のキー付き再分割によって可能となる集約されたブラックボックス出力に対する統計的仮説テストによって行われる。
複数のベースモデルに対する実験により、GREWはデータ注入を必要とせず、既存のベースラインと比較して、強力なオーナシップ検証と抽出攻撃に対する堅牢性を達成することが示された。
私たちのコードはhttps://github.com/Loche2/GREW.comで公開されています。
関連論文リスト
- A Cognitive Distribution and Behavior-Consistent Framework for Black-Box Attacks on Recommender Systems [31.500626025054316]
シーケンシャルレコメンダシステムは 抽出と敵の操作に弱い
本稿では、これらの制限を克服するための二重強化攻撃フレームワークを提案する。
本手法は,攻撃成功率と回避率の両方において既存手法を著しく上回っている。
論文 参考訳(メタデータ) (2026-02-11T08:26:07Z) - On Protecting Agentic Systems' Intellectual Property via Watermarking [17.334130453604313]
AgentWMはエージェントモデル用に設計された最初の透かしフレームワークである。
AgentWMは、機能的に同一のツール実行パスの分布を微妙にバイアスすることで、アクションシーケンスのセマンティックな等価性を利用して、透かしを注入する。
我々は,エージェントIPを適応的敵に対して効果的に保護できることを確認した。
論文 参考訳(メタデータ) (2026-02-09T09:02:15Z) - Protecting Deep Neural Network Intellectual Property with Chaos-Based White-Box Watermarking [2.667401221288548]
ディープニューラルネットワーク(DNN)の急速な普及により、知的財産権(IP)保護とモデル誤用に関する懸念が高まっている。
DNNの内部パラメータにオーナシップ情報を埋め込む,効率的でレジリエントなホワイトボックス透かしフレームワークを提案する。
提案手法は,ホワイトボックス設定にモデルオーナシップを組み込んで検証するための,フレキシブルでスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2025-12-18T15:26:50Z) - Character-Level Perturbations Disrupt LLM Watermarks [64.60090923837701]
我々は,Large Language Model (LLM)ウォーターマーキングのためのシステムモデルを定式化する。
我々は、透かし検出器への限られたアクセスに制約された2つの現実的な脅威モデルの特徴付けを行う。
我々は,最も制限的な脅威モデルの下で,キャラクタレベルの摂動が透かし除去に著しく有効であることを実証した。
現実的な制約下での透かし除去における文字レベルの摂動の優位性と遺伝的アルゴリズム(GA)の有効性を実験的に検証した。
論文 参考訳(メタデータ) (2025-09-11T02:50:07Z) - Towards Copyright Protection for Knowledge Bases of Retrieval-augmented Language Models via Reasoning [58.57194301645823]
大規模言語モデル(LLM)は、現実のパーソナライズされたアプリケーションにますます統合されている。
RAGで使用される知識基盤の貴重かつしばしばプロプライエタリな性質は、敵による不正使用のリスクをもたらす。
これらの知識基盤を保護するための透かし技術として一般化できる既存の方法は、一般的に毒やバックドア攻撃を含む。
我々は、無害な」知識基盤の著作権保護の名称を提案する。
論文 参考訳(メタデータ) (2025-02-10T09:15:56Z) - Watermarking Recommender Systems [52.207721219147814]
本稿では,レコメンダシステムに特化した新しい手法であるAutoregressive Out-of-Distribution Watermarking (AOW)を紹介する。
提案手法では,初期項目の選択とオラクルモデルによるクエリを行い,その後に予測スコアの小さい項目を選択する。
透かしの有効性を評価するため、このモデルでは、切り捨てられた透かしシーケンスが与えられた後続の項目を予測することを課題とする。
論文 参考訳(メタデータ) (2024-07-17T06:51:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。