Fugu-MT 論文翻訳(概要): WET: Overcoming Paraphrasing Vulnerabilities in Embeddings-as-a-Service with Linear Transformation Watermarks

論文の概要: WET: Overcoming Paraphrasing Vulnerabilities in Embeddings-as-a-Service with Linear Transformation Watermarks

arxiv url: http://arxiv.org/abs/2409.04459v1
Date: Thu, 29 Aug 2024 18:59:56 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-15 05:31:27.779700
Title: WET: Overcoming Paraphrasing Vulnerabilities in Embeddings-as-a-Service with Linear Transformation Watermarks
Title（参考訳）: WET: 線形変換透かしを用いた埋め込み・アズ・ア・サービスにおけるパラフレーズ脆弱性の克服
Authors: Anudeex Shetty, Qiongkai Xu, Jey Han Lau,
Abstract要約: 攻撃者がモデルをクローンすると,既存のE透かしをパラフレーズで除去できることを示す。埋め込みを線形に変換する新しい透かし手法を提案する。
参考スコア（独自算出の注目度）: 28.992750031041744
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Embeddings-as-a-Service (EaaS) is a service offered by large language model (LLM) developers to supply embeddings generated by LLMs. Previous research suggests that EaaS is prone to imitation attacks -- attacks that clone the underlying EaaS model by training another model on the queried embeddings. As a result, EaaS watermarks are introduced to protect the intellectual property of EaaS providers. In this paper, we first show that existing EaaS watermarks can be removed by paraphrasing when attackers clone the model. Subsequently, we propose a novel watermarking technique that involves linearly transforming the embeddings, and show that it is empirically and theoretically robust against paraphrasing.
Abstract（参考訳）: Embeddings-as-a-Service(EaaS)は、LLMによって生成された埋め込みを提供するために、大規模言語モデル(LLM)開発者が提供するサービスである。従来の研究は、EaaSが模倣攻撃の傾向にあることを示唆している -- クエリされた埋め込みに関する別のモデルをトレーニングすることで、基盤となるEaaSモデルをクローンする攻撃だ。その結果、EaaSプロバイダの知的財産を保護するためにEaaSの透かしが導入される。本稿では,攻撃者がモデルをクローンした場合に,既存のEaaS透かしをパラフレーズで除去できることを最初に示す。次に, 埋め込みを線形に変形させる新しい透かし手法を提案し, パラフレージングに対して経験的かつ理論的に堅牢であることを示す。

関連論文リスト

From Essence to Defense: Adaptive Semantic-aware Watermarking for Embedding-as-a-Service Copyright Protection [24.55335024940469]
Embeddings-as-a-Service (E)は、Webプラットフォームにおける商業パラダイムとして成功している。以前の研究では、Eは模倣攻撃に弱いことが判明している。著作権保護のための意味に基づく新しい透かしパラダイムであるSemMarkを提案する。
論文参考訳（メタデータ） (2025-12-18T11:50:38Z)
Watermarks for Embeddings-as-a-Service Large Language Models [4.230349220081445]
この論文は、E透かしの調査による模倣攻撃に対する防御に焦点を当てている。既存のE透かしは、模倣攻撃中に攻撃者がモデルをクローンすると、パラフレーズテキストで削除できる。線形変換埋め込みを用いた新しい透かし手法を提案する。
論文参考訳（メタデータ） (2025-11-28T00:52:40Z)
SWAP: Towards Copyright Auditing of Soft Prompts via Sequential Watermarking [58.475471437150674]
ソフトプロンプト(SWAP)のための逐次透かしを提案する。 SWAPは、特定のディフェンダー指定のアウト・オブ・ディストリビューション・クラスを通じて、透かしを符号化する。 11のデータセットの実験では、SWAPの有効性、無害性、および潜在的適応攻撃に対する堅牢性を示す。
論文参考訳（メタデータ） (2025-11-05T13:48:48Z)
Character-Level Perturbations Disrupt LLM Watermarks [64.60090923837701]
我々は,Large Language Model (LLM)ウォーターマーキングのためのシステムモデルを定式化する。我々は、透かし検出器への限られたアクセスに制約された2つの現実的な脅威モデルの特徴付けを行う。我々は,最も制限的な脅威モデルの下で,キャラクタレベルの摂動が透かし除去に著しく有効であることを実証した。現実的な制約下での透かし除去における文字レベルの摂動の優位性と遺伝的アルゴリズム(GA)の有効性を実験的に検証した。
論文参考訳（メタデータ） (2025-09-11T02:50:07Z)
Your Fixed Watermark is Fragile: Towards Semantic-Aware Watermark for EaaS Copyright Protection [5.2431999629987]
埋め込み・アズ・ア・サービス(E: Embedding-as-a-Service)はビジネスパターンとして成功したが、著作権侵害に関する重大な課題に直面している。様々な研究が、Eサービスの著作権を保護するためのバックドアベースの透かし方式を提案している。本稿では,従来の透かし方式が意味に依存しない特徴を持つことを示す。
論文参考訳（メタデータ） (2024-11-14T11:06:34Z)
ESpeW: Robust Copyright Protection for LLM-based EaaS via Embedding-Specific Watermark [50.08021440235581]
組み込み・アズ・ア・サービス(Eding)はAIアプリケーションにおいて重要な役割を担っている。編集はモデル抽出攻撃に対して脆弱であり、著作権保護の緊急の必要性を強調している。そこで我々は,Edingの著作権保護を堅牢にするための新しい埋め込み専用透かし (ESpeW) 機構を提案する。
論文参考訳（メタデータ） (2024-10-23T04:34:49Z)
Large Language Model Watermark Stealing With Mixed Integer Programming [51.336009662771396]
大きな言語モデル(LLM)の透かしは、著作権に対処し、AI生成したテキストを監視し、その誤用を防ぐことを約束している。近年の研究では、多数のキーを用いた透かし手法は、攻撃の除去に影響を受けやすいことが示されている。我々は,最先端のLLM透かしスキームに対する新たなグリーンリスト盗難攻撃を提案する。
論文参考訳（メタデータ） (2024-05-30T04:11:17Z)
ModelShield: Adaptive and Robust Watermark against Model Extraction Attack [58.46326901858431]
大規模言語モデル(LLM)は、さまざまな機械学習タスクにまたがる汎用インテリジェンスを示す。敵はモデル抽出攻撃を利用してモデル生成で符号化されたモデルインテリジェンスを盗むことができるウォーターマーキング技術は、モデル生成コンテンツにユニークな識別子を埋め込むことによって、このような攻撃を防御する有望なソリューションを提供する。
論文参考訳（メタデータ） (2024-05-03T06:41:48Z)
WARDEN: Multi-Directional Backdoor Watermarks for Embedding-as-a-Service Copyright Protection [7.660430606056949]
本稿では,複数の可能な透かし方向を組み込むことで,透かしの除去をより困難にするための新しいプロトコルを提案する。我々の防衛アプローチであるWARDENは、特に透かしのステルスネスを高め、CSE攻撃に対する効果を実証的に示している。
論文参考訳（メタデータ） (2024-03-03T10:39:27Z)
No Free Lunch in LLM Watermarking: Trade-offs in Watermarking Design Choices [20.20770405297239]
LLM透かし方式における一般的な設計選択は、結果のシステムが驚くほど攻撃を受けやすいことを示す。本稿では, LLM透かしのガイドラインと防御について述べる。
論文参考訳（メタデータ） (2024-02-25T20:24:07Z)
Watermarking Vision-Language Pre-trained Models for Multi-modal Embedding as a Service [19.916419258812077]
マーカと呼ばれる言語に対して,ロバストな埋め込み型透かし手法を提案する。そこで本研究では,バックドアトリガと組込み分布の両方に基づく共同著作権検証戦略を提案する。
論文参考訳（メタデータ） (2023-11-10T04:27:27Z)
Towards Robust Model Watermark via Reducing Parametric Vulnerability [57.66709830576457]
バックドアベースのオーナシップ検証が最近人気となり,モデルオーナがモデルをウォーターマークすることが可能になった。本研究では,これらの透かし除去モデルを発見し,それらの透かし挙動を復元するミニマックス定式化を提案する。本手法は,パラメトリックな変化と多数のウォーターマーク除去攻撃に対するモデル透かしの堅牢性を向上させる。
論文参考訳（メタデータ） (2023-09-09T12:46:08Z)
Are You Copying My Model? Protecting the Copyright of Large Language Models for EaaS via Backdoor Watermark [58.60940048748815]
企業は大規模な言語モデル(LLM)に基づいたEmbeddding as a Service(E)の提供を開始した。 Eはモデル抽出攻撃に弱いため、LLMの所有者に重大な損失をもたらす可能性がある。埋め込みにバックドアを埋め込むEmbMarkerという埋め込み透かし手法を提案する。
論文参考訳（メタデータ） (2023-05-17T08:28:54Z)
Fine-tuning Is Not Enough: A Simple yet Effective Watermark Removal Attack for DNN Models [72.9364216776529]
我々は異なる視点から新しい透かし除去攻撃を提案する。我々は、知覚不可能なパターン埋め込みと空間レベルの変換を組み合わせることで、単純だが強力な変換アルゴリズムを設計する。我々の攻撃は、非常に高い成功率で最先端の透かしソリューションを回避できる。
論文参考訳（メタデータ） (2020-09-18T09:14:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。