Fugu-MT 論文翻訳(概要): Your Semantic-Independent Watermark is Fragile: A Semantic Perturbation Attack against EaaS Watermark

論文の概要: Your Semantic-Independent Watermark is Fragile: A Semantic Perturbation Attack against EaaS Watermark

arxiv url: http://arxiv.org/abs/2411.09359v2
Date: Sat, 15 Feb 2025 14:46:44 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-18 16:13:23.146791
Title: Your Semantic-Independent Watermark is Fragile: A Semantic Perturbation Attack against EaaS Watermark
Title（参考訳）: 意味に依存しない透かし:EaaS透かしに対する意味論的摂動攻撃
Authors: Zekun Fei, Biao Yi, Jianing Geng, Ruiqi He, Lihai Nie, Zheli Liu,
Abstract要約: 様々な研究が、Eサービスの著作権を保護するためのバックドアベースの透かし方式を提案している。本稿では,従来の透かし方式が意味非依存の特徴を持つことを示すとともに,セマンティック摂動攻撃(SPA)を提案する。我々の理論的および実験的分析は、この意味に依存しない性質が、現在の透かしスキームを適応攻撃に脆弱にし、セマンティック摂動テストを利用して透かし検証を回避していることを示している。
参考スコア（独自算出の注目度）: 5.2431999629987
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Embedding-as-a-Service (EaaS) has emerged as a successful business pattern but faces significant challenges related to various forms of copyright infringement, particularly, the API misuse and model extraction attacks. Various studies have proposed backdoor-based watermarking schemes to protect the copyright of EaaS services. In this paper, we reveal that previous watermarking schemes possess semantic-independent characteristics and propose the Semantic Perturbation Attack (SPA). Our theoretical and experimental analysis demonstrate that this semantic-independent nature makes current watermarking schemes vulnerable to adaptive attacks that exploit semantic perturbations tests to bypass watermark verification. Extensive experimental results across multiple datasets demonstrate that the True Positive Rate (TPR) for identifying watermarked samples under SPA can reach up to more than 95\%, rendering watermarks ineffective while maintaining the high utility of embeddings. Furthermore, we discuss potential defense strategies to mitigate SPA. Our code is available at https://github.com/Zk4-ps/EaaS-Embedding-Watermark.
Abstract（参考訳）: 埋め込み・アズ・ア・サービス(EaaS)はビジネスパターンとして成功したが、さまざまな著作権侵害、特にAPI誤用とモデル抽出攻撃に関連する重大な課題に直面している。様々な研究がEaaSサービスの著作権を保護するためにバックドアベースの透かし方式を提案している。本稿では,従来の透かし方式が意味非依存の特徴を持つことを示すとともに,セマンティック摂動攻撃(SPA)を提案する。我々の理論的および実験的分析は、この意味に依存しない性質が、現在の透かしスキームを適応攻撃に脆弱にし、セマンティック摂動テストを利用して透かし検証を回避していることを示している。複数のデータセットにわたる大規模な実験結果から、SPAの下での透かしサンプルを識別する正の正の速度(TPR)が95%以上に達することが示され、埋め込みの高効率性を維持しながら、透かしが有効でないことが示されている。さらに,SPAを緩和するための防衛戦略についても論じる。私たちのコードはhttps://github.com/Zk4-ps/EaaS-Embedding-Watermarkで公開されています。

関連論文リスト

Towards Dataset Copyright Evasion Attack against Personalized Text-to-Image Diffusion Models [52.877452505561706]
データセットのオーナシップ検証(DOV)を損なうよう特別に設計された最初の著作権回避攻撃を提案する。 CEAT2Iは, 試料検出, トリガー同定, 効率的な透かし除去の3段階からなる。実験の結果,CEAT2I はモデル性能を保ちながら DOV 機構を効果的に回避できることがわかった。
論文参考訳（メタデータ） (2025-05-05T17:51:55Z)
Black-Box Forgery Attacks on Semantic Watermarks for Diffusion Models [16.57738116313139]
攻撃者は、異なる潜在空間やアーキテクチャであっても、無関係なモデルを利用して、強力で現実的な偽造攻撃を行うことができることを示す。第1は、対象の透かしを実画像に印字し、無関係のLCMにおいて任意の画像の潜在表現を操作する。第2の攻撃は、透かし画像を反転させて任意のプロンプトで再生することにより、目標の透かしで新たな画像を生成する。
論文参考訳（メタデータ） (2024-12-04T12:57:17Z)
WaterPark: A Robustness Assessment of Language Model Watermarking [40.50648910458236]
WaterParkは10の最先端の透かしと12の代表的な攻撃を統合した統合プラットフォームです。我々は既存の透かしを総合的に評価し、様々な設計選択が攻撃の堅牢性に与える影響を明らかにする。透かし固有の検出器と一緒にジェネリック検出器を使用することで、脆弱な透かしの安全性が向上する。
論文参考訳（メタデータ） (2024-11-20T16:09:22Z)
ESpeW: Robust Copyright Protection for LLM-based EaaS via Embedding-Specific Watermark [50.08021440235581]
組み込み・アズ・ア・サービス(Eding)はAIアプリケーションにおいて重要な役割を担っている。編集はモデル抽出攻撃に対して脆弱であり、著作権保護の緊急の必要性を強調している。そこで我々は,Edingの著作権保護を堅牢にするための新しい埋め込み専用透かし (ESpeW) 機構を提案する。
論文参考訳（メタデータ） (2024-10-23T04:34:49Z)
WET: Overcoming Paraphrasing Vulnerabilities in Embeddings-as-a-Service with Linear Transformation Watermarks [28.992750031041744]
攻撃者がモデルをクローンすると,既存のE透かしをパラフレーズで除去できることを示す。埋め込みを線形に変換する新しい透かし手法を提案する。
論文参考訳（メタデータ） (2024-08-29T18:59:56Z)
Certifiably Robust Image Watermark [57.546016845801134]
ジェネレーティブAIは、偽情報やプロパガンダキャンペーンの促進など、多くの社会的懸念を提起する。ウォーターマークAI生成コンテンツは、これらの懸念に対処するための重要な技術である。本報告では, 除去・偽造攻撃に対するロバスト性保証を保証した最初の画像透かしを提案する。
論文参考訳（メタデータ） (2024-07-04T17:56:04Z)
Steganalysis on Digital Watermarking: Is Your Defense Truly Impervious? [21.06493827123594]
ステガナリシス攻撃は最小限の知覚歪みで透かしを抽出し除去できる平均的な透かし画像の集合は、その下にある透かしパターンを明らかにすることができる。本稿では,コンテンツ適応型透かし戦略とステガナリシスに対するセキュリティ評価を実施するためのセキュリティガイドラインを提案する。
論文参考訳（メタデータ） (2024-06-13T12:01:28Z)
DIP-Watermark: A Double Identity Protection Method Based on Robust Adversarial Watermark [13.007649270429493]
顔認識(FR)システムはプライバシーのリスクを引き起こす。 1つの対策は敵攻撃であり、不正な悪意のあるFRを欺くことである。トレース可能な対角線透かしに基づく最初の二重識別保護方式を提案する。
論文参考訳（メタデータ） (2024-04-23T02:50:38Z)
WARDEN: Multi-Directional Backdoor Watermarks for Embedding-as-a-Service Copyright Protection [7.660430606056949]
本稿では,複数の可能な透かし方向を組み込むことで,透かしの除去をより困難にするための新しいプロトコルを提案する。我々の防衛アプローチであるWARDENは、特に透かしのステルスネスを高め、CSE攻撃に対する効果を実証的に示している。
論文参考訳（メタデータ） (2024-03-03T10:39:27Z)
Unbiased Watermark for Large Language Models [67.43415395591221]
本研究では, モデル生成出力の品質に及ぼす透かしの影響について検討した。出力確率分布に影響を与えることなく、透かしを統合することができる。ウォーターマークの存在は、下流タスクにおけるモデルの性能を損なうものではない。
論文参考訳（メタデータ） (2023-09-22T12:46:38Z)
Towards Robust Model Watermark via Reducing Parametric Vulnerability [57.66709830576457]
バックドアベースのオーナシップ検証が最近人気となり,モデルオーナがモデルをウォーターマークすることが可能になった。本研究では,これらの透かし除去モデルを発見し,それらの透かし挙動を復元するミニマックス定式化を提案する。本手法は,パラメトリックな変化と多数のウォーターマーク除去攻撃に対するモデル透かしの堅牢性を向上させる。
論文参考訳（メタデータ） (2023-09-09T12:46:08Z)
Safe and Robust Watermark Injection with a Single OoD Image [90.71804273115585]
高性能なディープニューラルネットワークをトレーニングするには、大量のデータと計算リソースが必要である。安全で堅牢なバックドア型透かし注入法を提案する。我々は,透かし注入時のモデルパラメータのランダムな摂動を誘導し,一般的な透かし除去攻撃に対する防御を行う。
論文参考訳（メタデータ） (2023-09-04T19:58:35Z)
Invisible Image Watermarks Are Provably Removable Using Generative AI [47.25747266531665]
Invisibleの透かしは、所有者によってのみ検出可能な隠されたメッセージを埋め込むことで、画像の著作権を保護する。我々は、これらの見えない透かしを取り除くために、再生攻撃のファミリーを提案する。提案手法は,まず画像にランダムノイズを加えて透かしを破壊し,画像を再構成する。
論文参考訳（メタデータ） (2023-06-02T23:29:28Z)
Certified Neural Network Watermarks with Randomized Smoothing [64.86178395240469]
本稿では,ディープラーニングモデルのための認証型透かし手法を提案する。我々の透かしは、モデルパラメータが特定のl2しきい値以上変更されない限り、取り外し不可能であることが保証されている。私たちの透かしは、従来の透かし法に比べて経験的に頑丈です。
論文参考訳（メタデータ） (2022-07-16T16:06:59Z)
Exploring Structure Consistency for Deep Model Watermarking [122.38456787761497]
Deep Neural Network(DNN)の知的財産権(IP)は、代理モデルアタックによって簡単に盗まれる。本稿では,新しい構造整合モデルウォーターマーキングアルゴリズムを設計した新しい透かし手法,すなわち構造整合性'を提案する。
論文参考訳（メタデータ） (2021-08-05T04:27:15Z)
Fine-tuning Is Not Enough: A Simple yet Effective Watermark Removal Attack for DNN Models [72.9364216776529]
我々は異なる視点から新しい透かし除去攻撃を提案する。我々は、知覚不可能なパターン埋め込みと空間レベルの変換を組み合わせることで、単純だが強力な変換アルゴリズムを設計する。我々の攻撃は、非常に高い成功率で最先端の透かしソリューションを回避できる。
論文参考訳（メタデータ） (2020-09-18T09:14:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。