Fugu-MT 論文翻訳(概要): Reliable Model Watermarking: Defending Against Theft without Compromising on Evasion

論文の概要: Reliable Model Watermarking: Defending Against Theft without Compromising on Evasion

arxiv url: http://arxiv.org/abs/2404.13518v1
Date: Sun, 21 Apr 2024 03:38:20 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-23 18:40:56.610744
Title: Reliable Model Watermarking: Defending Against Theft without Compromising on Evasion
Title（参考訳）: 信頼性のあるモデル透かし:侵入を妥協せずに盗難に対処する
Authors: Hongyu Zhu, Sichu Liang, Wentao Hu, Fangqi Li, Ju Jia, Shilin Wang,
Abstract要約: 回避敵は、ウォーターマークサンプルを記憶したモデルによって生成されるショートカットを、容易に利用することができる。モデルを学習してそれらを正確に認識することで、ユニークな透かし行動が知識注入によって促進される。
参考スコア（独自算出の注目度）: 15.086451828825398
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the rise of Machine Learning as a Service (MLaaS) platforms,safeguarding the intellectual property of deep learning models is becoming paramount. Among various protective measures, trigger set watermarking has emerged as a flexible and effective strategy for preventing unauthorized model distribution. However, this paper identifies an inherent flaw in the current paradigm of trigger set watermarking: evasion adversaries can readily exploit the shortcuts created by models memorizing watermark samples that deviate from the main task distribution, significantly impairing their generalization in adversarial settings. To counteract this, we leverage diffusion models to synthesize unrestricted adversarial examples as trigger sets. By learning the model to accurately recognize them, unique watermark behaviors are promoted through knowledge injection rather than error memorization, thus avoiding exploitable shortcuts. Furthermore, we uncover that the resistance of current trigger set watermarking against removal attacks primarily relies on significantly damaging the decision boundaries during embedding, intertwining unremovability with adverse impacts. By optimizing the knowledge transfer properties of protected models, our approach conveys watermark behaviors to extraction surrogates without aggressively decision boundary perturbation. Experimental results on CIFAR-10/100 and Imagenette datasets demonstrate the effectiveness of our method, showing not only improved robustness against evasion adversaries but also superior resistance to watermark removal attacks compared to state-of-the-art solutions.
Abstract（参考訳）: マシンラーニング・アズ・ア・サービス(MLaaS)プラットフォームが台頭するにつれ、ディープラーニングモデルの知的特性の保護が最重要視されている。様々な保護策の中で、無許可のモデル分布を防止するための柔軟で効果的な戦略として、トリガーセットの透かしが出現している。しかし,本論文では,現在のトリガーセットウォーターマーキングのパラダイムに固有の欠陥を指摘した。回避敵は,メインタスク分布から逸脱したウォーターマークサンプルを記憶するモデルにより生成したショートカットを容易に利用でき,敵の設定における一般化を著しく損なう。これに対応するために、拡散モデルを活用して、制約のない逆例をトリガーセットとして合成する。モデルを学習して正確な認識を行うことにより、ユニークな透かしの振る舞いは、エラー記憶よりも知識注入によって促進され、悪用可能なショートカットを避けることができる。さらに, 除去攻撃に対する現在のトリガーセット・ウォーターマーキングの抵抗は, 埋没時の決定境界を著しく損なうこと, 有害な影響を伴って非除去性を損なうことに大きく依存していることが判明した。保護されたモデルの知識伝達特性を最適化することにより,積極的な決定境界摂動を伴わずにサロゲートの抽出に透かしの挙動を伝達する。 CIFAR-10/100 と Imagenette のデータセットを用いた実験結果から,本手法の有効性が示された。

関連論文リスト

Gaussian Shading++: Rethinking the Realistic Deployment Challenge of Performance-Lossless Image Watermark for Diffusion Models [66.54457339638004]
著作権保護と不適切なコンテンツ生成は、拡散モデルの実装に課題をもたらす。本研究では,実世界の展開に適した拡散モデル透かし手法を提案する。 Gaussian Shading++はパフォーマンスのロスレス性を維持するだけでなく、ロバスト性の観点からも既存のメソッドよりも優れています。
論文参考訳（メタデータ） (2025-04-21T11:18:16Z)
Robust Watermarks Leak: Channel-Aware Feature Extraction Enables Adversarial Watermark Manipulation [21.41643665626451]
本稿では,事前学習された視覚モデルを用いて,透かしパターンの漏洩を抽出する攻撃フレームワークを提案する。大量のデータや検出器のアクセスを必要とする従来の作業とは異なり,本手法は1つの透かし画像による偽造と検出の両方を達成している。現在の"ロバスト"な透かしは、歪み抵抗に対するセキュリティを犠牲にして、将来の透かし設計の洞察を与えます。
論文参考訳（メタデータ） (2025-02-10T12:55:08Z)
On the Weaknesses of Backdoor-based Model Watermarking: An Information-theoretic Perspective [39.676548104635096]
機械学習モデルの知的財産権の保護は、AIセキュリティの急激な懸念として浮上している。モデルウォーターマーキングは、機械学習モデルのオーナシップを保護するための強力なテクニックである。本稿では,既存の手法の限界を克服するため,新しいウォーターマーク方式であるIn-distriion Watermark Embedding (IWE)を提案する。
論文参考訳（メタデータ） (2024-09-10T00:55:21Z)
Robustness of Watermarking on Text-to-Image Diffusion Models [9.277492743469235]
本稿では,透かし埋め込みとテキスト・ツー・イメージ・ジェネレーション処理を統合することで生成する透かしの堅牢性について検討する。生成型透かし法は, 識別器による攻撃やエッジ予測に基づく攻撃のエッジ情報に基づく操作など, 直接回避攻撃に対して堅牢であるが, 悪意のある微調整には脆弱であることがわかった。
論文参考訳（メタデータ） (2024-08-04T13:59:09Z)
Watermarking Recommender Systems [52.207721219147814]
本稿では,レコメンダシステムに特化した新しい手法であるAutoregressive Out-of-Distribution Watermarking (AOW)を紹介する。提案手法では,初期項目の選択とオラクルモデルによるクエリを行い,その後に予測スコアの小さい項目を選択する。透かしの有効性を評価するため、このモデルでは、切り捨てられた透かしシーケンスが与えられた後続の項目を予測することを課題とする。
論文参考訳（メタデータ） (2024-07-17T06:51:24Z)
ModelShield: Adaptive and Robust Watermark against Model Extraction Attack [58.46326901858431]
大規模言語モデル(LLM)は、さまざまな機械学習タスクにまたがる汎用インテリジェンスを示す。敵はモデル抽出攻撃を利用してモデル生成で符号化されたモデルインテリジェンスを盗むことができるウォーターマーキング技術は、モデル生成コンテンツにユニークな識別子を埋め込むことによって、このような攻撃を防御する有望なソリューションを提供する。
論文参考訳（メタデータ） (2024-05-03T06:41:48Z)
DIP-Watermark: A Double Identity Protection Method Based on Robust Adversarial Watermark [13.007649270429493]
顔認識(FR)システムはプライバシーのリスクを引き起こす。 1つの対策は敵攻撃であり、不正な悪意のあるFRを欺くことである。トレース可能な対角線透かしに基づく最初の二重識別保護方式を提案する。
論文参考訳（メタデータ） (2024-04-23T02:50:38Z)
Towards Robust Model Watermark via Reducing Parametric Vulnerability [57.66709830576457]
バックドアベースのオーナシップ検証が最近人気となり,モデルオーナがモデルをウォーターマークすることが可能になった。本研究では,これらの透かし除去モデルを発見し,それらの透かし挙動を復元するミニマックス定式化を提案する。本手法は,パラメトリックな変化と多数のウォーターマーク除去攻撃に対するモデル透かしの堅牢性を向上させる。
論文参考訳（メタデータ） (2023-09-09T12:46:08Z)
Safe and Robust Watermark Injection with a Single OoD Image [90.71804273115585]
高性能なディープニューラルネットワークをトレーニングするには、大量のデータと計算リソースが必要である。安全で堅牢なバックドア型透かし注入法を提案する。我々は,透かし注入時のモデルパラメータのランダムな摂動を誘導し,一般的な透かし除去攻撃に対する防御を行う。
論文参考訳（メタデータ） (2023-09-04T19:58:35Z)
Exploring Structure Consistency for Deep Model Watermarking [122.38456787761497]
Deep Neural Network(DNN)の知的財産権(IP)は、代理モデルアタックによって簡単に盗まれる。本稿では,新しい構造整合モデルウォーターマーキングアルゴリズムを設計した新しい透かし手法,すなわち構造整合性'を提案する。
論文参考訳（メタデータ） (2021-08-05T04:27:15Z)
Fine-tuning Is Not Enough: A Simple yet Effective Watermark Removal Attack for DNN Models [72.9364216776529]
我々は異なる視点から新しい透かし除去攻撃を提案する。我々は、知覚不可能なパターン埋め込みと空間レベルの変換を組み合わせることで、単純だが強力な変換アルゴリズムを設計する。我々の攻撃は、非常に高い成功率で最先端の透かしソリューションを回避できる。
論文参考訳（メタデータ） (2020-09-18T09:14:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。