Fugu-MT 論文翻訳(概要): Probabilistically Robust Watermarking of Neural Networks

論文の概要: Probabilistically Robust Watermarking of Neural Networks

arxiv url: http://arxiv.org/abs/2401.08261v2
Date: Wed, 18 Sep 2024 16:50:32 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-19 23:35:48.026871
Title: Probabilistically Robust Watermarking of Neural Networks
Title（参考訳）: ニューラルネットワークの確率論的ロバストな透かし
Authors: Mikhail Pautov, Nikita Bogdanov, Stanislav Pyatkin, Oleg Rogov, Ivan Oseledets,
Abstract要約: 我々は、攻撃を盗む機能に対するレジリエンスを示す新しいトリガーセットベースの透かし手法を導入する。私たちのアプローチでは、追加のモデルトレーニングは必要とせず、どんなモデルアーキテクチャにも適用できます。
参考スコア（独自算出の注目度）: 4.332441337407564
License: http://creativecommons.org/licenses/by/4.0/
Abstract: As deep learning (DL) models are widely and effectively used in Machine Learning as a Service (MLaaS) platforms, there is a rapidly growing interest in DL watermarking techniques that can be used to confirm the ownership of a particular model. Unfortunately, these methods usually produce watermarks susceptible to model stealing attacks. In our research, we introduce a novel trigger set-based watermarking approach that demonstrates resilience against functionality stealing attacks, particularly those involving extraction and distillation. Our approach does not require additional model training and can be applied to any model architecture. The key idea of our method is to compute the trigger set, which is transferable between the source model and the set of proxy models with a high probability. In our experimental study, we show that if the probability of the set being transferable is reasonably high, it can be effectively used for ownership verification of the stolen model. We evaluate our method on multiple benchmarks and show that our approach outperforms current state-of-the-art watermarking techniques in all considered experimental setups.
Abstract（参考訳）: マシンラーニング・アズ・ア・サービス(MLaaS)プラットフォームでは、ディープラーニング(DL)モデルが広く、効果的に使用されているため、特定のモデルのオーナシップを確認するために使用可能なDL透かし技術への関心が急速に高まっている。残念なことに、これらの手法は、通常、盗み攻撃のモデルに感受性のある透かしを生成する。本研究では, 新規なトリガーセット型透かし方式を導入し, 特に抽出・蒸留に関わる機能に対するレジリエンスを実証する。私たちのアプローチでは、追加のモデルトレーニングは必要とせず、どんなモデルアーキテクチャにも適用できます。提案手法のキーとなる考え方は、ソースモデルとプロキシモデルのセット間で高い確率で転送可能なトリガーセットを計算することである。本研究では,移動可能な集合の確率が合理的に高い場合,盗難モデルのオーナシップ検証に有効であることを示す。提案手法を複数のベンチマークで評価し,提案手法が現在行われている透かし技術よりも優れていることを示す。

関連論文リスト

DeepTracer: Tracing Stolen Model via Deep Coupled Watermarks [14.552367035706283]
本稿では,新しい透かしサンプル構築法と等級結合損失制約を利用する,堅牢な透かしフレームワークDeepTracerを紹介する。 DeepTracerは、ウォーターマークタスクとプライマリタスクとの間に高い結合モデルを持ち込み、敵がメインタスク機能を盗む際に隠れたウォーターマークタスクを学習させる。モデルオーナシップ検証に使用される透かしキーを精巧に選択して,透かしの信頼性を高める,効果的な透かしサンプルフィルタリング機構を提案する。
論文参考訳（メタデータ） (2025-11-12T05:06:25Z)
Optimization-Free Universal Watermark Forgery with Regenerative Diffusion Models [50.73220224678009]
ウォーターマーキングは、人工知能モデルによって生成された合成画像の起源を検証するために使用できる。近年の研究では, 対象画像から表層画像への透かしを, 対角的手法を用いてフォージできることが示されている。本稿では,最適化フリーで普遍的な透かし偽造のリスクが大きいことを明らかにする。我々のアプローチは攻撃範囲を大きく広げ、現在の透かし技術の安全性により大きな課題をもたらす。
論文参考訳（メタデータ） (2025-06-06T12:08:02Z)
Neural Honeytrace: A Robust Plug-and-Play Watermarking Framework against Model Extraction Attacks [39.06642008591216]
モデル抽出攻撃に対する堅牢なプラグアンドプレイ透かしフレームワークであるNeural Honeytraceを提案する。 Neural Honeytraceは、最悪のケースであるt-Testベースの著作権主張に必要なサンプルを、トレーニングコストゼロで12,000ドルから200ドルに削減する。
論文参考訳（メタデータ） (2025-01-16T06:59:20Z)
Task-Agnostic Language Model Watermarking via High Entropy Passthrough Layers [11.089926858383476]
本稿では,既存の事前学習ネットワークに付加されたパススルー層を用いたモデル透かしを提案する。本手法は完全にタスク非依存であり,分類タスクとシーケンス対シーケンスタスクの両方に適用できる。提案手法は, 下流の微調整, 微切り, 層除去攻撃に対して堅牢であることを示す。
論文参考訳（メタデータ） (2024-12-17T05:46:50Z)
Watermarking Recommender Systems [52.207721219147814]
本稿では,レコメンダシステムに特化した新しい手法であるAutoregressive Out-of-Distribution Watermarking (AOW)を紹介する。提案手法では,初期項目の選択とオラクルモデルによるクエリを行い,その後に予測スコアの小さい項目を選択する。透かしの有効性を評価するため、このモデルでは、切り捨てられた透かしシーケンスが与えられた後続の項目を予測することを課題とする。
論文参考訳（メタデータ） (2024-07-17T06:51:24Z)
ModelShield: Adaptive and Robust Watermark against Model Extraction Attack [58.46326901858431]
大規模言語モデル(LLM)は、さまざまな機械学習タスクにまたがる汎用インテリジェンスを示す。敵はモデル抽出攻撃を利用してモデル生成で符号化されたモデルインテリジェンスを盗むことができるウォーターマーキング技術は、モデル生成コンテンツにユニークな識別子を埋め込むことによって、このような攻撃を防御する有望なソリューションを提供する。
論文参考訳（メタデータ） (2024-05-03T06:41:48Z)
Not Just Change the Labels, Learn the Features: Watermarking Deep Neural Networks with Multi-View Data [10.564634073196117]
DNN内に効率よく透かしを埋め込むため,Multi-view dATa をベースとした新しい透かし手法 MAT を提案する。提案手法を様々なベンチマークで検証し,モデル抽出攻撃に対する防御効果を示す。
論文参考訳（メタデータ） (2024-03-15T20:12:41Z)
Trojan Model Detection Using Activation Optimization [15.032071953322594]
機械学習モデルのトレーニングは非常に費用がかからない。事前訓練されたモデルはトロイア攻撃に感染することがある。本稿では,トロイの木馬モデルを検出する新しい方法を提案する。
論文参考訳（メタデータ） (2023-06-08T02:17:29Z)
Seeds Don't Lie: An Adaptive Watermarking Framework for Computer Vision Models [44.80560808267494]
保護モデルに固有の振る舞いを活かして,保護モデルに透かしを施す適応フレームワークを提案する。この透かしは、同じユニークな振る舞いを持つ抽出されたモデルを検出するために使用され、保護されたモデルのIPを無許可で使用することを示す。この枠組みは,(1)未知のモデル抽出攻撃,(2)メソッドを実行する抽出モデル(例えば,重み付け)に対して頑健であることを示す。
論文参考訳（メタデータ） (2022-11-24T14:48:40Z)
Watermarking for Out-of-distribution Detection [76.20630986010114]
Out-of-Distribution (OOD) 検出は、よく訓練された深層モデルから抽出された表現に基づいてOODデータを識別することを目的としている。本稿では,透かしという一般的な手法を提案する。我々は,元データの特徴に重畳される統一パターンを学習し,ウォーターマーキング後にモデルの検出能力が大きく向上する。
論文参考訳（メタデータ） (2022-10-27T06:12:32Z)
DynaMarks: Defending Against Deep Learning Model Extraction Using Dynamic Watermarking [3.282282297279473]
ディープラーニング(DL)モデルの機能は、モデル抽出によって盗むことができる。本稿では,DLモデルの知的財産権(IP)を保護するため,DynaMarksと呼ばれる新しい透かし手法を提案する。
論文参考訳（メタデータ） (2022-07-27T06:49:39Z)
Defending against Model Stealing via Verifying Embedded External Features [90.29429679125508]
トレーニングサンプルがなく、モデルパラメータや構造にアクセスできない場合でも、敵はデプロイされたモデルを盗むことができる。我々は、不審なモデルがディフェンダー特定遠近法の特徴の知識を含んでいるかどうかを検証することによって、他の角度からの防御を探索する。本手法は, 複数段階の盗難処理によって盗難モデルが得られた場合でも, 同時に異なる種類の盗難モデルを検出するのに有効である。
論文参考訳（メタデータ） (2021-12-07T03:51:54Z)
Deep Model Intellectual Property Protection via Deep Watermarking [122.87871873450014]
ディープニューラルネットワークは深刻なip侵害リスクにさらされている。ターゲットの深層モデルを考えると、攻撃者がその全情報を知っていれば、微調整で簡単に盗むことができる。低レベルのコンピュータビジョンや画像処理タスクで訓練されたディープネットワークを保護するための新しいモデル透かしフレームワークを提案する。
論文参考訳（メタデータ） (2021-03-08T18:58:21Z)
Model Watermarking for Image Processing Networks [120.918532981871]
深層モデルの知的財産権を保護する方法は、非常に重要であるが、真に研究されていない問題である。画像処理モデルを保護するための最初のモデル透かしフレームワークを提案する。
論文参考訳（メタデータ） (2020-02-25T18:36:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。