論文の概要: Safeguarding Text-to-Image Generative Models Against Unauthorized Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2605.22060v1
- Date: Thu, 21 May 2026 06:50:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.122843
- Title: Safeguarding Text-to-Image Generative Models Against Unauthorized Knowledge Distillation
- Title(参考訳): 無許可の知識蒸留に対するテキスト・画像生成モデルの保護
- Authors: Yilan Gao, Sida Huang, Hongyuan Zhang, Xuelong Li,
- Abstract要約: クローズドウェイト生成サービスのための単一パスでジェネレータベースの保護フレームワークであるWaveGuardを紹介する。
WaveGuardのセーフガードは、ユーザが指定した摂動予算の下で合成画像をリリースしている。
- 参考スコア(独自算出の注目度): 49.23010932057819
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Closed-weight generative services are increasingly deployed through query-based APIs, where users can obtain generated outputs while model parameters remain inaccessible. However, such deployment does not prevent model stealing: an attacker can repeatedly query the service, collect large volumes of released synthetic images, and use them as training data for a private substitute model. This query-output-driven process enables unauthorized knowledge distillation and capability replication without direct access to the original weights. To mitigate this threat, a practical defense should preserve the visual fidelity of released images, provide explicit control over perturbation magnitude, and scale efficiently to large-volume output release. We present WaveGuard, a single-pass, generator-based protection framework that safeguards released synthetic images under a user-specified perturbation budget. WaveGuard employs a frequency-aware perturbation generator to inject structured, imperceptible perturbations that maintain perceptual utility for benign viewers while reducing the usefulness of protected images as training data for unauthorized student models. Extensive experiments under WikiArt-related synthetic-output distillation settings show that WaveGuard achieves a favorable efficacy--fidelity--efficiency trade-off, with explicit imperceptibility control and substantial gains in protection efficiency.
- Abstract(参考訳): クローズドウェイトな生成サービスは、クエリベースのAPIを通じてますますデプロイされ、モデルパラメータがアクセス不可能なまま、生成された出力を取得することができる。
攻撃者は繰り返しサービスに問い合わせ、大量のリリースされた合成画像を収集し、それらをプライベートな代替モデルのトレーニングデータとして使用することができる。
このクエリ出力駆動プロセスは、元の重みに直接アクセスすることなく、無許可の知識蒸留と能力複製を可能にする。
この脅威を軽減するために、実用的な防御は、放出された画像の視覚的忠実性を維持し、摂動の大きさを明確に制御し、大容量の出力に効率よくスケールするべきである。
本稿では,ユーザが指定した摂動予算の下で,合成画像の保護を行う単一パス・ジェネレータベースの保護フレームワークであるWaveGuardを紹介する。
WaveGuardは、周波数対応の摂動発生器を使用して、構造化された、知覚不能な摂動を注入し、良性視聴者の知覚的有用性を維持しつつ、保護された画像が無許可の学生モデルのトレーニングデータとして有用性を低下させる。
WikiArtに関連する合成出力蒸留設定の下での広範囲な実験により、WaveGuardは明確な非受容性制御と保護効率の大幅な向上により、有効性、忠実性、効率のトレードオフを達成している。
関連論文リスト
- Purify Once, Edit Freely: Breaking Image Protections under Model Mismatch [21.826849937304477]
拡散モデルは高忠実な画像編集を可能にするが、不正なスタイルの模倣や有害なコンテンツ生成に誤用することもできる。
これらのリスクを軽減するため、プロアクティブな画像保護手法は、下流の編集や微調整を妨害するために共有する前に、画像に小さな、しばしば知覚できない敵の摂動を埋め込む。
我々は,モデルミスマッチ下での保護生存性を評価するために,統合されたリリース後浄化フレームワークを導入する。
論文 参考訳(メタデータ) (2026-03-13T14:36:46Z) - AdLift: Lifting Adversarial Perturbations to Safeguard 3D Gaussian Splatting Assets Against Instruction-Driven Editing [109.07334219188222]
本稿では,任意のビューや次元にまたがる命令駆動編集を防止するAdLiftと呼ばれる3DGSの最初の編集セーフガードを提案する。
我々は勾配トランケーションとイメージ・ツー・ガウスのフィッティングを交互に行い、異なる視点で一貫した対向的保護性能を得る。
論文 参考訳(メタデータ) (2025-12-08T07:41:23Z) - Adapter Shield: A Unified Framework with Built-in Authentication for Preventing Unauthorized Zero-Shot Image-to-Image Generation [74.5813283875938]
ゼロショット画像・画像生成は知的財産権侵害に重大なリスクをもたらす。
この研究は、個人イメージを誤用から守ることを目的とした、最初の普遍的および認証統合ソリューションであるAdapter Shieldを提示する。
提案手法は, ゼロショット画像合成の不正化において, 最先端の防御を克服する。
論文 参考訳(メタデータ) (2025-11-25T04:49:16Z) - Harnessing Frequency Spectrum Insights for Image Copyright Protection Against Diffusion Models [26.821064889438777]
本稿では,拡散生成画像がトレーニングデータの統計的特性を忠実に保存していることを示す。
emphCoprGuardは、許可されていない画像の使用を防ぐための堅牢な周波数領域透かしフレームワークである。
論文 参考訳(メタデータ) (2025-03-14T04:27:50Z) - GuardDoor: Safeguarding Against Malicious Diffusion Editing via Protective Backdoors [8.261182037130407]
GuardDoorは、イメージオーナとモデルプロバイダ間のコラボレーションを促進する、新しくて堅牢な保護メカニズムである。
本手法は,画像前処理操作に対するロバスト性を向上し,大規模展開にスケーラブルであることを示す。
論文 参考訳(メタデータ) (2025-03-05T22:21:44Z) - PersGuard: Preventing Malicious Personalization via Backdoor Attacks on Pre-trained Text-to-Image Diffusion Models [51.458089902581456]
特定の画像の悪質なパーソナライズを防ぐ新しいバックドアベースのアプローチであるPersGuardを紹介する。
我々の手法は既存の技術よりも優れており、プライバシーと著作権保護に対するより堅牢なソリューションを提供する。
論文 参考訳(メタデータ) (2025-02-22T09:47:55Z) - EnTruth: Enhancing the Traceability of Unauthorized Dataset Usage in Text-to-image Diffusion Models with Minimal and Robust Alterations [73.94175015918059]
本稿では、未承認のデータセット使用のトレーサビリティを高める新しいアプローチであるEnTruthを紹介する。
テンプレートの暗記を戦略的に取り入れることで、EnTruthは不正なモデルの特定の振る舞いを侵害の証拠として引き起こすことができる。
本手法は, 暗記の正当性を調査し, 著作権保護に利用し, 呪いを祝福する最初の方法である。
論文 参考訳(メタデータ) (2024-06-20T02:02:44Z) - IMPRESS: Evaluating the Resilience of Imperceptible Perturbations
Against Unauthorized Data Usage in Diffusion-Based Generative AI [52.90082445349903]
拡散ベースの画像生成モデルは、アーティストのスタイルを模倣するアートイメージを作成したり、偽のコンテンツのためにオリジナルの画像を悪意を持って編集することができる。
知覚不能な摂動を追加することによって、元のイメージをそのような不正なデータ使用から保護する試みがいくつかなされている。
本研究では, IMPRESS という浄化摂動プラットフォームを導入し, 非受容性摂動の有効性を保護策として評価する。
論文 参考訳(メタデータ) (2023-10-30T03:33:41Z) - Unlearnable Examples for Diffusion Models: Protect Data from Unauthorized Exploitation [25.55296442023984]
本研究では,不正な利用から画像を保護するために,Unlearnable Diffusion Perturbationを提案する。
この成果は、AI生成コンテンツに対するプライバシーと著作権の保護に寄与するため、現実世界のシナリオにおいて重要な意味を持つ。
論文 参考訳(メタデータ) (2023-06-02T20:19:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。