Fugu-MT 論文翻訳(概要): The Stronger the Diffusion Model, the Easier the Backdoor: Data Poisoning to Induce Copyright Breaches Without Adjusting Finetuning Pipeline

論文の概要: The Stronger the Diffusion Model, the Easier the Backdoor: Data Poisoning to Induce Copyright Breaches Without Adjusting Finetuning Pipeline

arxiv url: http://arxiv.org/abs/2401.04136v1
Date: Sun, 7 Jan 2024 08:37:29 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-10 18:44:52.792405
Title: The Stronger the Diffusion Model, the Easier the Backdoor: Data Poisoning to Induce Copyright Breaches Without Adjusting Finetuning Pipeline
Title（参考訳）: より強力な拡散モデル、より容易なバックドア:微調整パイプラインを調整せずに著作権侵害を誘発するデータ
Authors: Haonan Wang, Qianli Shen, Yao Tong, Yang Zhang, Kenji Kawaguchi
Abstract要約: 本研究では, DMの著作権保護に関連する脆弱性について, バックドアデータ中毒攻撃の導入による検討を行った。本手法は,拡散モデルのトレーニングや微調整プロセスへのアクセスや制御を必要とせずに動作する。
参考スコア（独自算出の注目度）: 33.051071182668174
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The commercialization of diffusion models, renowned for their ability to generate high-quality images that are often indistinguishable from real ones, brings forth potential copyright concerns. Although attempts have been made to impede unauthorized access to copyrighted material during training and to subsequently prevent DMs from generating copyrighted images, the effectiveness of these solutions remains unverified. This study explores the vulnerabilities associated with copyright protection in DMs by introducing a backdoor data poisoning attack (SilentBadDiffusion) against text-to-image diffusion models. Our attack method operates without requiring access to or control over the diffusion model's training or fine-tuning processes; it merely involves the insertion of poisoning data into the clean training dataset. This data, comprising poisoning images equipped with prompts, is generated by leveraging the powerful capabilities of multimodal large language models and text-guided image inpainting techniques. Our experimental results and analysis confirm the method's effectiveness. By integrating a minor portion of non-copyright-infringing stealthy poisoning data into the clean dataset-rendering it free from suspicion-we can prompt the finetuned diffusion models to produce copyrighted content when activated by specific trigger prompts. These findings underline potential pitfalls in the prevailing copyright protection strategies and underscore the necessity for increased scrutiny and preventative measures against the misuse of DMs.
Abstract（参考訳）: 拡散モデルの商業化は、しばしば実際の画像と区別できない高品質な画像を生成する能力で有名であり、潜在的な著作権上の懸念をもたらす。トレーニング中に著作権物質への不正アクセスを阻止し、DMが著作権画像を生成するのを防ぐ試みは試みられているが、これらのソリューションの有効性は検証されていない。本研究では,テキスト・ツー・イメージ拡散モデルに対するバックドアデータ中毒攻撃(SilentBadDiffusion)を導入することで,DMの著作権保護に関連する脆弱性について検討する。我々の攻撃方法は、拡散モデルのトレーニングや微調整プロセスへのアクセスや制御を必要とせず、単に汚染データをクリーンなトレーニングデータセットに挿入するだけである。このデータは、マルチモーダルな大言語モデルとテキスト誘導画像塗装技術の強力な能力を活用して、プロンプトを備えた中毒画像からなる。実験結果と解析により,本手法の有効性を確認した。非copyright-infring stealthy poisoning dataのごく一部をクリーンデータセットに統合することで、特定のトリガープロンプトによってアクティベートされたときに、微調整された拡散モデルに著作権付きコンテンツを生成するように促すことができる。これらの知見は、著作権保護戦略の潜在的な落とし穴を浮き彫りにしており、dmsの誤用に対する監視と予防措置の増加の必要性を強調している。

関連論文リスト

ME: Trigger Element Combination Backdoor Attack on Copyright Infringement [61.06621533874629]
SilentBadDiffusion(SBD)は、テキスト・ツー・イメージタスクにおけるSD攻撃において優れた性能を示す手法である。本稿では,SBDのような攻撃の研究に利用できる新しいデータセットを作成し,SBDに基づくマルチ要素攻撃法を提案する。著作権侵害率 (CIR) / First Attack Epoch (FAE) の2つの新しいデータセットは16.78% / 39.50と51.20% / 23.60で、それぞれPokemonとMijourneyのベンチマークに近いか、あるいは劣っている。
論文参考訳（メタデータ） (2025-06-12T14:51:27Z)
Certified Mitigation of Worst-Case LLM Copyright Infringement [46.571805194176825]
コピーライト・テイクダウン(copyright takedown)とは、著作権のあるものに近いコンテンツをモデルが生成するのを防ぐ手法である。我々はBloomScrubを提案する。BloomScrubは極めてシンプルで、非常に効果的な推論時間アプローチであり、認証された著作権の削除を提供する。本研究は,軽量な推論時間手法が著作権保護に驚くほど有効であることを示唆する。
論文参考訳（メタデータ） (2025-04-22T17:16:53Z)
PoisonedParrot: Subtle Data Poisoning Attacks to Elicit Copyright-Infringing Content from Large Language Models [31.384367168115503]
PoisonedParrotは、著作権のあるコンテンツを生成するためにLLMを誘導する最初のステルスデータ中毒攻撃である。その単純さにもかかわらず、PoisonedParrotは、著作権のあるコンテンツを識別可能な副作用なしで生成するモデルを作るのに驚くほど効果的だ。われわれは著作権侵害攻撃を防ごうとする最初の試み、ParrotTrapを擁護する。
論文参考訳（メタデータ） (2025-03-10T17:13:30Z)
CopyrightShield: Spatial Similarity Guided Backdoor Defense against Copyright Infringement in Diffusion Models [61.06621533874629]
拡散モデルは著作権侵害の標的だ本稿では拡散モデルにおける複製の空間的類似性を詳細に解析する。本稿では,著作権侵害攻撃を対象とする新たな防衛手法を提案する。
論文参考訳（メタデータ） (2024-12-02T14:19:44Z)
Revealing the Unseen: Guiding Personalized Diffusion Models to Expose Training Data [10.619162675453806]
拡散モデル(DM)は高度な画像生成ツールへと進化してきた。 FineXtractは、微調整データを抽出するフレームワークである。 WikiArtやDreamBoothといったデータセットで微調整されたDMの実験や、オンラインにポストされた実世界のチェックポイントは、我々の方法の有効性を検証する。
論文参考訳（メタデータ） (2024-10-03T23:06:11Z)
Evaluating and Mitigating IP Infringement in Visual Generative AI [54.24196167576133]
最先端のビジュアル生成モデルは、知的財産権によって保護されたキャラクターと著しく類似したコンテンツを生成することができる。これは、入力プロンプトが文字の名前を含む場合や、その特性に関する記述的な詳細を含む場合に発生する。我々は、潜在的に侵害される可能性のあるコンテンツを特定し、IP侵害を防止するための修正された生成パラダイムを開発する。
論文参考訳（メタデータ） (2024-06-07T06:14:18Z)
Watermark-embedded Adversarial Examples for Copyright Protection against Diffusion Models [10.993094140231667]
拡散モデル(Diffusion Models)は、未承認の作品を模倣し、著作権問題を引き起こす可能性があるという懸念がある。本稿では,個人用透かしを敵対例の生成に組み込む新しい枠組みを提案する。この作品は、DMベースの模倣から著作権を保護するためのシンプルだが強力な方法を提供する。
論文参考訳（メタデータ） (2024-04-15T01:27:07Z)
From Trojan Horses to Castle Walls: Unveiling Bilateral Data Poisoning Effects in Diffusion Models [19.140908259968302]
我々は、BadNetsのようなデータ中毒法がDMによって直接的に生成を劣化させるかどうか検討する。 BadNetsのようなデータ中毒攻撃は、DMが誤画像を生成するのに依然として有効であることを示す。被毒DMはトリガーの割合が増加しており、これはトリガー増幅と呼ばれる現象である」
論文参考訳（メタデータ） (2023-11-04T11:00:31Z)
A Recipe for Watermarking Diffusion Models [53.456012264767914]
拡散モデル(DM)は、生成タスクに有利な可能性を証明している。フォトリアリスティック画像の生成や編集など、DMを下流のアプリケーションに組み込むことには幅広い関心がある。しかし、DMの実践的な展開と前例のない力は、著作権保護や生成されたコンテンツの監視を含む法的問題を提起する。ウォーターマーキングは著作権保護とコンテンツ監視のための実証済みのソリューションであるが、DMの文献では過小評価されている。
論文参考訳（メタデータ） (2023-03-17T17:25:10Z)
Adversarial Example Does Good: Preventing Painting Imitation from Diffusion Models via Adversarial Examples [32.701307512642835]
拡散モデル(DM)はAI for Artの波を加速させるが、新たな著作権侵害を引き起こす。本稿では,人造美術品の保護にDMの逆例を活用することを提案する。我々の方法は、DMベースのAI-for-Artアプリケーションを備えた侵害者に対して、人間のアーティストが著作権を保護する強力なツールとなり得る。
論文参考訳（メタデータ） (2023-02-09T11:36:39Z)
Untargeted Backdoor Watermark: Towards Harmless and Stealthy Dataset Copyright Protection [69.59980270078067]
我々は,異常なモデル行動が決定論的でない,未目標のバックドア透かし方式を探索する。また、提案した未ターゲットのバックドア透かしをデータセットのオーナシップ検証に利用する方法について論じる。
論文参考訳（メタデータ） (2022-09-27T12:56:56Z)
Adversarial Examples Make Strong Poisons [55.63469396785909]
従来は訓練済みのモデルに対する攻撃を意図していた敵の例は,近年の毒殺に特化して設計された手法よりも,データ中毒に有効であることを示す。また,本手法は,データセットのセキュアなリリースにおいて,既存の中毒法よりも極めて効果的である。
論文参考訳（メタデータ） (2021-06-21T01:57:14Z)
Strong Data Augmentation Sanitizes Poisoning and Backdoor Attacks Without an Accuracy Tradeoff [57.35978884015093]
CutMixのような強力なデータ拡張は、パフォーマンスを損なうことなく、中毒やバックドア攻撃の脅威を著しく減少させる可能性がある。バックドアのコンテキストでは、CutMixは攻撃を大幅に軽減し、同時にバリデーションの精度を9%向上させる。
論文参考訳（メタデータ） (2020-11-18T20:18:50Z)
Just How Toxic is Data Poisoning? A Unified Benchmark for Backdoor and Data Poisoning Attacks [74.88735178536159]
データ中毒は、モデル盗難から敵の攻撃まで、脅威の中で一番の懸念事項だ。データ中毒やバックドア攻撃は、テスト設定のバリエーションに非常に敏感である。厳格なテストを適用して、それらを恐れるべき程度を判断します。
論文参考訳（メタデータ） (2020-06-22T18:34:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。