Fugu-MT 論文翻訳(概要): Towards the Vulnerability of Watermarking Artificial Intelligence Generated Content

論文の概要: Towards the Vulnerability of Watermarking Artificial Intelligence Generated Content

arxiv url: http://arxiv.org/abs/2310.07726v1
Date: Wed, 27 Sep 2023 06:32:00 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-15 14:17:40.026690
Title: Towards the Vulnerability of Watermarking Artificial Intelligence Generated Content
Title（参考訳）: 透かしによる人工知能生成コンテンツの脆弱性
Authors: Guanlin Li, Yifei Chen, Jie Zhang, Jiwei Li, Shangwei Guo, Tianwei Zhang
Abstract要約: 敵が容易に透かしのメカニズムを破ることができることを示す。両攻撃を包括的に行うための統一フレームワークであるWMaGiを提案する。
参考スコア（独自算出の注目度）: 33.997373647895095
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Artificial Intelligence Generated Content (AIGC) is gaining great popularity in social media, with many commercial services available. These services leverage advanced generative models, such as latent diffusion models and large language models, to generate creative content (e.g., realistic images, fluent sentences) for users. The usage of such generated content needs to be highly regulated, as the service providers need to ensure the users do not violate the usage policies (e.g., abuse for commercialization, generating and distributing unsafe content). Numerous watermarking approaches have been proposed recently. However, in this paper, we show that an adversary can easily break these watermarking mechanisms. Specifically, we consider two possible attacks. (1) Watermark removal: the adversary can easily erase the embedded watermark from the generated content and then use it freely without the regulation of the service provider. (2) Watermark forge: the adversary can create illegal content with forged watermarks from another user, causing the service provider to make wrong attributions. We propose WMaGi, a unified framework to achieve both attacks in a holistic way. The key idea is to leverage a pre-trained diffusion model for content processing, and a generative adversarial network for watermark removing or forging. We evaluate WMaGi on different datasets and embedding setups. The results prove that it can achieve high success rates while maintaining the quality of the generated content. Compared with existing diffusion model-based attacks, WMaGi is 5,050$\sim$11,000$\times$ faster.
Abstract（参考訳）: AIGC(Artificial Intelligence Generated Content)はソーシャルメディアで人気を集めており、多くの商用サービスが利用できる。これらのサービスは、潜在拡散モデルや大規模言語モデルのような高度な生成モデルを活用して、ユーザのための創造的コンテンツ(例えば、現実的な画像、流動的な文)を生成する。サービス提供者は、利用者が使用ポリシーに違反しないことを保証する必要がある(例えば、商業化の悪用、安全でないコンテンツの生成と配布)。近年,多くの透かし手法が提案されている。しかし,本稿では,敵が容易にこれらの透かし機構を破ることができることを示す。具体的には2つの攻撃の可能性を考える。 1) 透かしの除去: 敵は、生成されたコンテンツから埋め込んだ透かしを簡単に消し、サービス提供者の規制なしに自由に使用することができる。 2) 透かしフォージ: 相手は、他のユーザから偽の透かしで不正なコンテンツを作成でき、サービスプロバイダが誤った属性を発生させる。両攻撃を包括的に行うための統一フレームワークであるWMaGiを提案する。重要なアイデアは、コンテンツ処理に事前訓練された拡散モデルと、ウォーターマークの除去または鍛造のための生成的逆ネットワークを活用することである。異なるデータセットと組込み設定でwmagiを評価した。その結果,生成コンテンツの品質を維持しつつ,高い成功率を達成できることがわかった。既存の拡散モデルに基づく攻撃と比較して、wmagiは5,050$\sim$11,000$\times$高速である。

関連論文リスト

IConMark: Robust Interpretable Concept-Based Watermark For AI Images [50.045011844765185]
我々は,新しい世代のロバストなセマンティックな透かし法であるIConMarkを提案する。 IConMarkは、解釈可能な概念をAI生成イメージに組み込み、敵の操作に耐性を持たせる。我々は、検出精度と画質の維持の観点から、その優位性を実証する。
論文参考訳（メタデータ） (2025-07-17T05:38:30Z)
TAG-WM: Tamper-Aware Generative Image Watermarking via Diffusion Inversion Sensitivity [68.95168727940973]
Tamper-Aware Generative Image WaterMarking(TAG-WM)。本稿では,TAG-WMと命名されたタンパ認識画像ウォーターマーキング手法を提案する。
論文参考訳（メタデータ） (2025-06-30T03:14:07Z)
Peccavi: Visual Paraphrase Attack Safe and Distortion Free Image Watermarking Technique for AI-Generated Images [6.384378994229647]
本稿では,最初のビジュアルパラフレーズアタックセーフで歪みのない画像透かし技術であるPECCAVIを紹介する。視覚的パラフレーズ攻撃では、画像は、Non-Melting Points (NMPs)と呼ばれるコアセマンティック領域を保持しながら変更される。 PECCAVIは戦略的にこれらのNMP内に透かしを埋め込み、マルチチャネル周波数領域透かしを用いる。
論文参考訳（メタデータ） (2025-06-28T17:34:08Z)
Visual Watermarking in the Era of Diffusion Models: Advances and Challenges [46.52694938281591]
拡散モデルに関連する透かし技術の長所と長所を解析する。我々は、進化する偽りの脅威に対して、透かしの堅牢性を維持するための談話を進めることを目的としている。
論文参考訳（メタデータ） (2025-05-13T03:14:18Z)
WMCopier: Forging Invisible Image Watermarks on Arbitrary Images [21.17890218813236]
目的の透かしアルゴリズムの事前知識やアクセスを必要とせず,有効な透かし偽造攻撃であるWMCopierを提案する。提案手法はまず,無条件拡散モデルを用いて対象の透かし分布をモデル化し,次いで,対象の透かしを非透かし画像にシームレスに埋め込む。実験の結果、WMCopierはオープンソースとクローズドソースの両方の透かしシステムを効果的に騙していることがわかった。
論文参考訳（メタデータ） (2025-03-28T11:11:19Z)
SEAL: Semantic Aware Image Watermarking [26.606008778795193]
本稿では,生成した画像のセマンティック情報を透かしに直接埋め込む新しい透かし手法を提案する。キーパターンは、局所性に敏感なハッシュを用いて画像のセマンティック埋め込みから推測することができる。以上の結果から,画像生成モデルによるリスクを軽減できる可能性が示唆された。
論文参考訳（メタデータ） (2025-03-15T15:29:05Z)
SWA-LDM: Toward Stealthy Watermarks for Latent Diffusion Models [11.906245347904289]
埋め込みプロセスのランダム化によって透かしを強化する新しい手法であるSWA-LDMを紹介する。提案する透かし攻撃は,既存の潜水式透かし法の本質的脆弱性を明らかにする。この研究は、LDM生成画像の不正使用に対する保護に向けた重要なステップである。
論文参考訳（メタデータ） (2025-02-14T16:55:45Z)
ESpeW: Robust Copyright Protection for LLM-based EaaS via Embedding-Specific Watermark [50.08021440235581]
組み込み・アズ・ア・サービス(Eding)はAIアプリケーションにおいて重要な役割を担っている。編集はモデル抽出攻撃に対して脆弱であり、著作権保護の緊急の必要性を強調している。そこで我々は,Edingの著作権保護を堅牢にするための新しい埋め込み専用透かし (ESpeW) 機構を提案する。
論文参考訳（メタデータ） (2024-10-23T04:34:49Z)
Certifiably Robust Image Watermark [57.546016845801134]
ジェネレーティブAIは、偽情報やプロパガンダキャンペーンの促進など、多くの社会的懸念を提起する。ウォーターマークAI生成コンテンツは、これらの懸念に対処するための重要な技術である。本報告では, 除去・偽造攻撃に対するロバスト性保証を保証した最初の画像透かしを提案する。
論文参考訳（メタデータ） (2024-07-04T17:56:04Z)
AquaLoRA: Toward White-box Protection for Customized Stable Diffusion Models via Watermark LoRA [67.68750063537482]
拡散モデルは高品質な画像の生成において顕著な成功を収めた。最近の研究は、SDモデルがポストホック法医学のための透かし付きコンテンツを出力できるようにすることを目的としている。このシナリオにおける最初の実装としてtextttmethod を提案する。
論文参考訳（メタデータ） (2024-05-18T01:25:47Z)
Watermark-embedded Adversarial Examples for Copyright Protection against Diffusion Models [10.993094140231667]
拡散モデル(Diffusion Models)は、未承認の作品を模倣し、著作権問題を引き起こす可能性があるという懸念がある。本稿では,個人用透かしを敵対例の生成に組み込む新しい枠組みを提案する。この作品は、DMベースの模倣から著作権を保護するためのシンプルだが強力な方法を提供する。
論文参考訳（メタデータ） (2024-04-15T01:27:07Z)
A Training-Free Plug-and-Play Watermark Framework for Stable Diffusion [47.97443554073836]
既存のアプローチには、トレーサビリティと責任帰属のために生成されたイメージに透かしを埋め込むためのトレーニングコンポーネントやSD全体が含まれる。 AI生成コンテンツ(AIGC)の時代において、SDの迅速なイテレーションは、ウォーターマークモデルによる再トレーニングをコストがかかる。 SDのためのトレーニング不要なプラグアンドプレイ透かしフレームワークを提案する。
論文参考訳（メタデータ） (2024-04-08T15:29:46Z)
A Watermark-Conditioned Diffusion Model for IP Protection [31.969286898467985]
拡散モデルにおけるコンテンツ著作権保護のための統一的な透かしフレームワークを提案する。そこで我々はWaDiffと呼ばれるWadmark条件付き拡散モデルを提案する。本手法は,検出タスクと所有者識別タスクの両方において有効かつ堅牢である。
論文参考訳（メタデータ） (2024-03-16T11:08:15Z)
RAW: A Robust and Agile Plug-and-Play Watermark Framework for AI-Generated Images with Provable Guarantees [33.61946642460661]
本稿ではRAWと呼ばれる堅牢でアジャイルな透かし検出フレームワークを紹介する。我々は、透かしの存在を検出するために、透かしと共同で訓練された分類器を用いる。このフレームワークは,透かし画像の誤分類に対する偽陽性率に関する証明可能な保証を提供する。
論文参考訳（メタデータ） (2024-01-23T22:00:49Z)
Unbiased Watermark for Large Language Models [67.43415395591221]
本研究では, モデル生成出力の品質に及ぼす透かしの影響について検討した。出力確率分布に影響を与えることなく、透かしを統合することができる。ウォーターマークの存在は、下流タスクにおけるモデルの性能を損なうものではない。
論文参考訳（メタデータ） (2023-09-22T12:46:38Z)
Invisible Image Watermarks Are Provably Removable Using Generative AI [47.25747266531665]
Invisibleの透かしは、所有者によってのみ検出可能な隠されたメッセージを埋め込むことで、画像の著作権を保護する。我々は、これらの見えない透かしを取り除くために、再生攻撃のファミリーを提案する。提案手法は,まず画像にランダムノイズを加えて透かしを破壊し,画像を再構成する。
論文参考訳（メタデータ） (2023-06-02T23:29:28Z)
Evading Watermark based Detection of AI-Generated Content [45.47476727209842]
生成AIモデルは、非常に現実的なコンテンツを生成することができる。 WatermarkはAI生成コンテンツの検出に活用されている。類似の透かしをデコードできれば、コンテンツはAI生成として検出される。
論文参考訳（メタデータ） (2023-05-05T19:20:29Z)
Certified Neural Network Watermarks with Randomized Smoothing [64.86178395240469]
本稿では,ディープラーニングモデルのための認証型透かし手法を提案する。我々の透かしは、モデルパラメータが特定のl2しきい値以上変更されない限り、取り外し不可能であることが保証されている。私たちの透かしは、従来の透かし法に比べて経験的に頑丈です。
論文参考訳（メタデータ） (2022-07-16T16:06:59Z)
Exploring Structure Consistency for Deep Model Watermarking [122.38456787761497]
Deep Neural Network(DNN)の知的財産権(IP)は、代理モデルアタックによって簡単に盗まれる。本稿では,新しい構造整合モデルウォーターマーキングアルゴリズムを設計した新しい透かし手法,すなわち構造整合性'を提案する。
論文参考訳（メタデータ） (2021-08-05T04:27:15Z)
Fine-tuning Is Not Enough: A Simple yet Effective Watermark Removal Attack for DNN Models [72.9364216776529]
我々は異なる視点から新しい透かし除去攻撃を提案する。我々は、知覚不可能なパターン埋め込みと空間レベルの変換を組み合わせることで、単純だが強力な変換アルゴリズムを設計する。我々の攻撃は、非常に高い成功率で最先端の透かしソリューションを回避できる。
論文参考訳（メタデータ） (2020-09-18T09:14:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。