論文の概要: Watermark-based Detection and Attribution of AI-Generated Content
- arxiv url: http://arxiv.org/abs/2404.04254v2
- Date: Mon, 18 Nov 2024 18:35:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:31:42.787733
- Title: Watermark-based Detection and Attribution of AI-Generated Content
- Title(参考訳): 透かしに基づくAI生成コンテンツの検出と属性
- Authors: Zhengyuan Jiang, Moyang Guo, Yuepeng Hu, Neil Zhenqiang Gong,
- Abstract要約: 我々は,AI生成コンテンツの透かしに基づくユーザレベルの属性に関する最初の体系的研究を行う。
私たちのキーとなるアイデアは、GenAIサービスの各ユーザにユニークな透かしを割り当て、この透かしを、そのユーザが作成したAI生成コンテンツに埋め込むことです。
次に、アトリビューションは、与えられたコンテンツから抽出したユーザとベストマッチしたユーザを特定して実行される。
- 参考スコア(独自算出の注目度): 34.913290430783185
- License:
- Abstract: Several companies have deployed watermark-based detection to identify AI-generated content. However, attribution--the ability to trace back to the user of a generative AI (GenAI) service who created a given piece of AI-generated content--remains largely unexplored despite its growing importance. In this work, we aim to bridge this gap by conducting the first systematic study on watermark-based, user-level attribution of AI-generated content. Our key idea is to assign a unique watermark to each user of the GenAI service and embed this watermark into the AI-generated content created by that user. Attribution is then performed by identifying the user whose watermark best matches the one extracted from the given content. This approach, however, faces a key challenge: How should watermarks be selected for users to maximize attribution performance? To address the challenge, we first theoretically derive lower bounds on detection and attribution performance through rigorous probabilistic analysis for any given set of user watermarks. Then, we select watermarks for users to maximize these lower bounds, thereby optimizing detection and attribution performance. Our theoretical and empirical results show that watermark-based attribution inherits both the accuracy and (non-)robustness properties of the underlying watermark. Specifically, attribution remains highly accurate when the watermarked AI-generated content is either not post-processed or subjected to common post-processing such as JPEG compression, as well as black-box adversarial post-processing with limited query budgets.
- Abstract(参考訳): 複数の企業が、AI生成コンテンツを特定するために、透かしベースの検出をデプロイしている。
しかし、属性(Attribution) - 特定のAI生成コンテンツを作成する生成AI(GenAI)サービスのユーザをトレースする能力 - は、その重要性が増しているにもかかわらず、ほとんど調査されていない。
本研究では,このギャップを埋めるために,透かしに基づく,AI生成コンテンツのユーザレベルの属性に関する最初の体系的研究を行う。
私たちのキーとなるアイデアは、GenAIサービスの各ユーザにユニークな透かしを割り当て、この透かしを、そのユーザが作成したAI生成コンテンツに埋め込むことです。
次に、アトリビューションは、与えられたコンテンツから抽出したユーザとベストマッチしたユーザを特定して実行される。
しかし、このアプローチは重要な課題に直面している。 ユーザの属性パフォーマンスを最大化するために、どのように透かしを選択するべきか?
この課題に対処するために、まず、任意のユーザ透かしに対して厳密な確率論的解析を行うことにより、検出と帰属性能の低い境界を理論的に導出する。
次に,ユーザがこれらの下位境界を最大化するための透かしを選択し,検出と属性性能を最適化する。
我々の理論的および実証的な結果は、透かしに基づく属性が、基礎となる透かしの精度と(非)可燃性の両方を継承することを示している。
具体的には、ウォーターマークされたAI生成コンテンツが後処理されないか、JPEG圧縮のような一般的な後処理を受ける場合や、クエリ予算が制限されたブラックボックスの逆処理の場合、属性は極めて正確である。
関連論文リスト
- WaterSeeker: Pioneering Efficient Detection of Watermarked Segments in Large Documents [65.11018806214388]
WaterSeekerは、広範囲な自然テキストの中で、ウォーターマークされたセグメントを効率的に検出し、発見するための新しいアプローチである。
検出精度と計算効率のバランスが良くなる。
WaterSeekerのローカライゼーション機能は、解釈可能なAI検出システムの開発をサポートする。
論文 参考訳(メタデータ) (2024-09-08T14:45:47Z) - Watermarking Recommender Systems [52.207721219147814]
本稿では,レコメンダシステムに特化した新しい手法であるAutoregressive Out-of-Distribution Watermarking (AOW)を紹介する。
提案手法では,初期項目の選択とオラクルモデルによるクエリを行い,その後に予測スコアの小さい項目を選択する。
透かしの有効性を評価するため、このモデルでは、切り捨てられた透かしシーケンスが与えられた後続の項目を予測することを課題とする。
論文 参考訳(メタデータ) (2024-07-17T06:51:24Z) - Certifiably Robust Image Watermark [57.546016845801134]
ジェネレーティブAIは、偽情報やプロパガンダキャンペーンの促進など、多くの社会的懸念を提起する。
ウォーターマークAI生成コンテンツは、これらの懸念に対処するための重要な技術である。
本報告では, 除去・偽造攻撃に対するロバスト性保証を保証した最初の画像透かしを提案する。
論文 参考訳(メタデータ) (2024-07-04T17:56:04Z) - Protect-Your-IP: Scalable Source-Tracing and Attribution against Personalized Generation [19.250673262185767]
画像著作権のソーストレーシングと属性の統一的なアプローチを提案する。
本稿では,プロアクティブ戦略とパッシブ戦略を融合した革新的な透かし属性法を提案する。
オンラインで公開されている様々なセレブの肖像画シリーズを用いて実験を行った。
論文 参考訳(メタデータ) (2024-05-26T15:14:54Z) - A Watermark-Conditioned Diffusion Model for IP Protection [31.969286898467985]
拡散モデルにおけるコンテンツ著作権保護のための統一的な透かしフレームワークを提案する。
そこで我々はWaDiffと呼ばれるWadmark条件付き拡散モデルを提案する。
本手法は,検出タスクと所有者識別タスクの両方において有効かつ堅牢である。
論文 参考訳(メタデータ) (2024-03-16T11:08:15Z) - Token-Specific Watermarking with Enhanced Detectability and Semantic Coherence for Large Language Models [31.062753031312006]
大規模言語モデルは、潜在的な誤報を伴う高品質な応答を生成する。
ウォーターマーキングは、テキストに隠れたマーカーを埋め込むことによって、この文脈において重要な意味を持つ。
ウォーターマーキングのための新しい多目的最適化(MOO)手法を提案する。
本手法は,検出性と意味的整合性を同時に達成する。
論文 参考訳(メタデータ) (2024-02-28T05:43:22Z) - RAW: A Robust and Agile Plug-and-Play Watermark Framework for AI-Generated Images with Provable Guarantees [33.61946642460661]
本稿ではRAWと呼ばれる堅牢でアジャイルな透かし検出フレームワークを紹介する。
我々は、透かしの存在を検出するために、透かしと共同で訓練された分類器を用いる。
このフレームワークは,透かし画像の誤分類に対する偽陽性率に関する証明可能な保証を提供する。
論文 参考訳(メタデータ) (2024-01-23T22:00:49Z) - Unbiased Watermark for Large Language Models [67.43415395591221]
本研究では, モデル生成出力の品質に及ぼす透かしの影響について検討した。
出力確率分布に影響を与えることなく、透かしを統合することができる。
ウォーターマークの存在は、下流タスクにおけるモデルの性能を損なうものではない。
論文 参考訳(メタデータ) (2023-09-22T12:46:38Z) - Evading Watermark based Detection of AI-Generated Content [45.47476727209842]
生成AIモデルは、非常に現実的なコンテンツを生成することができる。
WatermarkはAI生成コンテンツの検出に活用されている。
類似の透かしをデコードできれば、コンテンツはAI生成として検出される。
論文 参考訳(メタデータ) (2023-05-05T19:20:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。