Fugu-MT 論文翻訳(概要): Evading Watermark based Detection of AI-Generated Content

論文の概要: Evading Watermark based Detection of AI-Generated Content

arxiv url: http://arxiv.org/abs/2305.03807v5
Date: Wed, 8 Nov 2023 15:23:10 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-09 20:01:13.362136
Title: Evading Watermark based Detection of AI-Generated Content
Title（参考訳）: 透かしを用いたAI生成コンテンツの検出
Authors: Zhengyuan Jiang, Jinghuai Zhang, Neil Zhenqiang Gong
Abstract要約: 生成AIモデルは、非常に現実的なコンテンツを生成することができる。 WatermarkはAI生成コンテンツの検出に活用されている。類似の透かしをデコードできれば、コンテンツはAI生成として検出される。
参考スコア（独自算出の注目度）: 45.47476727209842
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A generative AI model can generate extremely realistic-looking content, posing growing challenges to the authenticity of information. To address the challenges, watermark has been leveraged to detect AI-generated content. Specifically, a watermark is embedded into an AI-generated content before it is released. A content is detected as AI-generated if a similar watermark can be decoded from it. In this work, we perform a systematic study on the robustness of such watermark-based AI-generated content detection. We focus on AI-generated images. Our work shows that an attacker can post-process a watermarked image via adding a small, human-imperceptible perturbation to it, such that the post-processed image evades detection while maintaining its visual quality. We show the effectiveness of our attack both theoretically and empirically. Moreover, to evade detection, our adversarial post-processing method adds much smaller perturbations to AI-generated images and thus better maintain their visual quality than existing popular post-processing methods such as JPEG compression, Gaussian blur, and Brightness/Contrast. Our work shows the insufficiency of existing watermark-based detection of AI-generated content, highlighting the urgent needs of new methods. Our code is publicly available: https://github.com/zhengyuan-jiang/WEvade.
Abstract（参考訳）: 生成可能なAIモデルは、極めて現実的なコンテンツを生成することができ、情報の信頼性に対する課題が増大する。この課題に対処するために、透かしを利用してAI生成コンテンツを検出する。具体的には、リリース前にAI生成コンテンツに透かしを埋め込む。類似の透かしをデコードできれば、コンテンツはAI生成として検出される。本研究では,このような透かしに基づくAI生成コンテンツ検出の堅牢性に関する系統的研究を行う。 AI生成画像に焦点を当てる。本研究は,視覚品質を維持したまま検出を回避できるような,人間に知覚できない小さな摂動を加えることで,後処理が可能なことを示す。理論的にも経験的にも攻撃の有効性を示す。さらに,検出を回避するために,AI生成画像の摂動をはるかに小さくし,JPEG圧縮やガウスアンボケ,明度/コントラストといった一般的な後処理方法よりも視覚的品質を向上する。我々の研究は、既存の透かしに基づくAI生成コンテンツの検出が不十分であることを示し、新しい方法の緊急性を強調している。私たちのコードは、https://github.com/zhengyuan-jiang/WEvade.comで公開されています。

関連論文リスト

On-Device Watermarking: A Socio-Technical Imperative For Authenticity In The Age of Generative AI [0.0]
私たちは間違ったアプローチを採用しており、暗号署名による透かしに注力すべきだと論じています。特に音声・視覚コンテンツについては、実際のコンテンツはすべて物理的世界に根ざし、ハードウェアセンサーを介してキャプチャされる。
論文参考訳（メタデータ） (2025-04-15T20:36:52Z)
SEAL: Semantic Aware Image Watermarking [26.606008778795193]
本稿では,生成した画像のセマンティック情報を透かしに直接埋め込む新しい透かし手法を提案する。キーパターンは、局所性に敏感なハッシュを用いて画像のセマンティック埋め込みから推測することができる。以上の結果から,画像生成モデルによるリスクを軽減できる可能性が示唆された。
論文参考訳（メタデータ） (2025-03-15T15:29:05Z)
SoK: Watermarking for AI-Generated Content [112.9218881276487]
ウォーターマーキングスキームは、AI生成コンテンツに隠された信号を埋め込んで、信頼性の高い検出を可能にする。透かしは、誤情報や偽造と戦ってAIの安全性と信頼性を高める上で重要な役割を果たす。本研究の目的は、研究者が透かし法や応用の進歩を指導し、GenAIの幅広い意味に対処する政策立案者を支援することである。
論文参考訳（メタデータ） (2024-11-27T16:22:33Z)
InvisMark: Invisible and Robust Watermarking for AI-generated Image Provenance [10.161648213213828]
InvisMarkは、高解像度のAI生成画像のために設計された新しい透かし技術である。 InvisMarkは、非許容で最先端のパフォーマンスを達成する。我々は、高度な攻撃に対する潜在的な脆弱性に対処し、緩和戦略を提案する。
論文参考訳（メタデータ） (2024-11-10T16:22:22Z)
Certifiably Robust Image Watermark [57.546016845801134]
ジェネレーティブAIは、偽情報やプロパガンダキャンペーンの促進など、多くの社会的懸念を提起する。ウォーターマークAI生成コンテンツは、これらの懸念に対処するための重要な技術である。本報告では, 除去・偽造攻撃に対するロバスト性保証を保証した最初の画像透かしを提案する。
論文参考訳（メタデータ） (2024-07-04T17:56:04Z)
A Sanity Check for AI-generated Image Detection [49.08585395873425]
本稿では,AIによる画像検出の課題が解決されたかどうかの検査を行う。既存の手法の一般化を定量化するために,Chameleonデータセット上で,既製のAI生成画像検出器を9つ評価した。複数の専門家が同時に視覚的アーチファクトやノイズパターンを抽出するAI生成画像検出装置(AID)を提案する。
論文参考訳（メタデータ） (2024-06-27T17:59:49Z)
Watermark-based Attribution of AI-Generated Content [34.913290430783185]
我々は,AI生成コンテンツの透かしに基づくユーザレベルの属性に関する最初の体系的研究を行う。私たちのキーとなるアイデアは、GenAIサービスの各ユーザにユニークな透かしを割り当て、この透かしを、そのユーザが作成したAI生成コンテンツに埋め込むことです。次に、アトリビューションは、与えられたコンテンツから抽出したユーザとベストマッチしたユーザを特定して実行される。
論文参考訳（メタデータ） (2024-04-05T17:58:52Z)
Robustness of AI-Image Detectors: Fundamental Limits and Practical Attacks [47.04650443491879]
我々は、透かしやディープフェイク検出器を含む様々なAI画像検出器の堅牢性を分析する。ウォーターマーキング手法は,攻撃者が実際の画像をウォーターマーキングとして識別することを目的としたスプーフ攻撃に対して脆弱であることを示す。
論文参考訳（メタデータ） (2023-09-29T18:30:29Z)
Invisible Image Watermarks Are Provably Removable Using Generative AI [47.25747266531665]
Invisibleの透かしは、所有者によってのみ検出可能な隠されたメッセージを埋め込むことで、画像の著作権を保護する。我々は、これらの見えない透かしを取り除くために、再生攻撃のファミリーを提案する。提案手法は,まず画像にランダムノイズを加えて透かしを破壊し,画像を再構成する。
論文参考訳（メタデータ） (2023-06-02T23:29:28Z)
Fine-tuning Is Not Enough: A Simple yet Effective Watermark Removal Attack for DNN Models [72.9364216776529]
我々は異なる視点から新しい透かし除去攻撃を提案する。我々は、知覚不可能なパターン埋め込みと空間レベルの変換を組み合わせることで、単純だが強力な変換アルゴリズムを設計する。我々の攻撃は、非常に高い成功率で最先端の透かしソリューションを回避できる。
論文参考訳（メタデータ） (2020-09-18T09:14:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。