Fugu-MT 論文翻訳(概要): Evading Watermark based Detection of AI-Generated Content

論文の概要: Evading Watermark based Detection of AI-Generated Content

arxiv url: http://arxiv.org/abs/2305.03807v1
Date: Fri, 5 May 2023 19:20:29 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-09 19:21:08.084887
Title: Evading Watermark based Detection of AI-Generated Content
Title（参考訳）: 透かしを用いたAI生成コンテンツの検出
Authors: Zhengyuan Jiang, Jinghuai Zhang, Neil Zhenqiang Gong
Abstract要約: 生成AIモデルは、非常に現実的なコンテンツを生成することができる。 WatermarkはAI生成コンテンツの検出に活用されている。類似の透かしをデコードできれば、コンテンツはAI生成として検出される。
参考スコア（独自算出の注目度）: 36.076768065589285
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A generative AI model -- such as DALL-E, Stable Diffusion, and ChatGPT -- can generate extremely realistic-looking content, posing growing challenges to the authenticity of information. To address the challenges, watermark has been leveraged to detect AI-generated content. Specifically, a watermark is embedded into an AI-generated content before it is released. A content is detected as AI-generated if a similar watermark can be decoded from it. In this work, we perform a systematic study on the robustness of such watermark-based AI-generated content detection. We focus on AI-generated images. Our work shows that an attacker can post-process an AI-generated watermarked image via adding a small, human-imperceptible perturbation to it, such that the post-processed AI-generated image evades detection while maintaining its visual quality. We demonstrate the effectiveness of our attack both theoretically and empirically. Moreover, to evade detection, our adversarial post-processing method adds much smaller perturbations to the AI-generated images and thus better maintain their visual quality than existing popular image post-processing methods such as JPEG compression, Gaussian blur, and Brightness/Contrast. Our work demonstrates the insufficiency of existing watermark-based detection of AI-generated content, highlighting the urgent needs of new detection methods.
Abstract（参考訳）: DALL-E、Stable Diffusion、ChatGPTといった生成AIモデルは、極めて現実的なコンテンツを生成することができ、情報の真正性に対する課題が増大する。この課題に対処するために、透かしを利用してAI生成コンテンツを検出する。具体的には、リリース前にAI生成コンテンツに透かしを埋め込む。類似の透かしをデコードできれば、コンテンツはAI生成として検出される。本研究では,このような透かしに基づくAI生成コンテンツ検出の堅牢性に関する系統的研究を行う。 AI生成画像に焦点を当てる。我々の研究は、AI生成画像が視覚的品質を維持しながら検出を回避するように、AI生成画像の小さな人間の知覚できない摂動を付加することで、攻撃者がAI生成画像を後処理できることを示しています。我々は理論的にも経験的にも攻撃の有効性を実証する。さらに,検出を回避するために,AI生成画像の摂動をはるかに小さくし,JPEG圧縮やガウスボケ,明度/コントラストといった既存の画像後処理方法よりも視覚的品質を向上する。我々の研究は、既存の透かしに基づくAI生成コンテンツの検出が不十分であることを示し、新しい検出方法の緊急性を強調した。

関連論文リスト

Transferable Black-Box One-Shot Forging of Watermarks via Image Preference Models [42.902365202924535]
広範に使用されているポストホック画像透かしの文脈における透かし鍛造について検討した。画像がウォーターマークされているかどうかを評価するための選好モデルを導入する。本稿では,バックプロパゲーションによる入力画像の最適化により,透かしを除去・鍛造するモデルの能力を実証する。
論文参考訳（メタデータ） (2025-10-23T12:06:35Z)
IConMark: Robust Interpretable Concept-Based Watermark For AI Images [50.045011844765185]
我々は,新しい世代のロバストなセマンティックな透かし法であるIConMarkを提案する。 IConMarkは、解釈可能な概念をAI生成イメージに組み込み、敵の操作に耐性を持たせる。我々は、検出精度と画質の維持の観点から、その優位性を実証する。
論文参考訳（メタデータ） (2025-07-17T05:38:30Z)
On-Device Watermarking: A Socio-Technical Imperative For Authenticity In The Age of Generative AI [0.0]
私たちは間違ったアプローチを採用しており、暗号署名による透かしに注力すべきだと論じています。特に音声・視覚コンテンツについては、実際のコンテンツはすべて物理的世界に根ざし、ハードウェアセンサーを介してキャプチャされる。
論文参考訳（メタデータ） (2025-04-15T20:36:52Z)
WMCopier: Forging Invisible Image Watermarks on Arbitrary Images [21.17890218813236]
目的の透かしアルゴリズムの事前知識やアクセスを必要とせず,有効な透かし偽造攻撃であるWMCopierを提案する。提案手法はまず,無条件拡散モデルを用いて対象の透かし分布をモデル化し,次いで,対象の透かしを非透かし画像にシームレスに埋め込む。実験の結果、WMCopierはオープンソースとクローズドソースの両方の透かしシステムを効果的に騙していることがわかった。
論文参考訳（メタデータ） (2025-03-28T11:11:19Z)
SEAL: Semantic Aware Image Watermarking [26.606008778795193]
本稿では,生成した画像のセマンティック情報を透かしに直接埋め込む新しい透かし手法を提案する。キーパターンは、局所性に敏感なハッシュを用いて画像のセマンティック埋め込みから推測することができる。以上の結果から,画像生成モデルによるリスクを軽減できる可能性が示唆された。
論文参考訳（メタデータ） (2025-03-15T15:29:05Z)
SoK: Watermarking for AI-Generated Content [112.9218881276487]
ウォーターマーキングスキームは、AI生成コンテンツに隠された信号を埋め込んで、信頼性の高い検出を可能にする。透かしは、誤情報や偽造と戦ってAIの安全性と信頼性を高める上で重要な役割を果たす。本研究の目的は、研究者が透かし法や応用の進歩を指導し、GenAIの幅広い意味に対処する政策立案者を支援することである。
論文参考訳（メタデータ） (2024-11-27T16:22:33Z)
InvisMark: Invisible and Robust Watermarking for AI-generated Image Provenance [10.161648213213828]
InvisMarkは、高解像度のAI生成画像のために設計された新しい透かし技術である。 InvisMarkは、非許容で最先端のパフォーマンスを達成する。我々は、高度な攻撃に対する潜在的な脆弱性に対処し、緩和戦略を提案する。
論文参考訳（メタデータ） (2024-11-10T16:22:22Z)
Certifiably Robust Image Watermark [57.546016845801134]
ジェネレーティブAIは、偽情報やプロパガンダキャンペーンの促進など、多くの社会的懸念を提起する。ウォーターマークAI生成コンテンツは、これらの懸念に対処するための重要な技術である。本報告では, 除去・偽造攻撃に対するロバスト性保証を保証した最初の画像透かしを提案する。
論文参考訳（メタデータ） (2024-07-04T17:56:04Z)
A Sanity Check for AI-generated Image Detection [49.08585395873425]
本稿では,AIによる画像検出の課題が解決されたかどうかの検査を行う。既存の手法の一般化を定量化するために,Chameleonデータセット上で,既製のAI生成画像検出器を9つ評価した。複数の専門家が同時に視覚的アーチファクトやノイズパターンを抽出するAI生成画像検出装置(AID)を提案する。
論文参考訳（メタデータ） (2024-06-27T17:59:49Z)
Watermark-based Attribution of AI-Generated Content [34.913290430783185]
我々は,AI生成コンテンツの透かしに基づくユーザレベルの属性に関する最初の体系的研究を行う。私たちのキーとなるアイデアは、GenAIサービスの各ユーザにユニークな透かしを割り当て、この透かしを、そのユーザが作成したAI生成コンテンツに埋め込むことです。次に、アトリビューションは、与えられたコンテンツから抽出したユーザとベストマッチしたユーザを特定して実行される。
論文参考訳（メタデータ） (2024-04-05T17:58:52Z)
Robustness of AI-Image Detectors: Fundamental Limits and Practical Attacks [47.04650443491879]
我々は、透かしやディープフェイク検出器を含む様々なAI画像検出器の堅牢性を分析する。ウォーターマーキング手法は,攻撃者が実際の画像をウォーターマーキングとして識別することを目的としたスプーフ攻撃に対して脆弱であることを示す。
論文参考訳（メタデータ） (2023-09-29T18:30:29Z)
Invisible Image Watermarks Are Provably Removable Using Generative AI [47.25747266531665]
Invisibleの透かしは、所有者によってのみ検出可能な隠されたメッセージを埋め込むことで、画像の著作権を保護する。我々は、これらの見えない透かしを取り除くために、再生攻撃のファミリーを提案する。提案手法は,まず画像にランダムノイズを加えて透かしを破壊し,画像を再構成する。
論文参考訳（メタデータ） (2023-06-02T23:29:28Z)
Fine-tuning Is Not Enough: A Simple yet Effective Watermark Removal Attack for DNN Models [72.9364216776529]
我々は異なる視点から新しい透かし除去攻撃を提案する。我々は、知覚不可能なパターン埋め込みと空間レベルの変換を組み合わせることで、単純だが強力な変換アルゴリズムを設計する。我々の攻撃は、非常に高い成功率で最先端の透かしソリューションを回避できる。
論文参考訳（メタデータ） (2020-09-18T09:14:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。