Fugu-MT 論文翻訳(概要): Leveraging Optimization for Adaptive Attacks on Image Watermarks

論文の概要: Leveraging Optimization for Adaptive Attacks on Image Watermarks

arxiv url: http://arxiv.org/abs/2309.16952v2
Date: Sat, 20 Jan 2024 19:43:04 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-23 20:38:47.991941
Title: Leveraging Optimization for Adaptive Attacks on Image Watermarks
Title（参考訳）: 画像透かしの適応的攻撃に対するレバレッジ最適化
Authors: Nils Lukas, Abdulrahman Diaa, Lucas Fenaux, Florian Kerschbaum
Abstract要約: ウォーターマーキングは、生成されたコンテンツを隠されたメッセージでマークすることで誤用を検知し、秘密のウォーターマーキングキーを使用して検出する。堅牢性を評価するには、特定の透かしアルゴリズムに対する適応的な攻撃を設計する必要がある。画像品質を劣化させることなく,5つの透かし法を全て破壊できることを示す。
参考スコア（独自算出の注目度）: 31.70167647613335
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Untrustworthy users can misuse image generators to synthesize high-quality deepfakes and engage in unethical activities. Watermarking deters misuse by marking generated content with a hidden message, enabling its detection using a secret watermarking key. A core security property of watermarking is robustness, which states that an attacker can only evade detection by substantially degrading image quality. Assessing robustness requires designing an adaptive attack for the specific watermarking algorithm. When evaluating watermarking algorithms and their (adaptive) attacks, it is challenging to determine whether an adaptive attack is optimal, i.e., the best possible attack. We solve this problem by defining an objective function and then approach adaptive attacks as an optimization problem. The core idea of our adaptive attacks is to replicate secret watermarking keys locally by creating surrogate keys that are differentiable and can be used to optimize the attack's parameters. We demonstrate for Stable Diffusion models that such an attacker can break all five surveyed watermarking methods at no visible degradation in image quality. Optimizing our attacks is efficient and requires less than 1 GPU hour to reduce the detection accuracy to 6.3% or less. Our findings emphasize the need for more rigorous robustness testing against adaptive, learnable attackers.
Abstract（参考訳）: 不信なユーザーは画像生成装置を誤用して高品質なディープフェイクを合成し、非倫理的な活動を行うことができる。ウォーターマーキングは、生成されたコンテンツを隠されたメッセージでマークすることで誤用を検知する。ウォーターマーキングのコアセキュリティ特性は堅牢性であり、攻撃者は画像品質を著しく劣化させることで検出を回避できる。堅牢性を評価するには、特定の透かしアルゴリズムに対する適応攻撃を設計する必要がある。透かしアルゴリズムとその(適応的な)攻撃を評価する場合、適応攻撃が最適な、すなわち最善の攻撃であるかどうかを判断することは困難である。目的関数を定義し,最適化問題として適応攻撃にアプローチすることで,この問題を解決した。アダプティブアタックの核となる考え方は、差別化可能で、攻撃パラメータの最適化に使用できるサロゲートキーを作成することで、秘密のウォーターマークキーをローカルに複製することです。安定拡散モデルでは, 画像品質の劣化を生じさせないまま, 調査した5つの透かし法を全て破壊できることを示す。攻撃の最適化は効率的で、検出精度を6.3%以下にするために1gpu時間未満で済む。本研究は,適応的で学習可能な攻撃者に対するより厳密な堅牢性テストの必要性を強調する。

関連論文リスト

When There Is No Decoder: Removing Watermarks from Stable Diffusion Models in a No-box Setting [37.85082375268253]
本研究では,透かしの埋め込みをテキスト・ツー・イメージ生成と組み合わせたモデル固有透かしの堅牢性について検討する。我々は、エッジ予測ベースの3つの攻撃戦略、ボックスのぼかし、ノーボックス設定で微調整ベースの攻撃を導入する。我々の最高の攻撃は、透かし検出精度を約47.92%に低下させる。
論文参考訳（メタデータ） (2025-07-04T15:22:20Z)
Revealing Weaknesses in Text Watermarking Through Self-Information Rewrite Attacks [36.01146548147208]
テキスト透かしアルゴリズムは、テキストの品質を保証するために、ハイエントロピートークンに透かしを埋め込む。本稿では,この外観上の不明瞭な設計が攻撃者によって悪用され,透かしの堅牢性に重大なリスクを及ぼすことを明らかにする。本稿では,トークンの自己情報を計算することで,その脆弱性を利用する汎用的なパラフレーズ攻撃を提案する。
論文参考訳（メタデータ） (2025-05-08T12:39:00Z)
Gaussian Shading++: Rethinking the Realistic Deployment Challenge of Performance-Lossless Image Watermark for Diffusion Models [66.54457339638004]
著作権保護と不適切なコンテンツ生成は、拡散モデルの実装に課題をもたらす。本研究では,実世界の展開に適した拡散モデル透かし手法を提案する。 Gaussian Shading++はパフォーマンスのロスレス性を維持するだけでなく、ロバスト性の観点からも既存のメソッドよりも優れています。
論文参考訳（メタデータ） (2025-04-21T11:18:16Z)
SEAL: Semantic Aware Image Watermarking [26.606008778795193]
本稿では,生成した画像のセマンティック情報を透かしに直接埋め込む新しい透かし手法を提案する。キーパターンは、局所性に敏感なハッシュを用いて画像のセマンティック埋め込みから推測することができる。以上の結果から,画像生成モデルによるリスクを軽減できる可能性が示唆された。
論文参考訳（メタデータ） (2025-03-15T15:29:05Z)
Optimizing Adaptive Attacks against Content Watermarks for Language Models [5.798432964668272]
大規模な言語モデル(LLM)は、オンラインスパムや誤報を拡散するために省略することができる。コンテンツ透かしは、モデル生成出力にメッセージを隠すことで誤用を検知し、秘密の透かしキーを使用して検出する。
論文参考訳（メタデータ） (2024-10-03T12:37:39Z)
Robustness of Watermarking on Text-to-Image Diffusion Models [9.277492743469235]
本稿では,透かし埋め込みとテキスト・ツー・イメージ・ジェネレーション処理を統合することで生成する透かしの堅牢性について検討する。生成型透かし法は, 識別器による攻撃やエッジ予測に基づく攻撃のエッジ情報に基づく操作など, 直接回避攻撃に対して堅牢であるが, 悪意のある微調整には脆弱であることがわかった。
論文参考訳（メタデータ） (2024-08-04T13:59:09Z)
Certifiably Robust Image Watermark [57.546016845801134]
ジェネレーティブAIは、偽情報やプロパガンダキャンペーンの促進など、多くの社会的懸念を提起する。ウォーターマークAI生成コンテンツは、これらの懸念に対処するための重要な技術である。本報告では, 除去・偽造攻撃に対するロバスト性保証を保証した最初の画像透かしを提案する。
論文参考訳（メタデータ） (2024-07-04T17:56:04Z)
WAVES: Benchmarking the Robustness of Image Watermarks [67.955140223443]
WAVES(Watermark Analysis Via Enhanced Stress-testing)は、画像透かしの堅牢性を評価するためのベンチマークである。我々は,検出タスクと識別タスクを統合し,多様なストレステストからなる標準化された評価プロトコルを確立する。我々はWAVESを,ロバストな透かしの将来の開発のためのツールキットとして想定する。
論文参考訳（メタデータ） (2024-01-16T18:58:36Z)
Watermarks in the Sand: Impossibility of Strong Watermarking for Generative Models [19.29349934856703]
強い透かし方式は、計算的に拘束された攻撃者が、大幅な品質劣化を引き起こすことなく、透かしを消去できない性質を満たす。我々は、明確に定義された自然な仮定の下で、強い透かしが達成できないことを証明した。
論文参考訳（メタデータ） (2023-11-07T22:52:54Z)
Robustness of AI-Image Detectors: Fundamental Limits and Practical Attacks [47.04650443491879]
我々は、透かしやディープフェイク検出器を含む様々なAI画像検出器の堅牢性を分析する。ウォーターマーキング手法は,攻撃者が実際の画像をウォーターマーキングとして識別することを目的としたスプーフ攻撃に対して脆弱であることを示す。
論文参考訳（メタデータ） (2023-09-29T18:30:29Z)
Safe and Robust Watermark Injection with a Single OoD Image [90.71804273115585]
高性能なディープニューラルネットワークをトレーニングするには、大量のデータと計算リソースが必要である。安全で堅牢なバックドア型透かし注入法を提案する。我々は,透かし注入時のモデルパラメータのランダムな摂動を誘導し,一般的な透かし除去攻撃に対する防御を行う。
論文参考訳（メタデータ） (2023-09-04T19:58:35Z)
Invisible Image Watermarks Are Provably Removable Using Generative AI [47.25747266531665]
Invisibleの透かしは、所有者によってのみ検出可能な隠されたメッセージを埋め込むことで、画像の著作権を保護する。我々は、これらの見えない透かしを取り除くために、再生攻撃のファミリーを提案する。提案手法は,まず画像にランダムノイズを加えて透かしを破壊し,画像を再構成する。
論文参考訳（メタデータ） (2023-06-02T23:29:28Z)
Exploring Structure Consistency for Deep Model Watermarking [122.38456787761497]
Deep Neural Network(DNN)の知的財産権(IP)は、代理モデルアタックによって簡単に盗まれる。本稿では,新しい構造整合モデルウォーターマーキングアルゴリズムを設計した新しい透かし手法,すなわち構造整合性'を提案する。
論文参考訳（メタデータ） (2021-08-05T04:27:15Z)
Fine-tuning Is Not Enough: A Simple yet Effective Watermark Removal Attack for DNN Models [72.9364216776529]
我々は異なる視点から新しい透かし除去攻撃を提案する。我々は、知覚不可能なパターン埋め込みと空間レベルの変換を組み合わせることで、単純だが強力な変換アルゴリズムを設計する。我々の攻撃は、非常に高い成功率で最先端の透かしソリューションを回避できる。
論文参考訳（メタデータ） (2020-09-18T09:14:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。