論文の概要: Towards Robust Red-Green Watermarking for Autoregressive Image Generators
- arxiv url: http://arxiv.org/abs/2508.06656v1
- Date: Fri, 08 Aug 2025 19:14:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.493665
- Title: Towards Robust Red-Green Watermarking for Autoregressive Image Generators
- Title(参考訳): 自己回帰画像生成用赤緑色透かしのロバスト化に向けて
- Authors: Denis Lukovnikov, Andreas Müller, Erwin Quiring, Asja Fischer,
- Abstract要約: 本稿では,自己回帰(AR)画像モデルにおける世代内透かしの利用について検討する。
ARモデルは、視覚トークンのシーケンスを自動回帰予測して画像を生成し、それをピクセルにデコードする。
大規模言語モデルの赤緑色の透かしに着想を得て,次の予測に偏ったトークンレベルの透かし方式を検討した。
類似したトークンを同じ集合に割り当てるために、視覚トークンクラスタリングに依存する2つの新しい透かし手法を提案する。
- 参考スコア(独自算出の注目度): 17.784976310663104
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In-generation watermarking for detecting and attributing generated content has recently been explored for latent diffusion models (LDMs), demonstrating high robustness. However, the use of in-generation watermarks in autoregressive (AR) image models has not been explored yet. AR models generate images by autoregressively predicting a sequence of visual tokens that are then decoded into pixels using a vector-quantized decoder. Inspired by red-green watermarks for large language models, we examine token-level watermarking schemes that bias the next-token prediction based on prior tokens. We find that a direct transfer of these schemes works in principle, but the detectability of the watermarks decreases considerably under common image perturbations. As a remedy, we propose two novel watermarking methods that rely on visual token clustering to assign similar tokens to the same set. Firstly, we investigate a training-free approach that relies on a cluster lookup table, and secondly, we finetune VAE encoders to predict token clusters directly from perturbed images. Overall, our experiments show that cluster-level watermarks improve robustness against perturbations and regeneration attacks while preserving image quality. Cluster classification further boosts watermark detectability, outperforming a set of baselines. Moreover, our methods offer fast verification runtime, comparable to lightweight post-hoc watermarking methods.
- Abstract(参考訳): 近年, 遅延拡散モデル (LDMs) において, 生成物の検出および寄与のための次世代透かしが研究されている。
しかし、自己回帰(AR)画像モデルにおける世代内透かしの使用はまだ検討されていない。
ARモデルは、ベクトル量子化されたデコーダを使用して、画像トークンのシーケンスを自動回帰予測して画像を生成する。
大規模言語モデルの赤緑色の透かしに着想を得て,先行トークンに基づく次のトークン予測を偏見するトークンレベルの透かし方式を検討した。
これらのスキームの直接転送は原則として機能するが、透かしの検出性は一般的な画像摂動下で著しく低下する。
そこで本研究では,類似したトークンを同一セットに割り当てるために,視覚トークンクラスタリングに依存する2つの新しい透かし手法を提案する。
まず、クラスタルックアップテーブルに依存するトレーニング不要のアプローチについて検討し、次に、摂動画像から直接トークンクラスタを予測するためにVAEエンコーダを微調整する。
以上の結果から,クラスタレベルの透かしは画像品質を保ちながら摂動や再生攻撃に対する堅牢性を向上させることが示された。
クラスタ分類により、透かし検出性がさらに向上し、一連のベースラインを上回っている。
さらに,本手法は,ライトウェイトなポストホック透かし法に匹敵する高速な検証ランタイムを提供する。
関連論文リスト
- Watermarking Autoregressive Image Generation [2.6394824904757943]
この設定に言語モデルウォーターマーキング手法を適用することで、このようなアプローチを初めて提示する。
私たちは、リバースサイクル一貫性の欠如という、重要な課題を特定します。
i) RCCを改善するカスタム・トークン・デトケナイザー微調整法,(ii)相補的な透かし同期層を導入する。
論文 参考訳(メタデータ) (2025-06-19T14:25:51Z) - Training-Free Watermarking for Autoregressive Image Generation [24.86897985016275]
IndexMarkは自動回帰画像生成モデルのためのトレーニング不要な透かしフレームワークである。
IndexMarkは画像の品質と精度の点で最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-05-20T17:58:02Z) - SEAL: Semantic Aware Image Watermarking [26.606008778795193]
本稿では,生成した画像のセマンティック情報を透かしに直接埋め込む新しい透かし手法を提案する。
キーパターンは、局所性に敏感なハッシュを用いて画像のセマンティック埋め込みから推測することができる。
以上の結果から,画像生成モデルによるリスクを軽減できる可能性が示唆された。
論文 参考訳(メタデータ) (2025-03-15T15:29:05Z) - RAW: A Robust and Agile Plug-and-Play Watermark Framework for AI-Generated Images with Provable Guarantees [33.61946642460661]
本稿ではRAWと呼ばれる堅牢でアジャイルな透かし検出フレームワークを紹介する。
我々は、透かしの存在を検出するために、透かしと共同で訓練された分類器を用いる。
このフレームワークは,透かし画像の誤分類に対する偽陽性率に関する証明可能な保証を提供する。
論文 参考訳(メタデータ) (2024-01-23T22:00:49Z) - WAVES: Benchmarking the Robustness of Image Watermarks [67.955140223443]
WAVES(Watermark Analysis Via Enhanced Stress-testing)は、画像透かしの堅牢性を評価するためのベンチマークである。
我々は,検出タスクと識別タスクを統合し,多様なストレステストからなる標準化された評価プロトコルを確立する。
我々はWAVESを,ロバストな透かしの将来の開発のためのツールキットとして想定する。
論文 参考訳(メタデータ) (2024-01-16T18:58:36Z) - Tree-Ring Watermarks: Fingerprints for Diffusion Images that are
Invisible and Robust [55.91987293510401]
生成モデルのアウトプットを透かしは、著作権をトレースし、AI生成コンテンツによる潜在的な害を防ぐ重要なテクニックである。
本稿では,拡散モデル出力を頑健にフィンガープリントするTree-Ring Watermarkingという新しい手法を提案する。
私たちの透かしは画像空間に意味的に隠れており、現在デプロイされている透かしよりもはるかに堅牢です。
論文 参考訳(メタデータ) (2023-05-31T17:00:31Z) - Watermarking Images in Self-Supervised Latent Spaces [75.99287942537138]
我々は,自己教師型アプローチに照らして,事前学習した深層ネットワークに基づく透かし手法を再検討する。
我々は、マーク時間におけるデータの増大を利用して、マークとバイナリのメッセージをその潜在空間に埋め込む方法を提案する。
論文 参考訳(メタデータ) (2021-12-17T15:52:46Z) - Fine-tuning Is Not Enough: A Simple yet Effective Watermark Removal
Attack for DNN Models [72.9364216776529]
我々は異なる視点から新しい透かし除去攻撃を提案する。
我々は、知覚不可能なパターン埋め込みと空間レベルの変換を組み合わせることで、単純だが強力な変換アルゴリズムを設計する。
我々の攻撃は、非常に高い成功率で最先端の透かしソリューションを回避できる。
論文 参考訳(メタデータ) (2020-09-18T09:14:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。