論文の概要: BitMark for Infinity: Watermarking Bitwise Autoregressive Image Generative Models
- arxiv url: http://arxiv.org/abs/2506.21209v1
- Date: Thu, 26 Jun 2025 13:03:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.086016
- Title: BitMark for Infinity: Watermarking Bitwise Autoregressive Image Generative Models
- Title(参考訳): BitMark for Infinity: Bitwise Autoregressive Image Generative Modelsの透かし
- Authors: Louis Kerner, Michel Meintz, Bihe Zhao, Franziska Boenisch, Adam Dziedzic,
- Abstract要約: Infinityのような最先端のテキスト画像モデルは、前例のないスピードで画像を生成する。
アウトプットがインターネットに浸透するにつれて、トレーニングデータとしてスクラップ化され、再利用される可能性が高い。
Infinity用の堅牢なビットワイズ透かしフレームワークであるBitMarkを紹介します。
- 参考スコア(独自算出の注目度): 4.535498518799698
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State-of-the-art text-to-image models like Infinity generate photorealistic images at an unprecedented speed. These models operate in a bitwise autoregressive manner over a discrete set of tokens that is practically infinite in size. However, their impressive generative power comes with a growing risk: as their outputs increasingly populate the Internet, they are likely to be scraped and reused as training data-potentially by the very same models. This phenomenon has been shown to lead to model collapse, where repeated training on generated content, especially from the models' own previous versions, causes a gradual degradation in performance. A promising mitigation strategy is watermarking, which embeds human-imperceptible yet detectable signals into generated images-enabling the identification of generated content. In this work, we introduce BitMark, a robust bitwise watermarking framework for Infinity. Our method embeds a watermark directly at the bit level of the token stream across multiple scales (also referred to as resolutions) during Infinity's image generation process. Our bitwise watermark subtly influences the bits to preserve visual fidelity and generation speed while remaining robust against a spectrum of removal techniques. Furthermore, it exhibits high radioactivity, i.e., when watermarked generated images are used to train another image generative model, this second model's outputs will also carry the watermark. The radioactive traces remain detectable even when only fine-tuning diffusion or image autoregressive models on images watermarked with our BitMark. Overall, our approach provides a principled step toward preventing model collapse in image generative models by enabling reliable detection of generated outputs.
- Abstract(参考訳): Infinityのような最先端のテキスト画像モデルは、前例のないスピードでフォトリアリスティックな画像を生成する。
これらのモデルは、事実上無限の大きさの離散的なトークンの集合に対して、ビットワイズ自己回帰的に作用する。
しかし、彼らの印象的な生成力は、インターネットにますます浸透するにつれて、そのアウトプットはスクラップ化され、全く同じモデルによって潜在的にデータトレーニングとして再利用される傾向にある。
この現象はモデル崩壊を招き、特にモデル自身の以前のバージョンから生成されたコンテンツに対する繰り返しのトレーニングが徐々に性能を低下させることが示されている。
有望な緩和戦略は透かしであり、人間が認識できないが検出可能な信号を生成した画像に埋め込んで、生成されたコンテンツの識別を喚起する。
本稿では、Infinityのための堅牢なビットワイズ透かしフレームワークであるBitMarkを紹介する。
本手法は,Infinityの画像生成過程において,複数スケールのトークンストリームのビットレベルに直接透かしを埋め込む。
我々のビットワイド透かしは、視覚的忠実度と生成速度を維持するためにビットに微妙に影響を与えながら、除去技法のスペクトルに対して頑健なままである。
さらに、他の画像生成モデルをトレーニングするために透かし生成画像を使用する場合、この第2モデルの出力も透かしを運ぶ。
BitMarkで透かされた画像上で、微調整された拡散やイメージ自己回帰モデルのみであっても、放射性の痕跡は検出可能である。
提案手法は, 画像生成モデルにおいて, 信頼性の高い出力検出を可能にすることによって, モデル崩壊を防止するための基本的なステップを提供する。
関連論文リスト
- SEAL: Semantic Aware Image Watermarking [26.606008778795193]
本稿では,生成した画像のセマンティック情報を透かしに直接埋め込む新しい透かし手法を提案する。
キーパターンは、局所性に敏感なハッシュを用いて画像のセマンティック埋め込みから推測することができる。
以上の結果から,画像生成モデルによるリスクを軽減できる可能性が示唆された。
論文 参考訳(メタデータ) (2025-03-15T15:29:05Z) - Spread them Apart: Towards Robust Watermarking of Generated Content [4.332441337407564]
本稿では,生成したコンテンツに透かしを埋め込む手法を提案する。
埋め込みされた透かしは、境界等級の加法摂動に対して頑健であることを保証する。
論文 参考訳(メタデータ) (2025-02-11T09:23:38Z) - RoboSignature: Robust Signature and Watermarking on Network Attacks [0.5461938536945723]
本稿では,モデルが意図した透かしを埋め込む能力を阻害する新たな逆調整攻撃を提案する。
本研究は, 発生システムにおける潜在的な脆弱性を予知し, 防御することの重要性を強調した。
論文 参考訳(メタデータ) (2024-12-22T04:36:27Z) - SleeperMark: Towards Robust Watermark against Fine-Tuning Text-to-image Diffusion Models [77.80595722480074]
SleeperMarkは、回復力のある透かしをT2I拡散モデルに埋め込むように設計されたフレームワークである。
学習したセマンティックな概念から透かし情報を切り離すようモデルに誘導する。
各種拡散モデルにおけるSleeperMarkの有効性について実験を行った。
論文 参考訳(メタデータ) (2024-12-06T08:44:18Z) - Exploiting Watermark-Based Defense Mechanisms in Text-to-Image Diffusion Models for Unauthorized Data Usage [14.985938758090763]
安定拡散のようなテキストと画像の拡散モデルは、高品質な画像を生成するのに例外的な可能性を示している。
近年の研究では、これらのモデルのトレーニングに不正データを使用することが懸念されており、知的財産権侵害やプライバシー侵害につながる可能性がある。
本稿では、拡散過程を利用して保護された入力に対して制御された画像を生成するRATTANを提案する。
論文 参考訳(メタデータ) (2024-11-22T22:28:19Z) - How to Trace Latent Generative Model Generated Images without Artificial Watermark? [88.04880564539836]
潜在生成モデルによって生成された画像に関する潜在的な誤用に関する懸念が持ち上がっている。
検査されたモデルの生成された画像をトレースするために,レイトタントトラッカーと呼ばれる潜時反転に基づく手法を提案する。
提案手法は,検査したモデルと他の画像から生成された画像とを高精度かつ効率的に識別できることを示す。
論文 参考訳(メタデータ) (2024-05-22T05:33:47Z) - Tree-Ring Watermarks: Fingerprints for Diffusion Images that are
Invisible and Robust [55.91987293510401]
生成モデルのアウトプットを透かしは、著作権をトレースし、AI生成コンテンツによる潜在的な害を防ぐ重要なテクニックである。
本稿では,拡散モデル出力を頑健にフィンガープリントするTree-Ring Watermarkingという新しい手法を提案する。
私たちの透かしは画像空間に意味的に隠れており、現在デプロイされている透かしよりもはるかに堅牢です。
論文 参考訳(メタデータ) (2023-05-31T17:00:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。