論文の概要: Pixel Seal: Adversarial-only training for invisible image and video watermarking
- arxiv url: http://arxiv.org/abs/2512.16874v1
- Date: Thu, 18 Dec 2025 18:42:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:32.218744
- Title: Pixel Seal: Adversarial-only training for invisible image and video watermarking
- Title(参考訳): Pixel Seal: 見えない画像とビデオ透かしのためのアドバイザリのみのトレーニング
- Authors: Tomáš Souček, Pierre Fernandez, Hady Elsahar, Sylvestre-Alvise Rebuffi, Valeriu Lacatusu, Tuan Tran, Tom Sander, Alexandre Mourachko,
- Abstract要約: 目に見えない透かしは、デジタルコンテンツの証明を辿るのに不可欠である。
現在のアプローチは、しばしば真の非受容性に対して堅牢さのバランスをとるのに苦労します。
この研究はPixel Sealを導入し、画像とビデオの透かしのための新しい最先端技術を構築した。
- 参考スコア(独自算出の注目度): 43.360750005378954
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Invisible watermarking is essential for tracing the provenance of digital content. However, training state-of-the-art models remains notoriously difficult, with current approaches often struggling to balance robustness against true imperceptibility. This work introduces Pixel Seal, which sets a new state-of-the-art for image and video watermarking. We first identify three fundamental issues of existing methods: (i) the reliance on proxy perceptual losses such as MSE and LPIPS that fail to mimic human perception and result in visible watermark artifacts; (ii) the optimization instability caused by conflicting objectives, which necessitates exhaustive hyperparameter tuning; and (iii) reduced robustness and imperceptibility of watermarks when scaling models to high-resolution images and videos. To overcome these issues, we first propose an adversarial-only training paradigm that eliminates unreliable pixel-wise imperceptibility losses. Second, we introduce a three-stage training schedule that stabilizes convergence by decoupling robustness and imperceptibility. Third, we address the resolution gap via high-resolution adaptation, employing JND-based attenuation and training-time inference simulation to eliminate upscaling artifacts. We thoroughly evaluate the robustness and imperceptibility of Pixel Seal on different image types and across a wide range of transformations, and show clear improvements over the state-of-the-art. We finally demonstrate that the model efficiently adapts to video via temporal watermark pooling, positioning Pixel Seal as a practical and scalable solution for reliable provenance in real-world image and video settings.
- Abstract(参考訳): 目に見えない透かしは、デジタルコンテンツの証明を辿るのに不可欠である。
しかし、最先端モデルのトレーニングは依然として難しいことで知られており、現在のアプローチはしばしば、真の非受容性に対する堅牢性のバランスに苦慮している。
この研究はPixel Sealを導入し、画像とビデオの透かしのための新しい最先端技術を構築した。
まず、既存の方法の基本的な3つの問題を特定する。
一 人間の知覚を模倣することができず、目に見える透かし物となるMSE、LPIPS等の代理的知覚的損失に依存すること。
(二)過度パラメータの徹底的なチューニングを必要とする目的の相反による最適化不安定性
(3)高解像度画像やビデオにスケールする際の透かしの頑健さと非受容性を低減した。
これらの課題を克服するために,まず,不確実な画素認識不能を解消する逆向きの訓練パラダイムを提案する。
第2に,頑健性と非受容性を分離することで収束を安定させる3段階のトレーニングスケジュールを導入する。
第3に、高分解能適応による分解能ギャップに対処し、JNDに基づく減衰とトレーニング時間推論シミュレーションを用いて、アップスケーリングアーティファクトを除去する。
我々は,Pixel Sealのさまざまな画像タイプおよび多種多様な変換に対する堅牢性と非受容性を徹底的に評価し,最先端技術に対する明確な改善を示す。
最終的に、このモデルが時間的なウォーターマークプーリングによってビデオに効果的に適応できることを実証し、実世界の画像やビデオ設定における信頼性の高い証明のための実用的でスケーラブルなソリューションとしてPixel Sealを位置づけた。
関連論文リスト
- Semantic Watermarking Reinvented: Enhancing Robustness and Generation Quality with Fourier Integrity [31.666430190864947]
我々はHermitian Symmetric Fourier Watermarking (SFW)と呼ばれる新しい埋め込み手法を提案する。
SFWはエルミート対称性を強制することによって周波数整合性を維持する。
我々は,収穫攻撃による意味的透かしの脆弱性を低減する中心認識型埋め込み戦略を導入する。
論文 参考訳(メタデータ) (2025-09-09T12:15:16Z) - WaterFlow: Learning Fast & Robust Watermarks using Stable Diffusion [46.10882190865747]
WaterFlowは、学習した潜伏依存の透かしに基づいて、高忠実度視覚透かしのための高速かつ極めて堅牢なアプローチである。
WaterFlowは、一般的な堅牢性に対して最先端のパフォーマンスを示し、難しい組み合わせ攻撃に対して効果的に防御できる最初の方法である。
論文 参考訳(メタデータ) (2025-04-15T23:27:52Z) - Towards Effective User Attribution for Latent Diffusion Models via Watermark-Informed Blending [54.26862913139299]
我々は、ウォーターマークインフォームドブレンディング(TEAWIB)による潜伏拡散モデルに対する効果的なユーザ属性に向けた新しいフレームワークを提案する。
TEAWIBは、ユーザ固有の透かしを生成モデルにシームレスに統合する、ユニークな準備可能な構成アプローチを取り入れている。
TEAWIBの有効性を検証し、知覚的品質と帰属精度で最先端の性能を示す実験を行った。
論文 参考訳(メタデータ) (2024-09-17T07:52:09Z) - JIGMARK: A Black-Box Approach for Enhancing Image Watermarks against Diffusion Model Edits [76.25962336540226]
JIGMARKは、コントラスト学習による堅牢性を高める、第一級の透かし技術である。
本評価の結果,JIGMARKは既存の透かし法をはるかに上回っていることがわかった。
論文 参考訳(メタデータ) (2024-06-06T03:31:41Z) - Normalizing Flow as a Flexible Fidelity Objective for Photo-Realistic
Super-resolution [161.39504409401354]
超解像は不適切な問題であり、高分解能画像は可算解空間の1つの可能性を表す。
しかし、支配的なパラダイムは、L_のようなピクセル単位の損失を採用することで、ぼやけた平均に向かって予測を駆動する。
本稿では,L_損失を再考することによりこの問題に対処し,一層条件流に対応することを示す。
この関係に触発されて、L_目的に対する忠実度に基づくオルタナティブとして一般流れを探索する。
より深いフローの柔軟性は、対向的な損失と組み合わせることで、より良い視覚的品質と一貫性をもたらすことを実証する。
論文 参考訳(メタデータ) (2021-11-05T17:56:51Z) - AdvFilter: Predictive Perturbation-aware Filtering against Adversarial
Attack via Multi-domain Learning [17.95784884411471]
本稿では,2重摂動フィルタと不確実性を考慮した融合モジュールを用いた予測摂動対応画素ワイドフィルタを提案する。
我々は,CNNの堅牢性向上,異なるモデルへの高一般化,ノイズレベルに対する利点を示す。
論文 参考訳(メタデータ) (2021-07-14T06:08:48Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。