論文の概要: JND-Guided Neural Watermarking with Spatial Transformer Decoding for Screen-Capture Robustness
- arxiv url: http://arxiv.org/abs/2603.26766v1
- Date: Tue, 24 Mar 2026 03:38:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.586085
- Title: JND-Guided Neural Watermarking with Spatial Transformer Decoding for Screen-Capture Robustness
- Title(参考訳): スクリーンキャプチャロバストネスのための空間変換器デコードによるJND誘導型ニューラルウォーターマーキング
- Authors: Jiayi Qin, Jingwei Li, Chuan Wu,
- Abstract要約: 画面撮影のための透かし埋め込みと抽出を協調的に最適化するエンド・ツー・エンドのディープラーニングフレームワークを提案する。
筆者らのフレームワークには, 現実的な画面撮影歪みを忠実にモデル化する包括的ノイズシミュレーション層, (ii) 透かし埋め込み強度を適応的に調節するジャスト・ノーティケータブル・ディストーション (JND) パーセプチュアル・ロス関数, (iii) 補足的な自動位置決めモジュールの3つが組み込まれている。
- 参考スコア(独自算出の注目度): 13.657959371474886
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Screen-shooting robust watermarking aims to imperceptibly embed extractable information into host images such that the watermark survives the complex distortion pipeline of screen display and camera recapture. However, achieving high extraction accuracy while maintaining satisfactory visual quality remains an open challenge, primarily because the screen-shooting channel introduces severe and entangled degradations including Moiré patterns, color-gamut shifts, perspective warping, and sensor noise. In this paper, we present an end-to-end deep learning framework that jointly optimizes watermark embedding and extraction for screen-shooting robustness. Our framework incorporates three key innovations: (i) a comprehensive noise simulation layer that faithfully models realistic screen-shooting distortions -- notably including a physically-motivated Moiré pattern generator -- enabling the network to learn robust representations against the full spectrum of capture-channel noise through adversarial training; (ii) a Just Noticeable Distortion (JND) perceptual loss function that adaptively modulates watermark embedding strength by supervising the perceptual discrepancy between the JND coefficient map and the watermark residual, thereby concentrating watermark energy in perceptually insensitive regions to maximize visual quality; and (iii) two complementary automatic localization modules -- a semantic-segmentation-based foreground extractor for captured image rectification and a symmetric noise template mechanism for anti-cropping region recovery -- that enable fully automated watermark decoding under realistic deployment conditions. Extensive experiments demonstrate that our method achieves an average PSNR of 30.94~dB and SSIM of 0.94 on watermarked images while embedding 127-bit payloads.
- Abstract(参考訳): スクリーン撮影によるロバストな透かしは、抽出可能な情報をホスト画像に挿入することを目的としており、透かしは複雑な歪曲するスクリーンディスプレイとカメラの再キャプチャのパイプラインを生き残る。
しかしながら、良好な視覚的品質を維持しながら高い抽出精度を達成することは、主に、モアレパターン、色域シフト、視点歪み、センサノイズなどの重く絡み合った劣化をもたらすため、未解決の課題である。
本稿では,透かしの埋め込みと抽出を協調的に最適化し,スクリーン・シューティング・ロバストネスを向上するエンド・ツー・エンドのディープラーニングフレームワークを提案する。
私たちのフレームワークには3つの重要なイノベーションが組み込まれています。
一 リアルな画面撮影歪みを忠実にモデル化し、特に物理的に動機づけられたモアレパターン生成器を含む包括的ノイズシミュレーションレイヤにより、敵の訓練により、捕捉チャネルノイズの全スペクトルに対する堅牢な表現を学習することができる。
2)JND係数マップと透かし残差の知覚差を監督することにより、透かし埋め込み強度を適応的に調節するジャスト注意歪(JND)知覚損失関数により、知覚的不感領域における透かしエネルギーを集中させ、視覚的品質を最大化する。
3)2つの補完的な自動ローカライゼーションモジュール -- キャプチャ画像整形のためのセマンティックセグメンテーションベースフォアグラウンド抽出器と、アンチクロップ領域回復のための対称ノイズテンプレート機構 -- は、現実的な展開条件下で完全に自動化されたウォーターマークデコーディングを可能にする。
127ビットのペイロードを埋め込んだまま、透かし画像上で平均PSNRが30.94〜dB、SSIMが0.94であることを示す。
関連論文リスト
- TIACam: Text-Anchored Invariant Feature Learning with Auto-Augmentation for Camera-Robust Zero-Watermarking [0.5429166905724048]
TIACamは、カメラロスゼロウォーターマーキングのための自動拡張を備えたテキストアンコール不変な特徴学習フレームワークである。
合成カメラと実世界のカメラの両方の実験は、TIACamが特徴安定性と透かし抽出精度を達成することを示した。
論文 参考訳(メタデータ) (2026-02-21T15:06:16Z) - MOLM: Mixture of LoRA Markers [28.772539229108286]
本稿では、符号化問題を生成モデルのパラメータの鍵依存として定式化する一般的な透かしフレームワークを提案する。
このフレームワークでは、残部および注目ブロック内でバイナリキーが軽量なLoRAアダプタを活性化するルーティングベースのインスタンス化であるMixture of LoRA Markers(MOLM)を導入する。
論文 参考訳(メタデータ) (2025-09-30T21:27:14Z) - DiffMark: Diffusion-based Robust Watermark Against Deepfakes [49.05095089309156]
ディープフェイクは、悪意のある顔操作を通じて、重大なセキュリティとプライバシーの脅威を引き起こす。
既存の透かし法はディープフェイク操作に対して十分な堅牢性を欠いていることが多い。
本稿では拡散モデルに基づく新しいロバストな透かしフレームワークDiffMarkを提案する。
論文 参考訳(メタデータ) (2025-07-02T07:29:33Z) - TAG-WM: Tamper-Aware Generative Image Watermarking via Diffusion Inversion Sensitivity [76.98973481600002]
本稿では,TAG-WMと命名されたタンパ認識画像ウォーターマーキング手法を提案する。
提案手法は、4つのキーモジュールからなる: 生成品質を保ちつつ、著作権と局所化の透かしを潜伏空間に埋め込むためのデュアルマークジョイントサンプリング (DMJS) アルゴリズム。
実験結果から,TAG-WMは歪み下においても,改質性および局所化能力の両面において最先端性能を達成できることが示された。
論文 参考訳(メタデータ) (2025-06-30T03:14:07Z) - Gaussian Shading++: Rethinking the Realistic Deployment Challenge of Performance-Lossless Image Watermark for Diffusion Models [66.54457339638004]
著作権保護と不適切なコンテンツ生成は、拡散モデルの実装に課題をもたらす。
本研究では,実世界の展開に適した拡散モデル透かし手法を提案する。
Gaussian Shading++はパフォーマンスのロスレス性を維持するだけでなく、ロバスト性の観点からも既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2025-04-21T11:18:16Z) - Bridging Knowledge Gap Between Image Inpainting and Large-Area Visible Watermark Removal [57.84348166457113]
本稿では,事前学習した画像の塗装モデルの表現能力を活用する新しい特徴適応フレームワークを提案する。
本手法は, 透かしの残像の残像を塗布バックボーンモデルに流し込むことにより, 透かしと透かし除去の知識ギャップを埋めるものである。
高品質な透かしマスクへの依存を緩和するために,粗い透かしマスクを用いて推論プロセスを導出する新たな訓練パラダイムを導入する。
論文 参考訳(メタデータ) (2025-04-07T02:37:14Z) - Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。
これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。
高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文 参考訳(メタデータ) (2023-08-24T12:32:46Z) - ResWCAE: Biometric Pattern Image Denoising Using Residual Wavelet-Conditioned Autoencoder [0.5656672152438563]
パターン画像による生体認証は、IoT(Internet of Things)デバイスでますます普及している。
このようなシステムの信頼性は、特に高レベルのノイズの存在下で、画像品質の問題によって損なわれる可能性がある。
本稿では、軽量で堅牢なディープラーニングアーキテクチャ、Residual Wavelet-Conditioned Convolutional Autoencoder(Res-WCAE)を提案する。
論文 参考訳(メタデータ) (2023-07-23T08:02:27Z) - A Screen-Shooting Resilient Document Image Watermarking Scheme using
Deep Neural Network [6.662095297079911]
本稿では,ディープニューラルネットワークを用いた文書画像のスクリーン・シューティング・レジリエントな透かし方式を提案する。
具体的には、透かしを埋め込むエンコーダと、透かしを抽出するデコーダを備えたエンドツーエンドのニューラルネットワークである。
埋め込み強度調整戦略は、抽出精度を損なうことなく透かし画像の視覚的品質を向上させるように設計されている。
論文 参考訳(メタデータ) (2022-03-10T07:19:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。