論文の概要: Compositional Adversarial Training for Robust Visual Watermarking
- arxiv url: http://arxiv.org/abs/2605.16720v1
- Date: Sat, 16 May 2026 00:07:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:46.988075
- Title: Compositional Adversarial Training for Robust Visual Watermarking
- Title(参考訳): ロバストな視覚透かしのための合成対向学習
- Authors: Anirudh Satheesh, Michael-Andrei Panaitescu-Liess, Andrew Xu, Georgios Milis, Heng Huang, Zikui Cai, Furong Huang,
- Abstract要約: 構成変換の構造化空間上のmin-max問題として透かしの堅牢性を定式化する。
本稿では, 逐次微分可能な逆数学習を行うプラグインフレームワークであるComposeal Adversarial Training (CAT)を提案する。
CATは、同じ拡張予算でトレーニングされたランダム拡張ベースラインを一貫して上回る。
- 参考スコア(独自算出の注目度): 74.59088755185307
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Robust watermarking is typically trained with random post-processing augmentation, but random sampling under-covers the combinatorial space of realistic attack pipelines and rarely encounters the rare compositions that actually break detection. This leads to unstable training and poor sample efficiency. We instead formulate watermark robustness as a min-max problem over a structured space of compositional transformations. We propose Compositional Adversarial Training (CAT), a plug-in framework that learns a sequential differentiable adversary that observes the current watermarked image and selects an attack family at each step to maximally disrupt message recovery. CAT combines a straight-through Gumbel-Softmax attack selection with entropy regularization, allowing the backward pass to be end-to-end differentiable and aggregate gradient information across attack families, yielding faster, smoother convergence without collapsing to a single attack mode. We evaluate CAT on post-generation watermarks VideoSeal 0.0, VideoSeal 1.0, and PixelSeal and in-generation WMAR under both single-step and two-step attack suites, on in-distribution and multiple out-of-distribution image and video benchmarks. CAT consistently outperforms random-augmentation baselines trained with the same augmentation budget, with the largest gains on hard composed attacks and OOD evaluations; improving overall watermark capacity by up to $63.5\%$ in the single-step attack setting and $13.0\%$ in the compositional setting. In the autoregressive setting, CAT improves the TPR@FPR$=1\%$ by $12\%$ on average on difficult geometric transformations. These results show that robust visual watermarking benefits from training against adaptive compositional adversaries rather than independent random corruptions.
- Abstract(参考訳): ロバストな透かしは、通常ランダムな後処理の強化で訓練されるが、ランダムなサンプリングは現実的な攻撃パイプラインの組合せ空間を覆い隠しており、検出を実際に破壊する稀な組成に遭遇することは滅多にない。
これは不安定なトレーニングとサンプル効率の低下につながります。
代わりに、構成変換の構造化空間上のmin-max問題としてウォーターマークロバストネスを定式化する。
本稿では,現在の透かし画像を観察し,各ステップで攻撃群を選択してメッセージ回復を最大に破壊する,逐次微分可能な逆処理を学習するプラグインフレームワークであるComposeal Adversarial Training (CAT)を提案する。
CATは、ストレートスルーのGumbel-Softmax攻撃選択とエントロピー正規化を組み合わせることで、後方パスをエンド・ツー・エンドの差別化可能とし、攻撃ファミリー間で勾配情報を集約し、単一の攻撃モードに崩壊することなくより高速でスムーズな収束を得る。
我々は,ポスト世代のウォーターマークであるVideoSeal 0.0,VideoSeal 1.0,PixelSealおよびPixelSealおよびWMARを,シングルステップおよび2ステップのアタック・スイート,イン・ディストリビューションおよび複数のアウト・オブ・ディストリビューション・イメージおよびビデオ・ベンチマークで評価した。
CATは、同じ拡張予算でトレーニングされたランダム拡張ベースラインを一貫して上回り、ハードコンポジション攻撃とOOD評価で最大の利益を上げ、シングルステップ攻撃設定で最大63.5\%、構成設定で最大13.0\%の全体的な透かし容量を改善する。
自己回帰的な設定では、CATは難しい幾何学的変換の平均でTPR@FPR$=1\%$を12\%$に改善する。
これらの結果から,無作為なランダムな汚職ではなく,適応的な構成上の敵に対するトレーニングによる堅牢な視覚的透かしの利点が示唆された。
関連論文リスト
- Make the Most of Everything: Further Considerations on Disrupting Diffusion-based Customization [11.704329867109237]
拡散カスタマイズを目的とした2段階の対向攻撃であるDual Anti-Diffusion (DADiff)を提案する。
様々な主流の顔データセットに対する実験結果は、クロスプロンプト、キーワードミスマッチ、クロスモデル、クロスメカニズムのアンチカストマイゼーションにおいて10%-30%の改善が示されている。
論文 参考訳(メタデータ) (2025-03-18T06:22:03Z) - Meta Invariance Defense Towards Generalizable Robustness to Unknown Adversarial Attacks [62.036798488144306]
現在の防衛は主に既知の攻撃に焦点を当てているが、未知の攻撃に対する敵意の強固さは見過ごされている。
メタ不変防衛(Meta Invariance Defense, MID)と呼ばれる攻撃非依存の防御手法を提案する。
MIDは高レベルの画像分類と低レベルの頑健な画像再生における攻撃抑制において,知覚不能な逆方向の摂動に対して同時に頑健性を実現する。
論文 参考訳(メタデータ) (2024-04-04T10:10:38Z) - Class-Conditioned Transformation for Enhanced Robust Image Classification [19.738635819545554]
本稿では,Adrial-versa-Trained (AT)モデルを強化する新しいテスト時間脅威モデルを提案する。
コンディショナル・イメージ・トランスフォーメーションとディスタンス・ベース・予測(CODIP)を用いて動作する。
提案手法は,様々なモデル,ATメソッド,データセット,アタックタイプに関する広範な実験を通じて,最先端の成果を実証する。
論文 参考訳(メタデータ) (2023-03-27T17:28:20Z) - Robust Contrastive Language-Image Pre-training against Data Poisoning
and Backdoor Attacks [52.26631767748843]
ROCLIPは、ターゲットデータ中毒やバックドア攻撃に対して、マルチモーダル視覚言語モデルを堅牢に学習するための最初の効果的な方法である。
ROCLIPは、比較的大きく多様なランダムキャプションのプールを考慮することにより、有毒な撮像対の関連を効果的に破壊する。
実験の結果,ROCLIPは訓練前のCLIPモデルにおいて,最先端のデータ中毒やバックドア攻撃を未然に防ぐことができることがわかった。
論文 参考訳(メタデータ) (2023-03-13T04:49:46Z) - Fast Adversarial Training with Adaptive Step Size [62.37203478589929]
トレーニングインスタンスの観点から,この現象を考察する。
適応ステップサイズ(ATAS)を用いた逆学習法を提案する。
ATASは、その勾配ノルムに逆比例するインスタンス順応的なステップサイズを学習する。
論文 参考訳(メタデータ) (2022-06-06T08:20:07Z) - Towards Compositional Adversarial Robustness: Generalizing Adversarial
Training to Composite Semantic Perturbations [70.05004034081377]
まず,合成逆数例を生成する新しい手法を提案する。
本手法は, コンポーネントワイド射影勾配勾配を利用して最適攻撃組成を求める。
次に,モデルロバスト性を$ell_p$-ballから複合意味摂動へ拡張するための一般化逆トレーニング(GAT)を提案する。
論文 参考訳(メタデータ) (2022-02-09T02:41:56Z) - Robustness-via-Synthesis: Robust Training with Generative Adversarial
Perturbations [10.140147080535224]
先制攻撃による敵の訓練は、今日の敵の摂動に対する最も効果的な防御の1つである。
本研究では, 逆方向の摂動を自動的にランダムなベクトルから生成ネットワークを用いて合成する頑健な学習アルゴリズムを提案する。
実験結果から, 提案手法は様々な勾配に基づく, 生成的ロバストトレーニング手法により, 同等のロバスト性が得られることがわかった。
論文 参考訳(メタデータ) (2021-08-22T13:15:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。