論文の概要: VideoMark: A Distortion-Free Robust Watermarking Framework for Video Diffusion Models
- arxiv url: http://arxiv.org/abs/2504.16359v2
- Date: Mon, 23 Jun 2025 14:08:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.276644
- Title: VideoMark: A Distortion-Free Robust Watermarking Framework for Video Diffusion Models
- Title(参考訳): VideoMark:ビデオ拡散モデルのための歪みのないロバストな透かしフレームワーク
- Authors: Xuming Hu, Hanqian Li, Jungang Li, Yu Huang, Aiwei Liu,
- Abstract要約: VideoMarkは、ビデオ拡散モデルのための歪みのない堅牢な透かしフレームワークである。
固定された透かしシーケンスを用いて擬似乱数誤り訂正(PRC)符号を用いたフレームワイド透かし方式を用いる。
透かし抽出のために,編集距離を利用して復号されたメッセージと元の透かしシーケンスを整列する時間マッチングモジュール(TMM)を提案する。
- 参考スコア(独自算出の注目度): 18.427936201177122
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work introduces \textbf{VideoMark}, a distortion-free robust watermarking framework for video diffusion models. As diffusion models excel in generating realistic videos, reliable content attribution is increasingly critical. However, existing video watermarking methods often introduce distortion by altering the initial distribution of diffusion variables and are vulnerable to temporal attacks, such as frame deletion, due to variable video lengths. VideoMark addresses these challenges by employing a \textbf{pure pseudorandom initialization} to embed watermarks, avoiding distortion while ensuring uniform noise distribution in the latent space to preserve generation quality. To enhance robustness, we adopt a frame-wise watermarking strategy with pseudorandom error correction (PRC) codes, using a fixed watermark sequence with randomly selected starting indices for each video. For watermark extraction, we propose a Temporal Matching Module (TMM) that leverages edit distance to align decoded messages with the original watermark sequence, ensuring resilience against temporal attacks. Experimental results show that VideoMark achieves higher decoding accuracy than existing methods while maintaining video quality comparable to watermark-free generation. The watermark remains imperceptible to attackers without the secret key, offering superior invisibility compared to other frameworks. VideoMark provides a practical, training-free solution for content attribution in diffusion-based video generation. Code and data are available at \href{https://github.com/KYRIE-LI11/VideoMark}{https://github.com/KYRIE-LI11/VideoMark}{Project Page}.
- Abstract(参考訳): この研究は、ビデオ拡散モデルのための歪みのないロバストな透かしフレームワークである \textbf{VideoMark} を紹介する。
拡散モデルがリアルなビデオ生成に優れているため、信頼性の高いコンテンツ帰属がますます重要になっている。
しかし、既存のビデオ透かし手法は、拡散変数の初期分布を変えて歪みを起こすことが多く、ビデオ長の変化によるフレーム削除などの時間的攻撃に弱い。
VideoMarkはこれらの課題に対処し、textbf{pure pseudorandom initialization} を用いて透かしを埋め込み、歪みを回避し、潜在空間における均一なノイズ分布を確保して生成品質を維持する。
頑健性を高めるために,ビデオ毎にランダムに選択された開始指標を持つ固定された透かしシーケンスを用いて,擬似ランダム誤り訂正(PRC)符号を用いたフレームワイド透かし方式を採用する。
透かし抽出には、編集距離を利用して復号されたメッセージを元の透かしシーケンスと整列させ、時間的攻撃に対する弾力性を確保する時間的マッチングモジュール(TMM)を提案する。
実験の結果,ビデオMarkは透かしのない生成に匹敵する画質を維持しつつ,既存の手法よりも高い復号精度を実現していることがわかった。
この透かしはシークレットキーを使わずに攻撃者には認識できないままであり、他のフレームワークと比べて視認性が優れている。
VideoMarkは、拡散ベースのビデオ生成におけるコンテンツ属性に対する実践的でトレーニング不要なソリューションを提供する。
コードとデータは \href{https://github.com/KYRIE-LI11/VideoMark}{https://github.com/KYRIE-LI11/VideoMark}{Project Page} で公開されている。
関連論文リスト
- VideoShield: Regulating Diffusion-based Video Generation Models via Watermarking [27.345134138673945]
VideoShieldはビデオ生成モデルのための新しい透かしフレームワークである。
後処理の方法とは異なり、VideoShieldはビデオ生成中に直接透かしを埋め込む。
ビデオの整合性を確保するため,タンパーのローカライゼーション機能を導入する。
論文 参考訳(メタデータ) (2025-01-24T02:57:09Z) - SuperMark: Robust and Training-free Image Watermarking via Diffusion-based Super-Resolution [27.345134138673945]
我々は、堅牢でトレーニング不要な透かしフレームワークであるSuperMarkを提案する。
SuperMarkは既存の手法を使って初期ガウスノイズに透かしを埋め込む。
次に、トレーニング済みの超解像モデルを適用して、透かしのノイズを消音し、最終的な透かしの画像を生成する。
抽出には、透かし画像がDDIM変換により初期透かしノイズに逆戻りされ、埋め込み透かしが抽出される。
実験により、SuperMarkは既存のメソッドに匹敵する忠実性を達成し、ロバスト性を大幅に改善した。
論文 参考訳(メタデータ) (2024-12-13T11:20:59Z) - Video Seal: Open and Efficient Video Watermarking [47.40833588157406]
ビデオ透かしは、認識不能な信号をビデオに埋め込むことによって、課題に対処する。
Video Sealは、ニューラルビデオ透かしのための包括的なフレームワークであり、競合するオープンソースモデルである。
提案手法の有効性を, 速度, 不受容性, 頑健性の観点から実験的に検証した。
論文 参考訳(メタデータ) (2024-12-12T17:41:49Z) - LVMark: Robust Watermark for Latent Video Diffusion Models [13.85241328100336]
ビデオ拡散モデルのための新しい透かし手法であるLVMarkを紹介する。
本稿では,隣接するフレーム間の一貫性を学習し,生成ビデオに適した新しい透かしデコーダを提案する。
拡散モデルの透かしデコーダと潜時デコーダの両方を最適化し、視覚的品質とビット精度のトレードオフを効果的にバランスさせる。
論文 参考訳(メタデータ) (2024-12-12T09:57:20Z) - SleeperMark: Towards Robust Watermark against Fine-Tuning Text-to-image Diffusion Models [77.80595722480074]
SleeperMarkは、回復力のある透かしをT2I拡散モデルに埋め込むように設計されたフレームワークである。
学習したセマンティックな概念から透かし情報を切り離すようモデルに誘導する。
各種拡散モデルにおけるSleeperMarkの有効性について実験を行った。
論文 参考訳(メタデータ) (2024-12-06T08:44:18Z) - Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation [54.21476271127356]
Divotは拡散駆動型ビデオトケナイザである。
我々は、ビデオからテキストへの自己回帰とテキストからビデオへの生成を通じてDivot-unaVicを提示する。
論文 参考訳(メタデータ) (2024-12-05T18:53:04Z) - DiffuseTrace: A Transparent and Flexible Watermarking Scheme for Latent Diffusion Model [15.982765272033058]
潜在拡散モデル(LDM)は幅広い応用を可能にするが、違法利用に関する倫理的懸念を提起する。
DiffuseTraceと呼ばれる新しいテクニックは、すべての生成された画像に見えない透かしを埋め込んで、将来的な検出を意味づける。
論文 参考訳(メタデータ) (2024-05-04T15:32:57Z) - VidToMe: Video Token Merging for Zero-Shot Video Editing [100.79999871424931]
本稿では,フレーム間で自己注意トークンをマージすることで,生成ビデオの時間的一貫性を高める新しい手法を提案する。
本手法は時間的コヒーレンスを改善し,自己アテンション計算におけるメモリ消費を削減する。
論文 参考訳(メタデータ) (2023-12-17T09:05:56Z) - Tree-Ring Watermarks: Fingerprints for Diffusion Images that are
Invisible and Robust [55.91987293510401]
生成モデルのアウトプットを透かしは、著作権をトレースし、AI生成コンテンツによる潜在的な害を防ぐ重要なテクニックである。
本稿では,拡散モデル出力を頑健にフィンガープリントするTree-Ring Watermarkingという新しい手法を提案する。
私たちの透かしは画像空間に意味的に隠れており、現在デプロイされている透かしよりもはるかに堅牢です。
論文 参考訳(メタデータ) (2023-05-31T17:00:31Z) - Certified Neural Network Watermarks with Randomized Smoothing [64.86178395240469]
本稿では,ディープラーニングモデルのための認証型透かし手法を提案する。
我々の透かしは、モデルパラメータが特定のl2しきい値以上変更されない限り、取り外し不可能であることが保証されている。
私たちの透かしは、従来の透かし法に比べて経験的に頑丈です。
論文 参考訳(メタデータ) (2022-07-16T16:06:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。