論文の概要: VideoMark: A Distortion-Free Robust Watermarking Framework for Video Diffusion Models
- arxiv url: http://arxiv.org/abs/2504.16359v1
- Date: Wed, 23 Apr 2025 02:21:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:52.976586
- Title: VideoMark: A Distortion-Free Robust Watermarking Framework for Video Diffusion Models
- Title(参考訳): VideoMark:ビデオ拡散モデルのための歪みのないロバストな透かしフレームワーク
- Authors: Xuming Hu, Hanqian Li, Jungang Li, Aiwei Liu,
- Abstract要約: VideoMarkは、ビデオ拡散モデルのためのトレーニング不要の堅牢な透かしフレームワークである。
提案手法は拡張された透かしメッセージ列を生成し,各ビデオの開始位置をランダムに選択する。
我々の透かしはシークレットキーなしで攻撃者には検出できないままであり、他の透かしフレームワークと比較して強い非知覚性を保証する。
- 参考スコア(独自算出の注目度): 18.043141353517317
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work presents VideoMark, a training-free robust watermarking framework for video diffusion models. As diffusion models advance in generating highly realistic videos, the need for reliable content attribution mechanisms has become critical. While watermarking techniques for image diffusion models have made progress, directly extending these methods to videos presents unique challenges due to variable video lengths and vulnerability to temporal attacks. VideoMark addresses these limitations through a frame-wise watermarking strategy using pseudorandom error correction (PRC) codes to embed watermark information during the generation process. Our method generates an extended watermark message sequence and randomly selects starting positions for each video, ensuring uniform noise distribution in the latent space and maintaining generation quality. For watermark extraction, we introduce a Temporal Matching Module (TMM) that uses edit distance to align decoded messages with the original watermark sequence, providing robustness against temporal attacks such as frame deletion. Experimental results demonstrate that VideoMark achieves higher decoding accuracy than existing methods while maintaining video quality on par with watermark-free generation. Importantly, our watermark remains undetectable to attackers without the secret key, ensuring strong imperceptibility compared to other watermarking frameworks. VideoMark provides a practical solution for content attribution in diffusion-based video generation without requiring additional training or compromising video quality. Our code and data are available at \href{https://github.com/KYRIE-LI11/VideoMark}{https://github.com/KYRIE-LI11/VideoMark}.
- Abstract(参考訳): この研究は、ビデオ拡散モデルのためのトレーニング不要な堅牢な透かしフレームワークであるVideoMarkを提示する。
拡散モデルが高度にリアルなビデオの生成に発展するにつれて、信頼性の高いコンテンツ帰属機構の必要性が重要になっている。
画像拡散モデルのための透かし技術は進歩してきたが、これらの手法を直接ビデオに拡張することは、ビデオ長の変化と時間的攻撃に対する脆弱性による固有の課題を示す。
VideoMarkは、擬似ランダムエラー訂正(PRC)コードを使用してフレームワイズな透かし戦略を通じてこれらの制限に対処し、生成プロセス中に透かし情報を埋め込む。
提案手法は拡張された透かしメッセージシーケンスを生成し、各ビデオの開始位置をランダムに選択し、遅延空間における均一なノイズ分布を確保し、生成品質を維持する。
透かし抽出には、編集距離を用いて復号されたメッセージを元の透かしシーケンスと整列させ、フレーム削除などの時間的攻撃に対して堅牢性を提供するTMM(Temporal Matching Module)を導入する。
実験により,ビデオMarkは,透かしのない生成に匹敵する画質を維持しつつ,既存の手法よりも高い復号精度を実現していることが示された。
重要なことは、我々の透かしはシークレットキーなしで攻撃者には検出不可能であり、他の透かしフレームワークと比較して強い非知覚性を保証する。
VideoMarkは、追加のトレーニングやビデオ品質の妥協を必要とせずに、拡散ベースのビデオ生成におけるコンテンツ属性の実用的なソリューションを提供する。
私たちのコードとデータは、 \href{https://github.com/KYRIE-LI11/VideoMark}{https://github.com/KYRIE-LI11/VideoMark}で利用可能です。
関連論文リスト
- VideoShield: Regulating Diffusion-based Video Generation Models via Watermarking [27.345134138673945]
VideoShieldはビデオ生成モデルのための新しい透かしフレームワークである。
後処理の方法とは異なり、VideoShieldはビデオ生成中に直接透かしを埋め込む。
ビデオの整合性を確保するため,タンパーのローカライゼーション機能を導入する。
論文 参考訳(メタデータ) (2025-01-24T02:57:09Z) - SuperMark: Robust and Training-free Image Watermarking via Diffusion-based Super-Resolution [27.345134138673945]
我々は、堅牢でトレーニング不要な透かしフレームワークであるSuperMarkを提案する。
SuperMarkは既存の手法を使って初期ガウスノイズに透かしを埋め込む。
次に、トレーニング済みの超解像モデルを適用して、透かしのノイズを消音し、最終的な透かしの画像を生成する。
抽出には、透かし画像がDDIM変換により初期透かしノイズに逆戻りされ、埋め込み透かしが抽出される。
実験により、SuperMarkは既存のメソッドに匹敵する忠実性を達成し、ロバスト性を大幅に改善した。
論文 参考訳(メタデータ) (2024-12-13T11:20:59Z) - Video Seal: Open and Efficient Video Watermarking [47.40833588157406]
ビデオ透かしは、認識不能な信号をビデオに埋め込むことによって、課題に対処する。
Video Sealは、ニューラルビデオ透かしのための包括的なフレームワークであり、競合するオープンソースモデルである。
提案手法の有効性を, 速度, 不受容性, 頑健性の観点から実験的に検証した。
論文 参考訳(メタデータ) (2024-12-12T17:41:49Z) - LVMark: Robust Watermark for Latent Video Diffusion Models [13.85241328100336]
ビデオ拡散モデルのための新しい透かし手法であるLVMarkを紹介する。
本稿では,隣接するフレーム間の一貫性を学習し,生成ビデオに適した新しい透かしデコーダを提案する。
拡散モデルの透かしデコーダと潜時デコーダの両方を最適化し、視覚的品質とビット精度のトレードオフを効果的にバランスさせる。
論文 参考訳(メタデータ) (2024-12-12T09:57:20Z) - SleeperMark: Towards Robust Watermark against Fine-Tuning Text-to-image Diffusion Models [77.80595722480074]
SleeperMarkは、回復力のある透かしをT2I拡散モデルに埋め込むように設計されたフレームワークである。
学習したセマンティックな概念から透かし情報を切り離すようモデルに誘導する。
各種拡散モデルにおけるSleeperMarkの有効性について実験を行った。
論文 参考訳(メタデータ) (2024-12-06T08:44:18Z) - Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation [54.21476271127356]
Divotは拡散駆動型ビデオトケナイザである。
我々は、ビデオからテキストへの自己回帰とテキストからビデオへの生成を通じてDivot-unaVicを提示する。
論文 参考訳(メタデータ) (2024-12-05T18:53:04Z) - DiffuseTrace: A Transparent and Flexible Watermarking Scheme for Latent Diffusion Model [15.982765272033058]
潜在拡散モデル(LDM)は幅広い応用を可能にするが、違法利用に関する倫理的懸念を提起する。
DiffuseTraceと呼ばれる新しいテクニックは、すべての生成された画像に見えない透かしを埋め込んで、将来的な検出を意味づける。
論文 参考訳(メタデータ) (2024-05-04T15:32:57Z) - VidToMe: Video Token Merging for Zero-Shot Video Editing [100.79999871424931]
本稿では,フレーム間で自己注意トークンをマージすることで,生成ビデオの時間的一貫性を高める新しい手法を提案する。
本手法は時間的コヒーレンスを改善し,自己アテンション計算におけるメモリ消費を削減する。
論文 参考訳(メタデータ) (2023-12-17T09:05:56Z) - Tree-Ring Watermarks: Fingerprints for Diffusion Images that are
Invisible and Robust [55.91987293510401]
生成モデルのアウトプットを透かしは、著作権をトレースし、AI生成コンテンツによる潜在的な害を防ぐ重要なテクニックである。
本稿では,拡散モデル出力を頑健にフィンガープリントするTree-Ring Watermarkingという新しい手法を提案する。
私たちの透かしは画像空間に意味的に隠れており、現在デプロイされている透かしよりもはるかに堅牢です。
論文 参考訳(メタデータ) (2023-05-31T17:00:31Z) - Certified Neural Network Watermarks with Randomized Smoothing [64.86178395240469]
本稿では,ディープラーニングモデルのための認証型透かし手法を提案する。
我々の透かしは、モデルパラメータが特定のl2しきい値以上変更されない限り、取り外し不可能であることが保証されている。
私たちの透かしは、従来の透かし法に比べて経験的に頑丈です。
論文 参考訳(メタデータ) (2022-07-16T16:06:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。