論文の概要: SyncGuard: Robust Audio Watermarking Capable of Countering Desynchronization Attacks
- arxiv url: http://arxiv.org/abs/2508.17121v2
- Date: Mon, 01 Sep 2025 05:12:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-03 14:24:52.682118
- Title: SyncGuard: Robust Audio Watermarking Capable of Countering Desynchronization Attacks
- Title(参考訳): SyncGuard:非同期攻撃に対処できるロバストなオーディオ透かし
- Authors: Zhenliang Gan, Xiaoxiao Hu, Sheng Li, Zhenxing Qian, Xinpeng Zhang,
- Abstract要約: これらの課題に対処するため,SyncGuardという学習型スキームを提案する。
具体的には、任意の長さのオーディオに透かしを埋め込むためのフレームワイド放送埋め込み方式を設計する。
さらに強靭性を高めるために,細かな設計による歪み層を導入する。
- 参考スコア(独自算出の注目度): 41.25345809241139
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Audio watermarking has been widely applied in copyright protection and source tracing. However, due to the inherent characteristics of audio signals, watermark localization and resistance to desynchronization attacks remain significant challenges. In this paper, we propose a learning-based scheme named SyncGuard to address these challenges. Specifically, we design a frame-wise broadcast embedding strategy to embed the watermark in arbitrary-length audio, enhancing time-independence and eliminating the need for localization during watermark extraction. To further enhance robustness, we introduce a meticulously designed distortion layer. Additionally, we employ dilated residual blocks in conjunction with dilated gated blocks to effectively capture multi-resolution time-frequency features. Extensive experimental results show that SyncGuard efficiently handles variable-length audio segments, outperforms state-of-the-art methods in robustness against various attacks, and delivers superior auditory quality.
- Abstract(参考訳): オーディオ透かしは著作権保護とソーストレースに広く応用されている。
しかし、音声信号の特性から、透かしの局所化と非同期化攻撃に対する耐性は依然として大きな課題である。
本稿では,これらの課題に対処するため,SyncGuardという学習型スキームを提案する。
具体的には、任意の長さのオーディオに透かしを埋め込むためのフレームワイド放送埋め込み方式を設計し、時間依存性を高め、透かし抽出時の局所化の必要性をなくす。
さらに強靭性を高めるために,細かな設計による歪み層を導入する。
さらに,拡張された残差ブロックと拡張されたゲートブロックを併用して,マルチレゾリューション時間周波数の特徴を効果的に捉える。
実験結果から,SyncGuardは可変長音声セグメントを効率的に処理し,様々な攻撃に対する堅牢性において最先端の手法より優れ,より優れた聴覚品質を提供することが示された。
関連論文リスト
- Video Signature: In-generation Watermarking for Latent Video Diffusion Models [18.347424463264606]
ビデオシグナチャ (VID SIG) は、遅延ビデオ拡散モデルのための次世代透かし方式である。
我々は、潜伏型デコーダを部分的に微調整し、PAS(Perturbation-Aware Suppression)が事前に識別し、知覚に敏感な層を凍結する。
実験結果から, VID SIGは透かし抽出, 視覚的品質, 生成効率において, 最高の総合的な性能を発揮することがわかった。
論文 参考訳(メタデータ) (2025-05-31T17:43:54Z) - Tuning-Free Multi-Event Long Video Generation via Synchronized Coupled Sampling [81.37449968164692]
ビデオ全体にわたってデノイングパスを同期する新しい推論フレームワークであるシンクロナイズド結合サンプリング(SynCoS)を提案する。
提案手法は, シームレスな局所遷移を保証し, グローバルコヒーレンスを強制する2つの相補的なサンプリング戦略を組み合わせる。
大規模な実験により、SynCoSは、よりスムーズな遷移とより優れた長距離コヒーレンスを実現し、マルチイベント長ビデオ生成を大幅に改善することが示された。
論文 参考訳(メタデータ) (2025-03-11T16:43:45Z) - XAttnMark: Learning Robust Audio Watermarking with Cross-Attention [15.216472445154064]
クロスアテンションロバスト音響透かし(XAttnMark)
本稿では,ジェネレータと検出器間の部分パラメータ共有を利用してギャップを埋めるクロスアテンションロバスト音響透かし(XAttnMark)を提案する。
本研究では, 聴覚マスキング効果の微粒化を捉え, 透かしの受容性を向上する心理音響整列型時間周波数マスキング障害を提案する。
論文 参考訳(メタデータ) (2025-02-06T17:15:08Z) - Proactive Detection of Voice Cloning with Localized Watermarking [50.13539630769929]
本稿では,AI生成音声の局所検出に特化して設計された,最初の音声透かし技術であるAudioSealを紹介する。
AudioSealは、ローカライゼーションロスと共同でトレーニングされたジェネレータ/検出器アーキテクチャを使用して、サンプルレベルまでローカライズされた透かし検出を可能にする。
AudioSealは、実生活のオーディオ操作に対する堅牢性と、自動的および人的評価指標に基づく非知覚性の観点から、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-30T18:56:22Z) - A DTCWT-SVD Based Video Watermarking resistant to frame rate conversion [27.591506014201546]
我々は、Dual-Tree Cosine Wavelet Transformation (DTCWT)とSingular Value Decomposition (SVD)を併用した新しいビデオ透かしを提案する。
我々は、時間的非同期攻撃に抵抗するために、適度な時間的冗長性を含むグループレベルの透かしを行う。
論文 参考訳(メタデータ) (2022-06-02T15:20:52Z) - Looking into Your Speech: Learning Cross-modal Affinity for Audio-visual
Speech Separation [73.1652905564163]
本稿では,音声-視覚的ニューラル処理を用いて音声信号と映像を分離する問題に対処する。
従来の手法では、フレームワイドマッチング基準を用いて、音声とビデオの共有情報を抽出する。
音声と視覚ストリーム間の局所的な親和性だけでなく,グローバル通信を学習するクロスモーダル親和性ネットワーク(CaffNet)を提案する。
論文 参考訳(メタデータ) (2021-03-25T15:39:12Z) - Towards Robust Speech-to-Text Adversarial Attack [78.5097679815944]
本稿では,DeepSpeech,Kaldi,Lingvoなど,最先端の音声テキストシステムに対する新たな逆アルゴリズムを提案する。
本手法は, 逆最適化定式化の従来の歪み条件の拡張を開発することに基づいている。
元のサンプルと反対のサンプルの分布の差を測定するこの測定値の最小化は、正統な音声記録のサブスペースに非常に近い作成信号に寄与する。
論文 参考訳(メタデータ) (2021-03-15T01:51:41Z) - Adversarially Robust Streaming Algorithms via Differential Privacy [68.3608356069755]
データストリームが不正に選択された場合でも、その精度保証が維持されている場合、ストリーミングアルゴリズムは逆向きに堅牢であると言われている。
ストリーミングアルゴリズムの逆強靭性と差分プライバシーの概念の関連性を確立する。
論文 参考訳(メタデータ) (2020-04-13T14:49:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。