論文の概要: Multi-bit Audio Watermarking
- arxiv url: http://arxiv.org/abs/2510.01968v1
- Date: Thu, 02 Oct 2025 12:41:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.128187
- Title: Multi-bit Audio Watermarking
- Title(参考訳): マルチビットオーディオ透かし
- Authors: Luca A. Lanzendörfer, Kyle Fearne, Florian Grötschla, Roger Wattenhofer,
- Abstract要約: 我々は,組込み型検出器モデルを訓練することなく,最先端のロバスト性と非受容性トレードオフを実現する,ポストホック音声透かしモデルTimbruを提案する。
提案手法は,知覚品質を保ちながら,最高の平均ビット誤り率を達成し,認識不能な音声透かしへの効率的なデータセットフリーパスを示す。
- 参考スコア(独自算出の注目度): 38.40457780873775
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Timbru, a post-hoc audio watermarking model that achieves state-of-the-art robustness and imperceptibility trade-offs without training an embedder-detector model. Given any 44.1 kHz stereo music snippet, our method performs per-audio gradient optimization to add imperceptible perturbations in the latent space of a pretrained audio VAE, guided by a combined message and perceptual loss. The watermark can then be extracted using a pretrained CLAP model. We evaluate 16-bit watermarking on MUSDB18-HQ against AudioSeal, WavMark, and SilentCipher across common filtering, noise, compression, resampling, cropping, and regeneration attacks. Our approach attains the best average bit error rates, while preserving perceptual quality, demonstrating an efficient, dataset-free path to imperceptible audio watermarking.
- Abstract(参考訳): 我々は,組込み型検出器モデルを訓練することなく,最先端のロバスト性と非受容性トレードオフを実現する,ポストホック音声透かしモデルTimbruを提案する。
44.1kHzのステレオ音楽スニペットが与えられた場合、事前訓練されたオーディオVAEの潜時空間に知覚不能な摂動を加えるために、音声ごとの勾配最適化を行う。
次に、予め訓練されたCLAPモデルを用いて、透かしを抽出することができる。
MUSDB18-HQのAudioSeal, WavMark, SilentCipherに対する16ビット透かしを, 一般的なフィルタリング, ノイズ, 圧縮, 再サンプリング, 収穫, 再生攻撃で評価した。
提案手法は,知覚品質を保ちながら,最高の平均ビット誤り率を達成し,認識不能な音声透かしへの効率的なデータセットフリーパスを示す。
関連論文リスト
- A Comprehensive Real-World Assessment of Audio Watermarking Algorithms: Will They Survive Neural Codecs? [21.111812193733982]
RAW-Benchは、ディープラーニングベースのオーディオ透かし手法を評価するためのベンチマークである。
圧縮,背景雑音,残響などの様々な歪みを伴う包括的オーディオアタックパイプラインを導入する。
極性インバージョン、時間伸張、あるいはリバーブのような特定の歪みが、特定の方法に深刻な影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2025-05-26T08:21:58Z) - XAttnMark: Learning Robust Audio Watermarking with Cross-Attention [15.216472445154064]
クロスアテンションロバスト音響透かし(XAttnMark)
本稿では,ジェネレータと検出器間の部分パラメータ共有を利用してギャップを埋めるクロスアテンションロバスト音響透かし(XAttnMark)を提案する。
本研究では, 聴覚マスキング効果の微粒化を捉え, 透かしの受容性を向上する心理音響整列型時間周波数マスキング障害を提案する。
論文 参考訳(メタデータ) (2025-02-06T17:15:08Z) - AudioMarkBench: Benchmarking Robustness of Audio Watermarking [38.25450275151647]
本稿では,透かし除去と透かし偽造に対する音響透かしの堅牢性を評価するための最初の体系的ベンチマークであるAudioMarkBenchを紹介する。
以上の結果から,従来の透かし手法の脆弱性を強調し,より堅牢で公正な透かしソリューションの必要性を強調した。
論文 参考訳(メタデータ) (2024-06-11T06:18:29Z) - Proactive Detection of Voice Cloning with Localized Watermarking [50.13539630769929]
本稿では,AI生成音声の局所検出に特化して設計された,最初の音声透かし技術であるAudioSealを紹介する。
AudioSealは、ローカライゼーションロスと共同でトレーニングされたジェネレータ/検出器アーキテクチャを使用して、サンプルレベルまでローカライズされた透かし検出を可能にする。
AudioSealは、実生活のオーディオ操作に対する堅牢性と、自動的および人的評価指標に基づく非知覚性の観点から、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-30T18:56:22Z) - WavMark: Watermarking for Audio Generation [70.65175179548208]
本稿では,わずか1秒の音声スニペット内に最大32ビットの透かしを符号化する,革新的な音声透かしフレームワークを提案する。
透かしは人間の感覚に影響されず、様々な攻撃に対して強い弾力性を示す。
合成音声の効果的な識別子として機能し、オーディオ著作権保護の幅広い応用の可能性を秘めている。
論文 参考訳(メタデータ) (2023-08-24T13:17:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。