論文の概要: Self Voice Conversion as an Attack against Neural Audio Watermarking
- arxiv url: http://arxiv.org/abs/2601.20432v1
- Date: Wed, 28 Jan 2026 09:41:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-29 15:46:06.884084
- Title: Self Voice Conversion as an Attack against Neural Audio Watermarking
- Title(参考訳): ニューラルオーディオ透かし攻撃としての自己音声変換
- Authors: Yigitcan Özer, Wanying Ge, Zhe Zhang, Xin Wang, Junichi Yamagishi,
- Abstract要約: 音声透かしシステムに対するユニバーサル・コンテンツ保存攻撃としての自己音声変換について検討する。
この攻撃は最先端の透かし手法の信頼性を著しく低下させることを示した。
- 参考スコア(独自算出の注目度): 34.948149764638806
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Audio watermarking embeds auxiliary information into speech while maintaining speaker identity, linguistic content, and perceptual quality. Although recent advances in neural and digital signal processing-based watermarking methods have improved imperceptibility and embedding capacity, robustness is still primarily assessed against conventional distortions such as compression, additive noise, and resampling. However, the rise of deep learning-based attacks introduces novel and significant threats to watermark security. In this work, we investigate self voice conversion as a universal, content-preserving attack against audio watermarking systems. Self voice conversion remaps a speaker's voice to the same identity while altering acoustic characteristics through a voice conversion model. We demonstrate that this attack severely degrades the reliability of state-of-the-art watermarking approaches and highlight its implications for the security of modern audio watermarking techniques.
- Abstract(参考訳): 音声透かしは、話者のアイデンティティ、言語内容、知覚品質を維持しながら、補助情報を音声に埋め込む。
近年のニューラル信号処理とデジタル信号処理に基づく透かし法は, 知覚能力と埋め込み能力を改善しているが, 圧縮, 付加雑音, 再サンプリングなどの従来の歪みに対して, 頑健さが評価されている。
しかし、ディープラーニングベースの攻撃の台頭は、透かしのセキュリティに新しく重要な脅威をもたらす。
本研究では,音声透かしシステムに対するユニバーサル・コンテンツ保存攻撃としての自己音声変換について検討する。
自己音声変換は、音声変換モデルを用いて音響特性を変化させながら、話者の音声を同一のアイデンティティに再マップする。
この攻撃は、最先端の透かし手法の信頼性を著しく低下させ、現代の音声透かし技術の安全性にその影響を強調している。
関連論文リスト
- Yours or Mine? Overwriting Attacks against Neural Audio Watermarking [21.297468818273064]
我々は、正規の音声透かしを偽造で上書きする、シンプルだが強力な攻撃を開発する。
対戦相手が持つ音声透かし情報に基づいて,オーバライト攻撃の3つのカテゴリを提案する。
実験により,提案したオーバーライト攻撃が既存の透かし方式を効果的に損なうことを示した。
論文 参考訳(メタデータ) (2025-09-06T21:23:44Z) - XAttnMark: Learning Robust Audio Watermarking with Cross-Attention [15.216472445154064]
クロスアテンションロバスト音響透かし(XAttnMark)
本稿では,ジェネレータと検出器間の部分パラメータ共有を利用してギャップを埋めるクロスアテンションロバスト音響透かし(XAttnMark)を提案する。
本研究では, 聴覚マスキング効果の微粒化を捉え, 透かしの受容性を向上する心理音響整列型時間周波数マスキング障害を提案する。
論文 参考訳(メタデータ) (2025-02-06T17:15:08Z) - AudioMarkBench: Benchmarking Robustness of Audio Watermarking [38.25450275151647]
本稿では,透かし除去と透かし偽造に対する音響透かしの堅牢性を評価するための最初の体系的ベンチマークであるAudioMarkBenchを紹介する。
以上の結果から,従来の透かし手法の脆弱性を強調し,より堅牢で公正な透かしソリューションの必要性を強調した。
論文 参考訳(メタデータ) (2024-06-11T06:18:29Z) - Proactive Detection of Voice Cloning with Localized Watermarking [50.13539630769929]
本稿では,AI生成音声の局所検出に特化して設計された,最初の音声透かし技術であるAudioSealを紹介する。
AudioSealは、ローカライゼーションロスと共同でトレーニングされたジェネレータ/検出器アーキテクチャを使用して、サンプルレベルまでローカライズされた透かし検出を可能にする。
AudioSealは、実生活のオーディオ操作に対する堅牢性と、自動的および人的評価指標に基づく非知覚性の観点から、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-30T18:56:22Z) - WavMark: Watermarking for Audio Generation [70.65175179548208]
本稿では,わずか1秒の音声スニペット内に最大32ビットの透かしを符号化する,革新的な音声透かしフレームワークを提案する。
透かしは人間の感覚に影響されず、様々な攻撃に対して強い弾力性を示す。
合成音声の効果的な識別子として機能し、オーディオ著作権保護の幅広い応用の可能性を秘めている。
論文 参考訳(メタデータ) (2023-08-24T13:17:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。