論文の概要: HarmonicAttack: An Adaptive Cross-Domain Audio Watermark Removal
- arxiv url: http://arxiv.org/abs/2511.21577v1
- Date: Wed, 26 Nov 2025 16:51:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:59.206841
- Title: HarmonicAttack: An Adaptive Cross-Domain Audio Watermark Removal
- Title(参考訳): HarmonicAttack:適応型クロスドメインオーディオ透かし除去
- Authors: Kexin Li, Xiao Hu, Ilya Grishchenko, David Lie,
- Abstract要約: AI生成オーディオの誤用に対する重要な防御は、それを透かし、本物のオーディオと容易に区別できるようにすることである。
従来の透かし除去方式は、取り外すために設計された透かしの非現実的な知識を前提とするか、計算的に高価である。
本稿では,ハイモニックアタック(HarmonicAttack)について紹介する。
- 参考スコア(独自算出の注目度): 12.931496380963802
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The availability of high-quality, AI-generated audio raises security challenges such as misinformation campaigns and voice-cloning fraud. A key defense against the misuse of AI-generated audio is by watermarking it, so that it can be easily distinguished from genuine audio. As those seeking to misuse AI-generated audio may thus seek to remove audio watermarks, studying effective watermark removal techniques is critical to being able to objectively evaluate the robustness of audio watermarks against removal. Previous watermark removal schemes either assume impractical knowledge of the watermarks they are designed to remove or are computationally expensive, potentially generating a false sense of confidence in current watermark schemes. We introduce HarmonicAttack, an efficient audio watermark removal method that only requires the basic ability to generate the watermarks from the targeted scheme and nothing else. With this, we are able to train a general watermark removal model that is able to remove the watermarks generated by the targeted scheme from any watermarked audio sample. HarmonicAttack employs a dual-path convolutional autoencoder that operates in both temporal and frequency domains, along with GAN-style training, to separate the watermark from the original audio. When evaluated against state-of-the-art watermark schemes AudioSeal, WavMark, and Silentcipher, HarmonicAttack demonstrates greater watermark removal ability than previous watermark removal methods with near real-time performance. Moreover, while HarmonicAttack requires training, we find that it is able to transfer to out-of-distribution samples with minimal degradation in performance.
- Abstract(参考訳): 高品質のAI生成オーディオが利用可能になったことで、誤情報キャンペーンや音声閉鎖詐欺といったセキュリティ上の課題が提起される。
AI生成オーディオの誤用に対する重要な防御は、それを透かし、本物のオーディオと容易に区別できるようにすることである。
したがって、AI生成音声を誤用しようとする者は、音声透かしを除去しようとする可能性があるため、効果的な透かし除去技術を研究することは、音声透かしの除去に対する頑健さを客観的に評価する上で重要である。
以前の透かし除去スキームは、それらが取り除くように設計された透かしの非現実的な知識を前提とするか、あるいは計算的に高価であると仮定し、現在の透かしのスキームに誤った信頼感を生じさせる可能性がある。
提案手法では,提案手法から電子透かしを生成できる基本的な機能しか必要としない,効率的な音声透かし除去手法であるHarmonicAttackを導入する。
これにより、任意の透かしサンプルからターゲットスキームが生成した透かしを除去できる一般的な透かし除去モデルを訓練することができる。
HarmonicAttackは、時間領域と周波数領域の両方で動作するデュアルパス畳み込みオートエンコーダと、GANスタイルのトレーニングを使用して、透かしと元のオーディオを分離する。
最先端の透かしスキームであるAudioSeal,WavMark,Silentcipherに対して評価すると,HarmonicAttackは従来の透かし除去法よりも,ほぼリアルタイムな性能で優れた透かし除去能力を示す。
さらに、HarmonicAttackはトレーニングを必要とするが、パフォーマンスの低下を最小限に抑えながら、配布外サンプルに転送できることが判明した。
関連論文リスト
- Robust and Minimally Invasive Watermarking for EaaS [50.08021440235581]
組み込み・アズ・ア・サービス(Eding)はAIアプリケーションにおいて重要な役割を担っている。
編集はモデル抽出攻撃に対して脆弱であり、著作権保護の必要性を強調している。
そこで我々は,Edingの著作権保護を堅牢にするための新しい埋め込み専用透かし (ESpeW) 機構を提案する。
論文 参考訳(メタデータ) (2024-10-23T04:34:49Z) - Image Watermarks are Removable Using Controllable Regeneration from Clean Noise [26.09012436917272]
透かし技法の重要な特徴は、様々な操作に対する頑丈さである。
本稿では,最先端の透かし手法を効果的に無効化できる透かし除去手法を提案する。
本手法は,既存の再生手法と比較して,視覚的整合性/品質の向上と透かし除去性能の向上を実現している。
論文 参考訳(メタデータ) (2024-10-07T20:04:29Z) - AudioMarkBench: Benchmarking Robustness of Audio Watermarking [38.25450275151647]
本稿では,透かし除去と透かし偽造に対する音響透かしの堅牢性を評価するための最初の体系的ベンチマークであるAudioMarkBenchを紹介する。
以上の結果から,従来の透かし手法の脆弱性を強調し,より堅牢で公正な透かしソリューションの必要性を強調した。
論文 参考訳(メタデータ) (2024-06-11T06:18:29Z) - WavMark: Watermarking for Audio Generation [70.65175179548208]
本稿では,わずか1秒の音声スニペット内に最大32ビットの透かしを符号化する,革新的な音声透かしフレームワークを提案する。
透かしは人間の感覚に影響されず、様々な攻撃に対して強い弾力性を示す。
合成音声の効果的な識別子として機能し、オーディオ著作権保護の幅広い応用の可能性を秘めている。
論文 参考訳(メタデータ) (2023-08-24T13:17:35Z) - Invisible Image Watermarks Are Provably Removable Using Generative AI [47.25747266531665]
Invisibleの透かしは、所有者によってのみ検出可能な隠されたメッセージを埋め込むことで、画像の著作権を保護する。
我々は、これらの見えない透かしを取り除くために、再生攻撃のファミリーを提案する。
提案手法は,まず画像にランダムノイズを加えて透かしを破壊し,画像を再構成する。
論文 参考訳(メタデータ) (2023-06-02T23:29:28Z) - Certified Neural Network Watermarks with Randomized Smoothing [64.86178395240469]
本稿では,ディープラーニングモデルのための認証型透かし手法を提案する。
我々の透かしは、モデルパラメータが特定のl2しきい値以上変更されない限り、取り外し不可能であることが保証されている。
私たちの透かしは、従来の透かし法に比べて経験的に頑丈です。
論文 参考訳(メタデータ) (2022-07-16T16:06:59Z) - A Deep Learning-based Audio-in-Image Watermarking Scheme [1.1231577179316237]
本稿では,深層学習に基づく音声画像透かし方式を提案する。
ニューラルネットワークアーキテクチャは、教師なしの方法で透かしプロセスを自動的に学習するように設計されている。
実験結果から, ブラインド・イン・画像透かし方式の信頼性とロバスト性を示した。
論文 参考訳(メタデータ) (2021-10-06T00:46:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。