論文の概要: Hidden in Plain Tokens: Simply Robust, Gradient-Free Watermark for Synthetic Audio
- arxiv url: http://arxiv.org/abs/2605.25967v1
- Date: Mon, 25 May 2026 15:43:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:20.443319
- Title: Hidden in Plain Tokens: Simply Robust, Gradient-Free Watermark for Synthetic Audio
- Title(参考訳): シンプルなロバストでグラディエントな透かしのない合成音声
- Authors: Georgios Milis, Yubin Qin, Yihan Wu, Heng Huang,
- Abstract要約: 自己回帰モデルに対する推論時透かしは、離散化の不整合による連続的なモダリティには適さない。
合成音声の強力で堅牢な透かしのためのエレガントな解法を提案する。
- 参考スコア(独自算出の注目度): 58.612001688217056
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As policy catches up with the capabilities of generative AI, watermarking is central to content provenance efforts. Inference-time watermarks for autoregressive models are unfit for continuous modalities due to discretization inconsistencies. Existing methods overcome this by finetuning the modality tokenizers, nullifying the watermark's training-free advantage. In this work, motivated by the vocabulary redundancy of discretization, we propose an elegant solution for powerful and robust watermarking of synthetic audio. We theoretically analyze the impact of token errors on watermark detection, and effectively mitigate them using a reduced vocabulary obtained via community detection. Thorough experiments showcase that our gradient-free method can boost detectability by several orders of magnitude, while also achieving built-in robustness to audio modifications. Broadly, we discover a new state-of-the-art for token-level watermarks in multimedia, which simply arises from the nature of discrete representation learning.
- Abstract(参考訳): 政策が生成的AIの能力に追いつくにつれ、透かしはコンテンツ実証活動の中心となる。
自己回帰モデルに対する推論時透かしは、離散化の不整合による連続的なモダリティには適さない。
既存の手法では、モダリティトークン化器を微調整し、ウォーターマークのトレーニング不要の利点を無効にすることでこれを克服している。
本研究は,音声認識の語彙冗長性に動機付けられ,合成音声の強力で堅牢な透かしのためのエレガントな解法を提案する。
トークンエラーが透かし検出に与える影響を理論的に分析し,コミュニティ検出によって得られた語彙を削減して効果的に軽減する。
より詳細な実験により、我々の勾配のない手法は、音の修正に頑健さを組み込むとともに、数桁の精度で検出性を高めることができることが示された。
広くは、マルチメディアにおけるトークンレベルの透かしのための新しい最先端技術を発見し、これは単に離散表現学習の性質から生じるものである。
関連論文リスト
- More Haste, Less Speed: Weaker Single-Layer Watermark Improves Distortion-Free Watermark Ensembles [58.941305935872265]
強い透かしがトークン分布のエントロピーを著しく減少させることを示す。
本稿では,より弱い単一層透かしを用いて,効率的なマルチ層アンサンブルに必要なエントロピーを保存するフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-12T10:18:16Z) - Diffusion-Based Image Editing: An Unforeseen Adversary to Robust Invisible Watermarks [4.138397555991069]
強力な拡散ベースの画像生成と編集モデルは、埋め込みの透かしを不注意に取り除いたり歪んだりすることができる。
本稿では,拡散に基づく画像編集が,最先端のロバストな透かしを効果的に破壊できることを示す理論的,実証的な分析を行う。
画像から透かしを消去するために生成画像再生を用いた拡散誘導攻撃を提案する。
論文 参考訳(メタデータ) (2025-11-05T16:20:29Z) - Character-Level Perturbations Disrupt LLM Watermarks [64.60090923837701]
我々は,Large Language Model (LLM)ウォーターマーキングのためのシステムモデルを定式化する。
我々は、透かし検出器への限られたアクセスに制約された2つの現実的な脅威モデルの特徴付けを行う。
我々は,最も制限的な脅威モデルの下で,キャラクタレベルの摂動が透かし除去に著しく有効であることを実証した。
現実的な制約下での透かし除去における文字レベルの摂動の優位性と遺伝的アルゴリズム(GA)の有効性を実験的に検証した。
論文 参考訳(メタデータ) (2025-09-11T02:50:07Z) - Robust Watermarks Leak: Channel-Aware Feature Extraction Enables Adversarial Watermark Manipulation [21.41643665626451]
本稿では,事前学習された視覚モデルを用いて,透かしパターンの漏洩を抽出する攻撃フレームワークを提案する。
大量のデータや検出器のアクセスを必要とする従来の作業とは異なり,本手法は1つの透かし画像による偽造と検出の両方を達成している。
現在の"ロバスト"な透かしは、歪み抵抗に対するセキュリティを犠牲にして、将来の透かし設計の洞察を与えます。
論文 参考訳(メタデータ) (2025-02-10T12:55:08Z) - Speech Watermarking with Discrete Intermediate Representations [45.892635912641836]
本稿では,音声の中間表現に透かしを注入する新しい音声透かしフレームワークを提案する。
DiscreteWMは、堅牢性と非受容性を同時に実現します。
我々のフレキシブルなフレームワイドアプローチは、音声のクローン検出と情報隠蔽の両面において効率的な解決策となる。
論文 参考訳(メタデータ) (2024-12-18T14:57:06Z) - Image Watermarks are Removable Using Controllable Regeneration from Clean Noise [26.09012436917272]
透かし技法の重要な特徴は、様々な操作に対する頑丈さである。
本稿では,最先端の透かし手法を効果的に無効化できる透かし除去手法を提案する。
本手法は,既存の再生手法と比較して,視覚的整合性/品質の向上と透かし除去性能の向上を実現している。
論文 参考訳(メタデータ) (2024-10-07T20:04:29Z) - Duwak: Dual Watermarks in Large Language Models [49.00264962860555]
トークン確率分布とサンプリングスキームの両方に二重秘密パターンを埋め込むことにより、透かしの効率と品質を向上させるために、Duwakを提案する。
Llama2でDuwakを4つの最先端透かし技術と組み合わせて評価した。
論文 参考訳(メタデータ) (2024-03-12T16:25:38Z) - A Resilient and Accessible Distribution-Preserving Watermark for Large Language Models [65.40460716619772]
本研究は,textbfDistribution-textbf Preserving (DiP)ウォーターマークの重要性に焦点をあてる。
現在の戦略とは対照的に,提案したDiPmarkは透かし中に元のトークン分布を同時に保存する。
言語モデルAPIにアクセスせずに検出可能で(アクセス可能)、トークンの適度な変更に対して確実に堅牢である。
論文 参考訳(メタデータ) (2023-10-11T17:57:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。