論文の概要: MerkleSpeech: Public-Key Verifiable, Chunk-Localised Speech Provenance via Perceptual Fingerprints and Merkle Commitments
- arxiv url: http://arxiv.org/abs/2602.10166v1
- Date: Tue, 10 Feb 2026 11:58:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.209175
- Title: MerkleSpeech: Public-Key Verifiable, Chunk-Localised Speech Provenance via Perceptual Fingerprints and Merkle Commitments
- Title(参考訳): MerkleSpeech: パーセプティブフィンガープリントとメルクルコミットによる公開鍵検証, チャンクローカライズされた音声提示
- Authors: Tatsunori Ono,
- Abstract要約: 本稿では,公開鍵検証・チャンク局所音声認識システムであるMerkleSpeechを提案する。
このシステムは、短い音声チャンク上で知覚指紋を計算し、それを発行キーで署名されたMerkleツリーにコミットする。
我々は,再サンプリング,帯域通過フィルタ,付加雑音下での極めて低い偽陽性率を目標とした実験を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Speech provenance goes beyond detecting whether a watermark is present. Real workflows involve splicing, quoting, trimming, and platform-level transforms that may preserve some regions while altering others. Neural watermarking systems have made strides in robustness and localised detection, but most deployments produce outputs with no third-party verifiable cryptographic proof tying a time segment to an issuer-signed original. Provenance standards like C2PA adopt signed manifests and Merkle-based fragment validation, yet their bindings target encoded assets and break under re-encoding or routine processing. We propose MerkleSpeech, a system for public-key verifiable, chunk-localised speech provenance offering two tiers of assurance. The first, a robust watermark attribution layer (WM-only), survives common distribution transforms and answers "was this chunk issued by a known party?". The second, a strict cryptographic integrity layer (MSv1), verifies Merkle inclusion of the chunk's fingerprint under an issuer signature. The system computes perceptual fingerprints over short speech chunks, commits them in a Merkle tree whose root is signed with an issuer key, and embeds a compact in-band watermark payload carrying a random content identifier and chunk metadata sufficient to retrieve Merkle inclusion proofs from a repository. Once the payload is extracted, all subsequent verification steps (signature check, fingerprint recomputation, Merkle inclusion) use only public information. The result is a splice-aware timeline indicating which regions pass each tier and why any given region fails. We describe the protocol, provide pseudocode, and present experiments targeting very low false positive rates under resampling, bandpass filtering, and additive noise, informed by recent audits identifying neural codecs as a major stressor for post-hoc audio watermarks.
- Abstract(参考訳): 音声の発声は、透かしが存在するかどうかを検出するだけではない。
実際のワークフローには、スプライシング、引用、トリミング、プラットフォームレベルの変換が含まれており、一部のリージョンを保存しつつ、他のリージョンを変更している。
ニューラルウォーターマーキングシステムはロバスト性や局所検出に力を入れているが、ほとんどのデプロイメントでは、発行者が署名したオリジナルにタイムセグメントを結び付ける、第三者の検証可能な暗号証明のない出力を生成する。
C2PAのような前向きな標準では、署名されたマニフェストとMerkleベースのフラグメントバリデーションが採用されているが、バインディングはエンコードされたアセットをターゲットとし、再エンコードやルーチン処理でブレークする。
本稿では,2段階の保証を提供する公開鍵検証方式であるMerkleSpeechを提案する。
第一に、ロバストな透かし属性層(WMのみ)は、共通分布変換を生き残り、「このチャンクは既知の当事者によって発行されたのか?」と答える。
第二に、厳密な暗号整合層(MSv1)は、発行者署名の下でチャンクの指紋をメルクルに含めていることを検証する。
システムは、短い音声チャンク上で知覚指紋を計算し、ルーツが発行者キーと署名されたメルクルツリーにコミットし、ランダムなコンテンツ識別子とチャンクメタデータを積んだコンパクトな帯域内透かしペイロードを埋め込み、リポジトリからメルクル包含証明を検索する。
ペイロードが抽出されると、その後の検証ステップ(署名チェック、指紋再計算、メルクルインクルージョン)は公開情報のみを使用する。
その結果は、どのリージョンが各階層を通過するのか、また、どのリージョンがフェールするかを示すスプライス対応のタイムラインである。
本稿では,本プロトコルを記述し,偽陽性率の極めて低い再サンプリング,帯域通過フィルタリング,付加雑音をターゲットとした実験を行い,ニューラルコーデックをポストホック音声透かしの主要なコントラクタとして同定した最近の監査結果から報告する。
関連論文リスト
- Bileve: Securing Text Provenance in Large Language Models Against Spoofing with Bi-level Signature [39.973130114073605]
整合性チェックのための微細なシグネチャビットを埋め込んだバイレベルシグネチャスキームであるBileveを導入する。
Bileveは、検出中に5つのシナリオを区別し、テキストを確実にトレースし、LLMを制御する。
論文 参考訳(メタデータ) (2024-06-04T03:58:14Z) - An Unforgeable Publicly Verifiable Watermark for Large Language Models [84.2805275589553]
現在の透かし検出アルゴリズムは、透かし生成プロセスで使用される秘密鍵を必要としており、公開検出中にセキュリティ違反や偽造の影響を受ける。
両段階で同じキーを使用するのではなく、2つの異なるニューラルネットワークを用いて透かしの生成と検出を行う。
論文 参考訳(メタデータ) (2023-07-30T13:43:27Z) - Who Wrote this Code? Watermarking for Code Generation [53.24895162874416]
本稿では,機械生成テキストを検出するために,Entropy Thresholding (SWEET) を用いたSelective WatErmarkingを提案する。
実験の結果,SWEETはコード品質を著しく向上し,すべてのベースラインを上回ります。
論文 参考訳(メタデータ) (2023-05-24T11:49:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。