Fugu-MT 論文翻訳(概要): Speech watermarking: a solution for authentication of forensic audio digital recordings

論文の概要: Speech watermarking: a solution for authentication of forensic audio digital recordings

arxiv url: http://arxiv.org/abs/2203.02275v1
Date: Wed, 23 Feb 2022 13:39:03 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-13 13:51:56.332763
Title: Speech watermarking: a solution for authentication of forensic audio digital recordings
Title（参考訳）: 音声電子透かし : 法医学的音声デジタル記録の認証のための解法
Authors: Marcos Faundez-Zanuy, Jose Juan Lucena-Molina, Martin Hagmueller, Gernot Kubin
Abstract要約: 本稿では,音声透かしのためのスペクトル拡散手法を用いたディジタル信号処理手法を提案する。実験の結果, 音声透かしは, 後部法医学的話者識別に大きく干渉しないことが明らかとなった。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: In this paper we discuss the problem of authentication of forensic audio when using digital recordings. Although forensic audio has been addressed in several papers the existing approaches are focused on analog magnetic recordings, which are becoming old-fashion due to the large amount of digital recorders available on the market (optical, solid-state, hard disks, etc). We present an approach based on digital signal processing that consist of spread spectrum techniques for speech watermarking. This approach presents the advantage that the authentication is based on the signal itself rather than the recording support. Thus, it is valid for whatever recording device. In addition, our proposal permits the introduction of relevant information such as recording date and time and all the relevant data (this is not possible with classical systems). Our experimental results reveal that the speech watermarking procedure does not interfere in a significant way with the posterior forensic speaker identification.
Abstract（参考訳）: 本稿では,デジタル録音における法医学的音声認証の問題点について論じる。法医学的なオーディオはいくつかの論文で言及されているが、既存のアプローチはアナログ磁気記録に焦点を当てており、市場に出回っている大量のデジタルレコーダー(光学、ソリッドステート、ハードディスクなど)によって古いファシオンになりつつある。本稿では,音声透かしのためのスペクトル拡散手法を用いたディジタル信号処理手法を提案する。このアプローチは、認証が記録サポートではなく信号自体に基づいているという利点を示す。したがって、どんな記録装置にも有効である。また,本提案では,記録日時などの関連情報やすべての関連データの導入を許可している(古典的システムでは不可能である)。実験の結果, 音声透かしは, 後部法医学的話者識別に大きく干渉しないことが明らかとなった。

関連論文リスト

Self Voice Conversion as an Attack against Neural Audio Watermarking [34.948149764638806]
音声透かしシステムに対するユニバーサル・コンテンツ保存攻撃としての自己音声変換について検討する。この攻撃は最先端の透かし手法の信頼性を著しく低下させることを示した。
論文参考訳（メタデータ） (2026-01-28T09:41:18Z)
Discrete Audio Tokens: More Than a Survey! [107.69720675124255]
本稿では,離散型音声トークンの体系的レビューとベンチマークを行う。音声、音楽、一般的なオーディオドメインをカバーしている。本稿では,エンコーダデコーダ,量子化技術,トレーニングパラダイム,ストリーム性,アプリケーションドメインに基づくトークン化アプローチの分類法を提案する。
論文参考訳（メタデータ） (2025-06-12T01:35:43Z)
XAttnMark: Learning Robust Audio Watermarking with Cross-Attention [15.216472445154064]
クロスアテンションロバスト音響透かし(XAttnMark) 本稿では,ジェネレータと検出器間の部分パラメータ共有を利用してギャップを埋めるクロスアテンションロバスト音響透かし(XAttnMark)を提案する。本研究では, 聴覚マスキング効果の微粒化を捉え, 透かしの受容性を向上する心理音響整列型時間周波数マスキング障害を提案する。
論文参考訳（メタデータ） (2025-02-06T17:15:08Z)
Speech Watermarking with Discrete Intermediate Representations [45.892635912641836]
本稿では,音声の中間表現に透かしを注入する新しい音声透かしフレームワークを提案する。 DiscreteWMは、堅牢性と非受容性を同時に実現します。我々のフレキシブルなフレームワイドアプローチは、音声のクローン検出と情報隠蔽の両面において効率的な解決策となる。
論文参考訳（メタデータ） (2024-12-18T14:57:06Z)
AudioMarkBench: Benchmarking Robustness of Audio Watermarking [38.25450275151647]
本稿では,透かし除去と透かし偽造に対する音響透かしの堅牢性を評価するための最初の体系的ベンチマークであるAudioMarkBenchを紹介する。以上の結果から,従来の透かし手法の脆弱性を強調し,より堅牢で公正な透かしソリューションの必要性を強調した。
論文参考訳（メタデータ） (2024-06-11T06:18:29Z)
Compression effects and scene details on the source camera identification of digital videos [14.105727639288316]
特定のデジタルビデオの真正性や完全性を保証するために、法医学的分析機構を導入することが不可欠である。モバイルデバイスからのデジタルビデオの取得元を特定する手法を提案する。
論文参考訳（メタデータ） (2024-02-07T09:14:18Z)
Proactive Detection of Voice Cloning with Localized Watermarking [50.13539630769929]
本稿では,AI生成音声の局所検出に特化して設計された,最初の音声透かし技術であるAudioSealを紹介する。 AudioSealは、ローカライゼーションロスと共同でトレーニングされたジェネレータ/検出器アーキテクチャを使用して、サンプルレベルまでローカライズされた透かし検出を可能にする。 AudioSealは、実生活のオーディオ操作に対する堅牢性と、自動的および人的評価指標に基づく非知覚性の観点から、最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-01-30T18:56:22Z)
WavMark: Watermarking for Audio Generation [70.65175179548208]
本稿では,わずか1秒の音声スニペット内に最大32ビットの透かしを符号化する,革新的な音声透かしフレームワークを提案する。透かしは人間の感覚に影響されず、様々な攻撃に対して強い弾力性を示す。合成音声の効果的な識別子として機能し、オーディオ著作権保護の幅広い応用の可能性を秘めている。
論文参考訳（メタデータ） (2023-08-24T13:17:35Z)
VarietySound: Timbre-Controllable Video to Sound Generation via Unsupervised Information Disentanglement [68.42632589736881]
ビデオ入力と参照音声サンプルを与えられた特定の音色で発音する作業を行う。この課題を解決するために,対象の音声を時間情報,音響情報,背景情報という3つの構成要素にまとめる。提案手法は,ビデオ中のイベントと高音質の音声サンプルを生成し,参照音声と高音質の類似性を示す。
論文参考訳（メタデータ） (2022-11-19T11:12:01Z)
Audiogram Digitization Tool for Audiological Reports [0.0]
本稿では, オンタリオ州労働安全保険委員会と共同で, 判決プロセスの合理化を図ったソリューションを提案する。そこで,本研究では,聴力閾値を自動的に抽出できる最初のオーディオグラムディジタル化アルゴリズムを提案する。このアルゴリズムは5dBの精度でほとんどの閾値を抽出し、オーディオグラムをデジタルフォーマットに変換するのに必要な時間を大幅に短縮する。
論文参考訳（メタデータ） (2022-08-31T03:59:45Z)
An Initial Investigation for Detecting Vocoder Fingerprints of Fake Audio [53.134423013599914]
本稿では,偽音声のボコーダ指紋を検出するための新しい問題を提案する。 8つの最先端ボコーダによって合成されたデータセットについて実験を行った。
論文参考訳（メタデータ） (2022-08-20T09:23:21Z)
A New Approach for Image Authentication Framework for Media Forensics Purpose [0.0]
本稿では,デジタル画像認証と独創性識別のための新しいデジタル法医学的セキュリティフレームワークを提案する。このアプローチは、調査中の画像の不正な修正を示す必要があるRGBイメージにシークレットコードを埋め込むことに依存します。
論文参考訳（メタデータ） (2021-10-03T18:31:37Z)
Streaming Multi-talker Speech Recognition with Joint Speaker Identification [77.46617674133556]
SURITは、音声認識と話者識別の両方のバックボーンとして、リカレントニューラルネットワークトランスデューサ(RNN-T)を採用しています。 Librispeechから派生したマルチストーカーデータセットであるLibrispeechデータセットに関するアイデアを検証し、奨励的な結果を提示した。
論文参考訳（メタデータ） (2021-04-05T18:37:33Z)
Towards transformation-resilient provenance detection of digital media [38.865642862858195]
トランスフォーメーション・レジリエンス・ウォーターマーク検出器を学習するためのフレームワークであるReSWATを紹介する。本手法は,複数の後処理変換を経た場合でも,信号の発覚を確実に検出することができる。
論文参考訳（メタデータ） (2020-11-14T18:08:07Z)
A Modified Fourier-Mellin Approach for Source Device Identification on Stabilized Videos [72.40789387139063]
マルチメディアの法医学ツールは通常取得したフレームにカメラセンサーが残した特徴的なノイズの痕跡を利用するこの分析では,カメラを特徴付けるノイズパターンと,解析対象の映像フレームから抽出したノイズパターンを幾何学的に整列させる必要がある。本稿では,周波数領域におけるスケーリングと回転パラメータの探索により,この制限を克服することを提案する。
論文参考訳（メタデータ） (2020-05-20T12:06:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。