論文の概要: Speech watermarking: a solution for authentication of forensic audio
digital recordings
- arxiv url: http://arxiv.org/abs/2203.02275v1
- Date: Wed, 23 Feb 2022 13:39:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-13 13:51:56.332763
- Title: Speech watermarking: a solution for authentication of forensic audio
digital recordings
- Title(参考訳): 音声電子透かし : 法医学的音声デジタル記録の認証のための解法
- Authors: Marcos Faundez-Zanuy, Jose Juan Lucena-Molina, Martin Hagmueller,
Gernot Kubin
- Abstract要約: 本稿では,音声透かしのためのスペクトル拡散手法を用いたディジタル信号処理手法を提案する。
実験の結果, 音声透かしは, 後部法医学的話者識別に大きく干渉しないことが明らかとなった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper we discuss the problem of authentication of forensic audio when
using digital recordings. Although forensic audio has been addressed in several
papers the existing approaches are focused on analog magnetic recordings, which
are becoming old-fashion due to the large amount of digital recorders available
on the market (optical, solid-state, hard disks, etc). We present an approach
based on digital signal processing that consist of spread spectrum techniques
for speech watermarking. This approach presents the advantage that the
authentication is based on the signal itself rather than the recording support.
Thus, it is valid for whatever recording device. In addition, our proposal
permits the introduction of relevant information such as recording date and
time and all the relevant data (this is not possible with classical systems).
Our experimental results reveal that the speech watermarking procedure does not
interfere in a significant way with the posterior forensic speaker
identification.
- Abstract(参考訳): 本稿では,デジタル録音における法医学的音声認証の問題点について論じる。
法医学的なオーディオはいくつかの論文で言及されているが、既存のアプローチはアナログ磁気記録に焦点を当てており、市場に出回っている大量のデジタルレコーダー(光学、ソリッドステート、ハードディスクなど)によって古いファシオンになりつつある。
本稿では,音声透かしのためのスペクトル拡散手法を用いたディジタル信号処理手法を提案する。
このアプローチは、認証が記録サポートではなく信号自体に基づいているという利点を示す。
したがって、どんな記録装置にも有効である。
また,本提案では,記録日時などの関連情報やすべての関連データの導入を許可している(古典的システムでは不可能である)。
実験の結果, 音声透かしは, 後部法医学的話者識別に大きく干渉しないことが明らかとなった。
関連論文リスト
- Proactive Detection of Voice Cloning with Localized Watermarking [52.77113619386194]
本稿では,AI生成音声の局所検出に特化して設計された,最初の音声透かし技術であるAudioSealを紹介する。
AudioSealは、ローカライゼーションロスと共同でトレーニングされたジェネレータ/検出器アーキテクチャを使用して、サンプルレベルまでローカライズされた透かし検出を可能にする。
AudioSealは、実生活のオーディオ操作に対する堅牢性と、自動的および人的評価指標に基づく非知覚性の観点から、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-30T18:56:22Z) - SceneFake: An Initial Dataset and Benchmarks for Scene Fake Audio
Detection [59.083973178410474]
本稿では,シーンフェイク音声検出のためのこのようなデータセットを設計する(SceneFake)。
SceneFakeデータセットで操作された音声は、音声強調技術を用いて発話の音響シーンを改ざんするだけである。
テストセットで偽の発話を検出するだけでなく、偽検出モデルの一般化を評価して、不正な操作攻撃を検知する。
論文 参考訳(メタデータ) (2022-11-11T09:05:50Z) - Audiogram Digitization Tool for Audiological Reports [0.0]
本稿では, オンタリオ州労働安全保険委員会と共同で, 判決プロセスの合理化を図ったソリューションを提案する。
そこで,本研究では,聴力閾値を自動的に抽出できる最初のオーディオグラムディジタル化アルゴリズムを提案する。
このアルゴリズムは5dBの精度でほとんどの閾値を抽出し、オーディオグラムをデジタルフォーマットに変換するのに必要な時間を大幅に短縮する。
論文 参考訳(メタデータ) (2022-08-31T03:59:45Z) - System Fingerprint Recognition for Deepfake Audio: An Initial Dataset
and Investigation [51.06875680387692]
システム指紋認識(SFR)のための最初のディープフェイク音声データセットを提案する。
最新の最先端のディープラーニング技術を利用する7つの中国ベンダーの音声合成システムからデータセットを収集した。
論文 参考訳(メタデータ) (2022-08-21T05:15:40Z) - An Initial Investigation for Detecting Vocoder Fingerprints of Fake
Audio [53.134423013599914]
本稿では,偽音声のボコーダ指紋を検出するための新しい問題を提案する。
8つの最先端ボコーダによって合成されたデータセットについて実験を行った。
論文 参考訳(メタデータ) (2022-08-20T09:23:21Z) - A New Approach for Image Authentication Framework for Media Forensics
Purpose [0.0]
本稿では,デジタル画像認証と独創性識別のための新しいデジタル法医学的セキュリティフレームワークを提案する。
このアプローチは、調査中の画像の不正な修正を示す必要があるRGBイメージにシークレットコードを埋め込むことに依存します。
論文 参考訳(メタデータ) (2021-10-03T18:31:37Z) - Streaming Multi-talker Speech Recognition with Joint Speaker
Identification [77.46617674133556]
SURITは、音声認識と話者識別の両方のバックボーンとして、リカレントニューラルネットワークトランスデューサ(RNN-T)を採用しています。
Librispeechから派生したマルチストーカーデータセットであるLibrispeechデータセットに関するアイデアを検証し、奨励的な結果を提示した。
論文 参考訳(メタデータ) (2021-04-05T18:37:33Z) - Towards transformation-resilient provenance detection of digital media [38.865642862858195]
トランスフォーメーション・レジリエンス・ウォーターマーク検出器を学習するためのフレームワークであるReSWATを紹介する。
本手法は,複数の後処理変換を経た場合でも,信号の発覚を確実に検出することができる。
論文 参考訳(メタデータ) (2020-11-14T18:08:07Z) - A Modified Fourier-Mellin Approach for Source Device Identification on
Stabilized Videos [72.40789387139063]
マルチメディアの法医学ツールは通常 取得したフレームに カメラセンサーが残した 特徴的なノイズの痕跡を利用する
この分析では,カメラを特徴付けるノイズパターンと,解析対象の映像フレームから抽出したノイズパターンを幾何学的に整列させる必要がある。
本稿では,周波数領域におけるスケーリングと回転パラメータの探索により,この制限を克服することを提案する。
論文 参考訳(メタデータ) (2020-05-20T12:06:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。