論文の概要: Speech watermarking: a solution for authentication of forensic audio
digital recordings
- arxiv url: http://arxiv.org/abs/2203.02275v1
- Date: Wed, 23 Feb 2022 13:39:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-13 13:51:56.332763
- Title: Speech watermarking: a solution for authentication of forensic audio
digital recordings
- Title(参考訳): 音声電子透かし : 法医学的音声デジタル記録の認証のための解法
- Authors: Marcos Faundez-Zanuy, Jose Juan Lucena-Molina, Martin Hagmueller,
Gernot Kubin
- Abstract要約: 本稿では,音声透かしのためのスペクトル拡散手法を用いたディジタル信号処理手法を提案する。
実験の結果, 音声透かしは, 後部法医学的話者識別に大きく干渉しないことが明らかとなった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper we discuss the problem of authentication of forensic audio when
using digital recordings. Although forensic audio has been addressed in several
papers the existing approaches are focused on analog magnetic recordings, which
are becoming old-fashion due to the large amount of digital recorders available
on the market (optical, solid-state, hard disks, etc). We present an approach
based on digital signal processing that consist of spread spectrum techniques
for speech watermarking. This approach presents the advantage that the
authentication is based on the signal itself rather than the recording support.
Thus, it is valid for whatever recording device. In addition, our proposal
permits the introduction of relevant information such as recording date and
time and all the relevant data (this is not possible with classical systems).
Our experimental results reveal that the speech watermarking procedure does not
interfere in a significant way with the posterior forensic speaker
identification.
- Abstract(参考訳): 本稿では,デジタル録音における法医学的音声認証の問題点について論じる。
法医学的なオーディオはいくつかの論文で言及されているが、既存のアプローチはアナログ磁気記録に焦点を当てており、市場に出回っている大量のデジタルレコーダー(光学、ソリッドステート、ハードディスクなど)によって古いファシオンになりつつある。
本稿では,音声透かしのためのスペクトル拡散手法を用いたディジタル信号処理手法を提案する。
このアプローチは、認証が記録サポートではなく信号自体に基づいているという利点を示す。
したがって、どんな記録装置にも有効である。
また,本提案では,記録日時などの関連情報やすべての関連データの導入を許可している(古典的システムでは不可能である)。
実験の結果, 音声透かしは, 後部法医学的話者識別に大きく干渉しないことが明らかとなった。
関連論文リスト
- AudioMarkBench: Benchmarking Robustness of Audio Watermarking [38.25450275151647]
本稿では,透かし除去と透かし偽造に対する音響透かしの堅牢性を評価するための最初の体系的ベンチマークであるAudioMarkBenchを紹介する。
以上の結果から,従来の透かし手法の脆弱性を強調し,より堅牢で公正な透かしソリューションの必要性を強調した。
論文 参考訳(メタデータ) (2024-06-11T06:18:29Z) - Compression effects and scene details on the source camera identification of digital videos [14.105727639288316]
特定のデジタルビデオの真正性や完全性を保証するために、法医学的分析機構を導入することが不可欠である。
モバイルデバイスからのデジタルビデオの取得元を特定する手法を提案する。
論文 参考訳(メタデータ) (2024-02-07T09:14:18Z) - Proactive Detection of Voice Cloning with Localized Watermarking [50.13539630769929]
本稿では,AI生成音声の局所検出に特化して設計された,最初の音声透かし技術であるAudioSealを紹介する。
AudioSealは、ローカライゼーションロスと共同でトレーニングされたジェネレータ/検出器アーキテクチャを使用して、サンプルレベルまでローカライズされた透かし検出を可能にする。
AudioSealは、実生活のオーディオ操作に対する堅牢性と、自動的および人的評価指標に基づく非知覚性の観点から、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-30T18:56:22Z) - WavMark: Watermarking for Audio Generation [70.65175179548208]
本稿では,わずか1秒の音声スニペット内に最大32ビットの透かしを符号化する,革新的な音声透かしフレームワークを提案する。
透かしは人間の感覚に影響されず、様々な攻撃に対して強い弾力性を示す。
合成音声の効果的な識別子として機能し、オーディオ著作権保護の幅広い応用の可能性を秘めている。
論文 参考訳(メタデータ) (2023-08-24T13:17:35Z) - VarietySound: Timbre-Controllable Video to Sound Generation via
Unsupervised Information Disentanglement [68.42632589736881]
ビデオ入力と参照音声サンプルを与えられた特定の音色で発音する作業を行う。
この課題を解決するために,対象の音声を時間情報,音響情報,背景情報という3つの構成要素にまとめる。
提案手法は,ビデオ中のイベントと高音質の音声サンプルを生成し,参照音声と高音質の類似性を示す。
論文 参考訳(メタデータ) (2022-11-19T11:12:01Z) - Audiogram Digitization Tool for Audiological Reports [0.0]
本稿では, オンタリオ州労働安全保険委員会と共同で, 判決プロセスの合理化を図ったソリューションを提案する。
そこで,本研究では,聴力閾値を自動的に抽出できる最初のオーディオグラムディジタル化アルゴリズムを提案する。
このアルゴリズムは5dBの精度でほとんどの閾値を抽出し、オーディオグラムをデジタルフォーマットに変換するのに必要な時間を大幅に短縮する。
論文 参考訳(メタデータ) (2022-08-31T03:59:45Z) - An Initial Investigation for Detecting Vocoder Fingerprints of Fake
Audio [53.134423013599914]
本稿では,偽音声のボコーダ指紋を検出するための新しい問題を提案する。
8つの最先端ボコーダによって合成されたデータセットについて実験を行った。
論文 参考訳(メタデータ) (2022-08-20T09:23:21Z) - A New Approach for Image Authentication Framework for Media Forensics
Purpose [0.0]
本稿では,デジタル画像認証と独創性識別のための新しいデジタル法医学的セキュリティフレームワークを提案する。
このアプローチは、調査中の画像の不正な修正を示す必要があるRGBイメージにシークレットコードを埋め込むことに依存します。
論文 参考訳(メタデータ) (2021-10-03T18:31:37Z) - Streaming Multi-talker Speech Recognition with Joint Speaker
Identification [77.46617674133556]
SURITは、音声認識と話者識別の両方のバックボーンとして、リカレントニューラルネットワークトランスデューサ(RNN-T)を採用しています。
Librispeechから派生したマルチストーカーデータセットであるLibrispeechデータセットに関するアイデアを検証し、奨励的な結果を提示した。
論文 参考訳(メタデータ) (2021-04-05T18:37:33Z) - Towards transformation-resilient provenance detection of digital media [38.865642862858195]
トランスフォーメーション・レジリエンス・ウォーターマーク検出器を学習するためのフレームワークであるReSWATを紹介する。
本手法は,複数の後処理変換を経た場合でも,信号の発覚を確実に検出することができる。
論文 参考訳(メタデータ) (2020-11-14T18:08:07Z) - A Modified Fourier-Mellin Approach for Source Device Identification on
Stabilized Videos [72.40789387139063]
マルチメディアの法医学ツールは通常 取得したフレームに カメラセンサーが残した 特徴的なノイズの痕跡を利用する
この分析では,カメラを特徴付けるノイズパターンと,解析対象の映像フレームから抽出したノイズパターンを幾何学的に整列させる必要がある。
本稿では,周波数領域におけるスケーリングと回転パラメータの探索により,この制限を克服することを提案する。
論文 参考訳(メタデータ) (2020-05-20T12:06:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。