論文の概要: Speech watermarking: a solution for authentication of forensic audio
digital recordings
- arxiv url: http://arxiv.org/abs/2203.02275v1
- Date: Wed, 23 Feb 2022 13:39:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-13 13:51:56.332763
- Title: Speech watermarking: a solution for authentication of forensic audio
digital recordings
- Title(参考訳): 音声電子透かし : 法医学的音声デジタル記録の認証のための解法
- Authors: Marcos Faundez-Zanuy, Jose Juan Lucena-Molina, Martin Hagmueller,
Gernot Kubin
- Abstract要約: 本稿では,音声透かしのためのスペクトル拡散手法を用いたディジタル信号処理手法を提案する。
実験の結果, 音声透かしは, 後部法医学的話者識別に大きく干渉しないことが明らかとなった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper we discuss the problem of authentication of forensic audio when
using digital recordings. Although forensic audio has been addressed in several
papers the existing approaches are focused on analog magnetic recordings, which
are becoming old-fashion due to the large amount of digital recorders available
on the market (optical, solid-state, hard disks, etc). We present an approach
based on digital signal processing that consist of spread spectrum techniques
for speech watermarking. This approach presents the advantage that the
authentication is based on the signal itself rather than the recording support.
Thus, it is valid for whatever recording device. In addition, our proposal
permits the introduction of relevant information such as recording date and
time and all the relevant data (this is not possible with classical systems).
Our experimental results reveal that the speech watermarking procedure does not
interfere in a significant way with the posterior forensic speaker
identification.
- Abstract(参考訳): 本稿では,デジタル録音における法医学的音声認証の問題点について論じる。
法医学的なオーディオはいくつかの論文で言及されているが、既存のアプローチはアナログ磁気記録に焦点を当てており、市場に出回っている大量のデジタルレコーダー(光学、ソリッドステート、ハードディスクなど)によって古いファシオンになりつつある。
本稿では,音声透かしのためのスペクトル拡散手法を用いたディジタル信号処理手法を提案する。
このアプローチは、認証が記録サポートではなく信号自体に基づいているという利点を示す。
したがって、どんな記録装置にも有効である。
また,本提案では,記録日時などの関連情報やすべての関連データの導入を許可している(古典的システムでは不可能である)。
実験の結果, 音声透かしは, 後部法医学的話者識別に大きく干渉しないことが明らかとなった。
関連論文リスト
- XAttnMark: Learning Robust Audio Watermarking with Cross-Attention [15.216472445154064]
クロスアテンションロバスト音響透かし(XAttnMark)
本稿では,ジェネレータと検出器間の部分パラメータ共有を利用してギャップを埋めるクロスアテンションロバスト音響透かし(XAttnMark)を提案する。
本研究では, 聴覚マスキング効果の微粒化を捉え, 透かしの受容性を向上する心理音響整列型時間周波数マスキング障害を提案する。
論文 参考訳(メタデータ) (2025-02-06T17:15:08Z) - Speech Watermarking with Discrete Intermediate Representations [45.892635912641836]
本稿では,音声の中間表現に透かしを注入する新しい音声透かしフレームワークを提案する。
DiscreteWMは、堅牢性と非受容性を同時に実現します。
我々のフレキシブルなフレームワイドアプローチは、音声のクローン検出と情報隠蔽の両面において効率的な解決策となる。
論文 参考訳(メタデータ) (2024-12-18T14:57:06Z) - Compression effects and scene details on the source camera identification of digital videos [14.105727639288316]
特定のデジタルビデオの真正性や完全性を保証するために、法医学的分析機構を導入することが不可欠である。
モバイルデバイスからのデジタルビデオの取得元を特定する手法を提案する。
論文 参考訳(メタデータ) (2024-02-07T09:14:18Z) - Proactive Detection of Voice Cloning with Localized Watermarking [50.13539630769929]
本稿では,AI生成音声の局所検出に特化して設計された,最初の音声透かし技術であるAudioSealを紹介する。
AudioSealは、ローカライゼーションロスと共同でトレーニングされたジェネレータ/検出器アーキテクチャを使用して、サンプルレベルまでローカライズされた透かし検出を可能にする。
AudioSealは、実生活のオーディオ操作に対する堅牢性と、自動的および人的評価指標に基づく非知覚性の観点から、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-30T18:56:22Z) - WavMark: Watermarking for Audio Generation [70.65175179548208]
本稿では,わずか1秒の音声スニペット内に最大32ビットの透かしを符号化する,革新的な音声透かしフレームワークを提案する。
透かしは人間の感覚に影響されず、様々な攻撃に対して強い弾力性を示す。
合成音声の効果的な識別子として機能し、オーディオ著作権保護の幅広い応用の可能性を秘めている。
論文 参考訳(メタデータ) (2023-08-24T13:17:35Z) - Audiogram Digitization Tool for Audiological Reports [0.0]
本稿では, オンタリオ州労働安全保険委員会と共同で, 判決プロセスの合理化を図ったソリューションを提案する。
そこで,本研究では,聴力閾値を自動的に抽出できる最初のオーディオグラムディジタル化アルゴリズムを提案する。
このアルゴリズムは5dBの精度でほとんどの閾値を抽出し、オーディオグラムをデジタルフォーマットに変換するのに必要な時間を大幅に短縮する。
論文 参考訳(メタデータ) (2022-08-31T03:59:45Z) - An Initial Investigation for Detecting Vocoder Fingerprints of Fake
Audio [53.134423013599914]
本稿では,偽音声のボコーダ指紋を検出するための新しい問題を提案する。
8つの最先端ボコーダによって合成されたデータセットについて実験を行った。
論文 参考訳(メタデータ) (2022-08-20T09:23:21Z) - A New Approach for Image Authentication Framework for Media Forensics
Purpose [0.0]
本稿では,デジタル画像認証と独創性識別のための新しいデジタル法医学的セキュリティフレームワークを提案する。
このアプローチは、調査中の画像の不正な修正を示す必要があるRGBイメージにシークレットコードを埋め込むことに依存します。
論文 参考訳(メタデータ) (2021-10-03T18:31:37Z) - Streaming Multi-talker Speech Recognition with Joint Speaker
Identification [77.46617674133556]
SURITは、音声認識と話者識別の両方のバックボーンとして、リカレントニューラルネットワークトランスデューサ(RNN-T)を採用しています。
Librispeechから派生したマルチストーカーデータセットであるLibrispeechデータセットに関するアイデアを検証し、奨励的な結果を提示した。
論文 参考訳(メタデータ) (2021-04-05T18:37:33Z) - A Modified Fourier-Mellin Approach for Source Device Identification on
Stabilized Videos [72.40789387139063]
マルチメディアの法医学ツールは通常 取得したフレームに カメラセンサーが残した 特徴的なノイズの痕跡を利用する
この分析では,カメラを特徴付けるノイズパターンと,解析対象の映像フレームから抽出したノイズパターンを幾何学的に整列させる必要がある。
本稿では,周波数領域におけるスケーリングと回転パラメータの探索により,この制限を克服することを提案する。
論文 参考訳(メタデータ) (2020-05-20T12:06:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。