論文の概要: System Fingerprint Recognition for Deepfake Audio: An Initial Dataset
and Investigation
- arxiv url: http://arxiv.org/abs/2208.10489v3
- Date: Fri, 15 Sep 2023 07:19:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-18 19:07:04.336342
- Title: System Fingerprint Recognition for Deepfake Audio: An Initial Dataset
and Investigation
- Title(参考訳): deepfakeオーディオのためのシステム指紋認識 : 初期データセットと検討
- Authors: Xinrui Yan, Jiangyan Yi, Chenglong Wang, Jianhua Tao, Junzuo Zhou, Hao
Gu, Ruibo Fu
- Abstract要約: システム指紋認識(SFR)のための最初のディープフェイク音声データセットを提案する。
最新の最先端のディープラーニング技術を利用する7つの中国ベンダーの音声合成システムからデータセットを収集した。
- 参考スコア(独自算出の注目度): 51.06875680387692
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid progress of deep speech synthesis models has posed significant
threats to society such as malicious content manipulation. Therefore, many
studies have emerged to detect the so-called deepfake audio. However, existing
works focus on the binary detection of real audio and fake audio. In real-world
scenarios such as model copyright protection and digital evidence forensics, it
is needed to know what tool or model generated the deepfake audio to explain
the decision. This motivates us to ask: Can we recognize the system
fingerprints of deepfake audio? In this paper, we present the first deepfake
audio dataset for system fingerprint recognition (SFR) and conduct an initial
investigation. We collected the dataset from the speech synthesis systems of
seven Chinese vendors that use the latest state-of-the-art deep learning
technologies, including both clean and compressed sets. In addition, to
facilitate the further development of system fingerprint recognition methods,
we provide extensive benchmarks that can be compared and research findings. The
dataset will be publicly available. .
- Abstract(参考訳): 深層音声合成モデルの急速な進歩は、悪質なコンテンツ操作のような社会に大きな脅威をもたらした。
そのため、いわゆるディープフェイク音声を検出するために多くの研究がなされている。
しかし、既存の研究は、実際のオーディオと偽オーディオのバイナリ検出に焦点を当てている。
モデル著作権保護やデジタル証拠法医学のような現実世界のシナリオでは、決定を説明するためにどのツールやモデルがディープフェイク音声を生成するかを知る必要がある。
ディープフェイクオーディオのシステム指紋を認識できますか?
本稿では,システム指紋認識(SFR)のための最初のディープフェイク音声データセットを提示し,初期調査を行う。
クリーンセットと圧縮セットの両方を含む最新のディープラーニング技術を使用している7つの中国ベンダーの音声合成システムからデータセットを収集した。
さらに,システム指紋認識手法のさらなる開発を促進するために,比較可能な広範囲なベンチマークと研究結果を提供する。
データセットは公開される予定だ。
.
関連論文リスト
- Vulnerability of Automatic Identity Recognition to Audio-Visual
Deepfakes [13.042731289687918]
本稿では, ディープフェイクSWAN-DFの音声・映像データベースとして初めて, 唇と音声をよく同期させる手法を提案する。
我々は,SpeechBrainのECAPA-TDNNモデルなど,アート話者認識システムの脆弱性を実証する。
論文 参考訳(メタデータ) (2023-11-29T14:18:04Z) - SceneFake: An Initial Dataset and Benchmarks for Scene Fake Audio
Detection [59.083973178410474]
本稿では,シーンフェイク音声検出のためのこのようなデータセットを設計する(SceneFake)。
SceneFakeデータセットで操作された音声は、音声強調技術を用いて発話の音響シーンを改ざんするだけである。
テストセットで偽の発話を検出するだけでなく、偽検出モデルの一般化を評価して、不正な操作攻撃を検知する。
論文 参考訳(メタデータ) (2022-11-11T09:05:50Z) - An Initial Investigation for Detecting Vocoder Fingerprints of Fake
Audio [53.134423013599914]
本稿では,偽音声のボコーダ指紋を検出するための新しい問題を提案する。
8つの最先端ボコーダによって合成されたデータセットについて実験を行った。
論文 参考訳(メタデータ) (2022-08-20T09:23:21Z) - Fully Automated End-to-End Fake Audio Detection [57.78459588263812]
本稿では,完全自動エンドツーエンド音声検出手法を提案する。
まず、wav2vec事前学習モデルを用いて、音声の高レベル表現を得る。
ネットワーク構造には, Light-DARTS という異種アーキテクチャサーチ (DARTS) の修正版を用いる。
論文 参考訳(メタデータ) (2022-08-20T06:46:55Z) - Partially Fake Audio Detection by Self-attention-based Fake Span
Discovery [89.21979663248007]
本稿では,部分的に偽の音声を検出する自己認識機構を備えた質問応答(フェイクスパン発見)戦略を導入することで,新たな枠組みを提案する。
ADD 2022の部分的に偽の音声検出トラックで第2位にランクインした。
論文 参考訳(メタデータ) (2022-02-14T13:20:55Z) - WaveFake: A Data Set to Facilitate Audio Deepfake Detection [3.8073142980733]
本稿では,音声信号の解析に用いる信号処理技術について紹介する。
次に、2つの言語にまたがる5つの異なるネットワークアーキテクチャから9つのサンプルデータセットを収集した。
第3に,信号処理コミュニティから採用されている2つのベースラインモデルを実践者に提供し,さらなる研究を促進する。
論文 参考訳(メタデータ) (2021-11-04T12:26:34Z) - Evaluation of an Audio-Video Multimodal Deepfake Dataset using Unimodal
and Multimodal Detectors [18.862258543488355]
ディープフェイクはセキュリティとプライバシーの問題を引き起こす可能性がある。
ディープラーニング技術を使って人間の声をクローンする新しい領域も登場しつつある。
優れたディープフェイク検出器を開発するには、複数のモードのディープフェイクを検出する検出器が必要である。
論文 参考訳(メタデータ) (2021-09-07T11:00:20Z) - Emotions Don't Lie: An Audio-Visual Deepfake Detection Method Using
Affective Cues [75.1731999380562]
本稿では,実・偽のディープフェイクマルチメディアコンテンツを検出する学習手法を提案する。
我々は,同じビデオから2つのオーディオと視覚の類似性を抽出し,解析する。
我々は,いくつかのSOTAディープフェイク検出手法との比較を行い,DFDCでは84.4%,DF-TIMITデータセットでは96.6%の動画AUCを報告した。
論文 参考訳(メタデータ) (2020-03-14T22:07:26Z) - SynFi: Automatic Synthetic Fingerprint Generation [23.334625222079634]
我々は,高忠実度合成指紋を大規模に自動生成する新しい手法を提案する。
本手法は,実際の指紋と計算的に区別できない指紋を生成する最初の方法であることを示す。
論文 参考訳(メタデータ) (2020-02-16T07:45:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。