論文の概要: Deepfake audio detection by speaker verification
- arxiv url: http://arxiv.org/abs/2209.14098v1
- Date: Wed, 28 Sep 2022 13:46:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 18:23:11.345834
- Title: Deepfake audio detection by speaker verification
- Title(参考訳): 話者検証によるディープフェイク音声検出
- Authors: Alessandro Pianese and Davide Cozzolino and Giovanni Poggi and Luisa
Verdoliva
- Abstract要約: 本研究では,話者の生体特性のみを活用する新しい検出手法を提案する。
提案手法は,既成話者検証ツールに基づいて実装することができる。
そこで我々は,3つの一般的なテストセット上で,優れた性能,高い一般化能力,高ロバスト性を有する音声障害に対する高ロバスト性を検証した。
- 参考スコア(独自算出の注目度): 79.99653758293277
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Thanks to recent advances in deep learning, sophisticated generation tools
exist, nowadays, that produce extremely realistic synthetic speech. However,
malicious uses of such tools are possible and likely, posing a serious threat
to our society. Hence, synthetic voice detection has become a pressing research
topic, and a large variety of detection methods have been recently proposed.
Unfortunately, they hardly generalize to synthetic audios generated by tools
never seen in the training phase, which makes them unfit to face real-world
scenarios. In this work, we aim at overcoming this issue by proposing a new
detection approach that leverages only the biometric characteristics of the
speaker, with no reference to specific manipulations. Since the detector is
trained only on real data, generalization is automatically ensured. The
proposed approach can be implemented based on off-the-shelf speaker
verification tools. We test several such solutions on three popular test sets,
obtaining good performance, high generalization ability, and high robustness to
audio impairment.
- Abstract(参考訳): 近年のディープラーニングの進歩により、非常に現実的な合成音声を生成する高度な生成ツールが存在する。
しかし、このようなツールを悪用することは可能であり、社会に深刻な脅威をもたらす可能性がある。
そのため, 合成音声検出はプレス研究の対象となり, 近年, 様々な検出方法が提案されている。
残念なことに、トレーニング段階では見られないツールによって生成された合成オーディオにはほとんど一般化しないため、現実のシナリオに直面するには適さない。
本研究は,話者の生体特性のみを活用する新しい検出手法を提案し,特定の操作に言及せずに,この問題を克服することを目的とする。
検出器は実データのみに基づいて訓練されるため、一般化は自動的に保証される。
提案手法は,既成話者検証ツールに基づいて実装することができる。
そこで我々は,3つの一般的なテストセット上で,優れた性能,高い一般化能力,高ロバスト性を実現した。
関連論文リスト
- SONAR: A Synthetic AI-Audio Detection Framework and Benchmark [59.09338266364506]
SONARはAI-Audio Detection FrameworkとBenchmarkの合成である。
最先端のAI合成聴覚コンテンツを識別するための総合的な評価を提供することを目的としている。
従来のモデルとファンデーションベースのディープフェイク検出システムの両方で、AIオーディオ検出を均一にベンチマークする最初のフレームワークである。
論文 参考訳(メタデータ) (2024-10-06T01:03:42Z) - Targeted Augmented Data for Audio Deepfake Detection [11.671275975119089]
そこで本研究では,モデルの決定境界をターゲットとした音声疑似フェイク生成手法を提案する。
敵の攻撃に触発されて、元の実際のデータを摂動させ、不明瞭な予測確率で擬似フェイクを合成する。
論文 参考訳(メタデータ) (2024-07-10T12:31:53Z) - Training-Free Deepfake Voice Recognition by Leveraging Large-Scale Pre-Trained Models [52.04189118767758]
一般化は、現在のオーディオディープフェイク検出器の主な問題である。
本稿では,オーディオディープフェイク検出のための大規模事前学習モデルの可能性について検討する。
論文 参考訳(メタデータ) (2024-05-03T15:27:11Z) - Scalable Ensemble-based Detection Method against Adversarial Attacks for
speaker verification [73.30974350776636]
本稿では,一貫した枠組みにおける主流浄化手法を包括的に比較する。
本稿では, 検出のための高度浄化モジュールを組み込んだ, 簡単に追従できるアンサンブル手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T03:04:05Z) - All-for-One and One-For-All: Deep learning-based feature fusion for
Synthetic Speech Detection [18.429817510387473]
近年のディープラーニングとコンピュータビジョンの進歩により、マルチメディアコンテンツの合成と偽造がこれまで以上に容易にできるようになった。
本稿では,合成音声検出タスクについて文献で提案する3つの特徴セットについて考察し,それらと融合するモデルを提案する。
このシステムは異なるシナリオとデータセットでテストされ、反法医学的攻撃に対する堅牢性とその一般化能力を証明する。
論文 参考訳(メタデータ) (2023-07-28T13:50:25Z) - Combining Automatic Speaker Verification and Prosody Analysis for
Synthetic Speech Detection [15.884911752869437]
本稿では,人間の声の2つの高レベルな意味的特性を組み合わせた合成音声検出手法を提案する。
一方, 話者識別手法に着目し, 自動話者検証タスクの最先端手法を用いて抽出した話者埋め込みとして表現する。
一方、リズム、ピッチ、アクセントの変化を意図した音声韻律は、特殊なエンコーダによって抽出される。
論文 参考訳(メタデータ) (2022-10-31T11:03:03Z) - Audio-Visual Person-of-Interest DeepFake Detection [77.04789677645682]
本研究の目的は、現実世界で遭遇する様々な操作方法やシナリオに対処できるディープフェイク検出器を提案することである。
我々は、対照的な学習パラダイムを活用して、各アイデンティティに対して最も識別しやすい、移動面と音声セグメントの埋め込みを学習する。
本手法は,シングルモダリティ(オーディオのみ,ビデオのみ)とマルチモダリティ(オーディオビデオ)の両方を検出でき,低品質・低画質ビデオに対して堅牢である。
論文 参考訳(メタデータ) (2022-04-06T20:51:40Z) - Partially Fake Audio Detection by Self-attention-based Fake Span
Discovery [89.21979663248007]
本稿では,部分的に偽の音声を検出する自己認識機構を備えた質問応答(フェイクスパン発見)戦略を導入することで,新たな枠組みを提案する。
ADD 2022の部分的に偽の音声検出トラックで第2位にランクインした。
論文 参考訳(メタデータ) (2022-02-14T13:20:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。