論文の概要: Towards single integrated spoofing-aware speaker verification embeddings
- arxiv url: http://arxiv.org/abs/2305.19051v1
- Date: Tue, 30 May 2023 14:15:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 16:03:28.987581
- Title: Towards single integrated spoofing-aware speaker verification embeddings
- Title(参考訳): 単一spoofing-aware speaker verification embeddedsに向けて
- Authors: Sung Hwan Mun, Hye-jin Shim, Hemlata Tak, Xin Wang, Xuechen Liu, Md
Sahidullah, Myeonghun Jeong, Min Hyun Han, Massimiliano Todisco, Kong Aik
Lee, Junichi Yamagishi, Nicholas Evans, Tomi Kinnunen, Nam Soo Kim, and
Jee-weon Jung
- Abstract要約: 本研究は,1つの統合スプーフィング対応話者検証埋め込みを開発することを目的とする。
単一のSASV埋め込みの劣った性能は、不十分なトレーニングデータから得られると分析する。
実験では、SASV2022チャレンジの評価プロトコルにおいて、SASV-EERが1.06%に達するという劇的な改善が示された。
- 参考スコア(独自算出の注目度): 63.42889348690095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study aims to develop a single integrated spoofing-aware speaker
verification (SASV) embeddings that satisfy two aspects. First, rejecting
non-target speakers' input as well as target speakers' spoofed inputs should be
addressed. Second, competitive performance should be demonstrated compared to
the fusion of automatic speaker verification (ASV) and countermeasure (CM)
embeddings, which outperformed single embedding solutions by a large margin in
the SASV2022 challenge. We analyze that the inferior performance of single SASV
embeddings comes from insufficient amount of training data and distinct nature
of ASV and CM tasks. To this end, we propose a novel framework that includes
multi-stage training and a combination of loss functions. Copy synthesis,
combined with several vocoders, is also exploited to address the lack of
spoofed data. Experimental results show dramatic improvements, achieving a
SASV-EER of 1.06% on the evaluation protocol of the SASV2022 challenge.
- Abstract(参考訳): 本研究は,2つの側面を満たす1つの統合スプーフィング対応話者検証(SASV)の組込みを開発することを目的とする。
まず、ターゲット以外の話者の入力とターゲット話者のスプーフ入力を拒否する。
第2に、自動話者検証(ASV)と対策(CM)の融合との比較により、SASV2022の課題において、単一埋め込みソリューションよりも優れた競合性能を示すべきである。
単一のSASV埋め込みの劣った性能は、トレーニングデータの不足と、ASVおよびCMタスクの異なる性質から生じると分析する。
そこで本研究では,多段階学習と損失関数の組み合わせを含む新しいフレームワークを提案する。
コピー合成といくつかのボコーダを組み合わせることで、スプーフデータの欠如にも対処することができる。
実験結果から,SASV2022課題の評価プロトコルにおいて,SASV-EERが1.06%に達した。
関連論文リスト
- The SVASR System for Text-dependent Speaker Verification (TdSV) AAIC Challenge 2024 [0.0]
提案システムでは,音声内容の検証にFast-Conformer-based ASRモジュールが組み込まれている。
本稿では,wav2vec-BERTモデルから抽出した話者埋め込みとReNetモデルを組み合わせた特徴融合手法を提案する。
論文 参考訳(メタデータ) (2024-11-25T10:53:45Z) - Bilingual Text-dependent Speaker Verification with Pre-trained Models for TdSV Challenge 2024 [0.0]
本稿は、TdSV(Text-dependent Speaker Verification Challenge)2024のイラン分科会に提出する。
TdSVは、特定のフレーズがターゲット話者によって話されたかどうかを決定することを目的としている。
フレーズ検証では、不正確なフレーズを拒否するフレーズと、話者検証では、ドメイン適応型話者埋め込みを抽出した事前訓練されたResNet293が使用される。
Whisper-PMFAは、話者検証に適応した事前訓練されたASRモデルであり、事前訓練されたResNetの性能に劣る。
論文 参考訳(メタデータ) (2024-11-16T15:53:03Z) - ASVspoof 5: Crowdsourced Speech Data, Deepfakes, and Adversarial Attacks at Scale [59.25180900687571]
ASVspoof 5は、音声スプーフとディープフェイク攻撃の研究を促進する一連の課題の第5版である。
本稿では,2つの課題トラック,新しいデータベース,評価指標,評価プラットフォームについて述べる。
論文 参考訳(メタデータ) (2024-08-16T13:37:20Z) - Generalizing Speaker Verification for Spoof Awareness in the Embedding
Space [30.094557217931563]
ASVシステムは様々な種類の敵を用いて偽造することができる。
本稿では,ディープニューラルネットワークに基づく新しいバックエンド分類手法を提案する。
ASVspoof 2019論理アクセスデータセットで実験が行われる。
論文 参考訳(メタデータ) (2024-01-20T07:30:22Z) - Tackling Spoofing-Aware Speaker Verification with Multi-Model Fusion [88.34134732217416]
この研究は、融合に基づくSASVソリューションに焦点を当て、複数の最先端 ASV と CM モデルのパワーを利用するマルチモデル融合フレームワークを提案する。
提案したフレームワークはSASV-EERを8.75%から1.17%に大幅に改善している。
論文 参考訳(メタデータ) (2022-06-18T06:41:06Z) - Design Guidelines for Inclusive Speaker Verification Evaluation Datasets [0.6015898117103067]
話者検証(SV)は、アクセス制御を備えた数十億の音声対応デバイスを提供し、音声駆動技術のセキュリティを保証する。
現在のSV評価プラクティスは偏見を評価するには不十分であり、実際の使用シナリオを代表してではなく、過度に単純化され、ユーザを集約している。
本稿では,これらの欠点に対処するSV評価データセットを構築するための設計ガイドラインを提案する。
論文 参考訳(メタデータ) (2022-04-05T15:28:26Z) - ASVspoof 2021: accelerating progress in spoofed and deepfake speech
detection [70.45884214674057]
ASVspoof 2021は、スプーフの研究を促進するための2年制の課題の第4版である。
本稿では,3つのタスク,それぞれのデータベース,評価基準,4つの課題ベースライン,評価プラットフォーム,課題結果の要約について述べる。
論文 参考訳(メタデータ) (2021-09-01T16:17:31Z) - ASVspoof 2021: Automatic Speaker Verification Spoofing and
Countermeasures Challenge Evaluation Plan [70.45884214674057]
ASVspoof 2021は、二年制で競争上の課題の4番目である。
目標は、ボナ・フェイドとスプーフ・ディープフェイク・スピーチを区別できる対策を開発することである。
論文 参考訳(メタデータ) (2021-09-01T15:32:28Z) - Improving the Adversarial Robustness for Speaker Verification by Self-Supervised Learning [95.60856995067083]
この研究は、特定の攻撃アルゴリズムを知らずにASVの敵防衛を行う最初の試みの一つである。
本研究の目的は,1) 対向摂動浄化と2) 対向摂動検出の2つの視点から対向防御を行うことである。
実験の結果, 検出モジュールは, 約80%の精度で対向検体を検出することにより, ASVを効果的に遮蔽することがわかった。
論文 参考訳(メタデータ) (2021-06-01T07:10:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。