論文の概要: Generalizing Speaker Verification for Spoof Awareness in the Embedding
Space
- arxiv url: http://arxiv.org/abs/2401.11156v2
- Date: Sun, 28 Jan 2024 02:53:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 20:25:04.958488
- Title: Generalizing Speaker Verification for Spoof Awareness in the Embedding
Space
- Title(参考訳): 埋め込み空間におけるspoof認識のための話者照合の一般化
- Authors: Xuechen Liu, Md Sahidullah, Kong Aik Lee, Tomi Kinnunen
- Abstract要約: ASVシステムは様々な種類の敵を用いて偽造することができる。
本稿では,ディープニューラルネットワークに基づく新しいバックエンド分類手法を提案する。
ASVspoof 2019論理アクセスデータセットで実験が行われる。
- 参考スコア(独自算出の注目度): 30.094557217931563
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: It is now well-known that automatic speaker verification (ASV) systems can be
spoofed using various types of adversaries. The usual approach to counteract
ASV systems against such attacks is to develop a separate spoofing
countermeasure (CM) module to classify speech input either as a bonafide, or a
spoofed utterance. Nevertheless, such a design requires additional computation
and utilization efforts at the authentication stage. An alternative strategy
involves a single monolithic ASV system designed to handle both zero-effort
imposter (non-targets) and spoofing attacks. Such spoof-aware ASV systems have
the potential to provide stronger protections and more economic computations.
To this end, we propose to generalize the standalone ASV (G-SASV) against
spoofing attacks, where we leverage limited training data from CM to enhance a
simple backend in the embedding space, without the involvement of a separate CM
module during the test (authentication) phase. We propose a novel yet simple
backend classifier based on deep neural networks and conduct the study via
domain adaptation and multi-task integration of spoof embeddings at the
training stage. Experiments are conducted on the ASVspoof 2019 logical access
dataset, where we improve the performance of statistical ASV backends on the
joint (bonafide and spoofed) and spoofed conditions by a maximum of 36.2% and
49.8% in terms of equal error rates, respectively.
- Abstract(参考訳): 現在、様々な種類の敵を用いて自動話者検証(ASV)システムを構築することが知られている。
このような攻撃に対してasvシステムを対抗させる一般的なアプローチは、音声入力をボナフィドまたはスプーフ化発話として分類する独立したスプーフ化対策(cm)モジュールを開発することである。
それにもかかわらず、このような設計は認証段階でさらなる計算と利用の努力を必要とする。
代替戦略として、ゼロフォートインポスタ(非ターゲット)と偽造攻撃の両方を扱うように設計された単一のモノリシックなASVシステムがある。
このようなspoof-aware asvシステムは、より強力な保護とより経済的な計算を提供する可能性がある。
そこで我々は,テスト(認証)フェーズにおいて,独立したCMモジュールを介さずに,CMからの限られたトレーニングデータを活用して埋め込み空間における単純なバックエンドを強化する,スプーフィング攻撃に対するスタンドアロンASV(G-SASV)の一般化を提案する。
本稿では、深層ニューラルネットワークに基づく新しいバックエンド分類器を提案し、ドメイン適応と訓練段階におけるスプーフ埋め込みのマルチタスク統合による研究を行う。
実験はasvspoof 2019の論理アクセスデータセット上で行われ、ジョイント(ボナフィドとスプーフド)とスプーフド条件の統計的なasvバックエンドの性能を、それぞれ同じエラー率で最大36.2%、49.8%改善する。
関連論文リスト
- Towards single integrated spoofing-aware speaker verification embeddings [63.42889348690095]
本研究は,1つの統合スプーフィング対応話者検証埋め込みを開発することを目的とする。
単一のSASV埋め込みの劣った性能は、不十分なトレーニングデータから得られると分析する。
実験では、SASV2022チャレンジの評価プロトコルにおいて、SASV-EERが1.06%に達するという劇的な改善が示された。
論文 参考訳(メタデータ) (2023-05-30T14:15:39Z) - Voice Spoofing Countermeasures: Taxonomy, State-of-the-art, experimental
analysis of generalizability, open challenges, and the way forward [2.393661358372807]
本報告では,手作り特徴,ディープラーニング,エンドツーエンド,汎用スプーフィング対策ソリューションを用いたスプーフィング検出に関する文献のレビューを行う。
本稿では,これらの対策の有効性をいくつかのデータセットで報告し,コーパス間で評価する。
論文 参考訳(メタデータ) (2022-10-02T03:53:37Z) - Tackling Spoofing-Aware Speaker Verification with Multi-Model Fusion [88.34134732217416]
この研究は、融合に基づくSASVソリューションに焦点を当て、複数の最先端 ASV と CM モデルのパワーを利用するマルチモデル融合フレームワークを提案する。
提案したフレームワークはSASV-EERを8.75%から1.17%に大幅に改善している。
論文 参考訳(メタデータ) (2022-06-18T06:41:06Z) - Spoofing-Aware Speaker Verification with Unsupervised Domain Adaptation [18.684888457998284]
対策モジュールの一次存在なしに自動話者検証システムの堅牢性を向上する。
オーディオデータを用いてバックエンドを最適化するために,教師なし領域適応手法を3つ採用する。
論理アクセスシナリオと物理アクセスシナリオの両方において顕著な改善が示された。
論文 参考訳(メタデータ) (2022-03-21T14:02:06Z) - Optimizing Tandem Speaker Verification and Anti-Spoofing Systems [45.66319648049384]
本稿では,t-DCFの微分可能なバージョンを作成し,強化学習の手法を用いてタンデムシステムを直接最適化することを提案する。
この手法は,ASVSpoof19データセットにおけるt-DCFの相対的改善率を20%向上させる。
論文 参考訳(メタデータ) (2022-01-24T14:27:28Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - Adversarial Defense for Automatic Speaker Verification by
Self-Supervised Learning [101.42920161993455]
この研究は、特定の攻撃アルゴリズムを知らずにASVの敵防衛を行う最初の試みの一つである。
本研究の目的は,1) 対向摂動浄化と2) 対向摂動検出の2つの視点から対向防御を行うことである。
実験の結果, 検出モジュールは, 約80%の精度で対向検体を検出することにより, ASVを効果的に遮蔽することがわかった。
論文 参考訳(メタデータ) (2021-06-01T07:10:54Z) - Tandem Assessment of Spoofing Countermeasures and Automatic Speaker
Verification: Fundamentals [59.34844017757795]
同一誤差率(EER)測定値を用いて,スプーフィング対策(CM)の信頼性を測る。
本稿では,タンデム検出コスト関数(t-DCF)の新たな拡張について述べる。
CMアセスメントにおけるt-DCFの導入は、アンチ・スプーフィングとASV研究コミュニティの緊密な連携を促進するのに役立つと期待されている。
論文 参考訳(メタデータ) (2020-07-12T12:44:08Z) - Investigating Robustness of Adversarial Samples Detection for Automatic
Speaker Verification [78.51092318750102]
本研究は,ASVシステムに対して,別個の検出ネットワークによる敵攻撃から防御することを提案する。
VGGライクな二分分類検出器を導入し、対向サンプルの検出に有効であることが実証された。
論文 参考訳(メタデータ) (2020-06-11T04:31:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。