論文の概要: Optimizing Tandem Speaker Verification and Anti-Spoofing Systems
- arxiv url: http://arxiv.org/abs/2201.09709v1
- Date: Mon, 24 Jan 2022 14:27:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-25 21:08:45.818466
- Title: Optimizing Tandem Speaker Verification and Anti-Spoofing Systems
- Title(参考訳): タンデム話者の最適検証とアンチスプーフィングシステム
- Authors: Anssi Kanervisto, Ville Hautam\"aki, Tomi Kinnunen, Junichi Yamagishi
- Abstract要約: 本稿では,t-DCFの微分可能なバージョンを作成し,強化学習の手法を用いてタンデムシステムを直接最適化することを提案する。
この手法は,ASVSpoof19データセットにおけるt-DCFの相対的改善率を20%向上させる。
- 参考スコア(独自算出の注目度): 45.66319648049384
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As automatic speaker verification (ASV) systems are vulnerable to spoofing
attacks, they are typically used in conjunction with spoofing countermeasure
(CM) systems to improve security. For example, the CM can first determine
whether the input is human speech, then the ASV can determine whether this
speech matches the speaker's identity. The performance of such a tandem system
can be measured with a tandem detection cost function (t-DCF). However, ASV and
CM systems are usually trained separately, using different metrics and data,
which does not optimize their combined performance. In this work, we propose to
optimize the tandem system directly by creating a differentiable version of
t-DCF and employing techniques from reinforcement learning. The results
indicate that these approaches offer better outcomes than finetuning, with our
method providing a 20% relative improvement in the t-DCF in the ASVSpoof19
dataset in a constrained setting.
- Abstract(参考訳): 自動話者検証(ASV)システムはスプーフィング攻撃に弱いため、セキュリティを改善するためにスプーフィング対策(CM)システムと組み合わせて使用されるのが一般的である。
例えば、CMはまず入力が人間の音声かどうかを判断し、ASVは、この音声が話者の身元と一致するかどうかを決定する。
このようなタンデムシステムの性能をタンデム検出コスト関数(t−dcf)で測定することができる。
しかし、asvとcmシステムは通常、異なるメトリクスとデータを使用して別々に訓練され、パフォーマンスを最適化しない。
本研究では,t-DCFの微分可能バージョンを作成し,強化学習の手法を用いてタンデムシステムを直接最適化することを提案する。
提案手法は,ASVSpoof19データセットにおけるt-DCFの相対的改善率を,制約条件下で20%向上させる。
関連論文リスト
- Toward Improving Synthetic Audio Spoofing Detection Robustness via Meta-Learning and Disentangled Training With Adversarial Examples [33.445126880876415]
自動話者検証システムに到達させる代わりに、スプーフ攻撃をフィルタリングする信頼性と堅牢なスプーフ検出システムを提案する。
データ不均衡問題に対処するために重み付き加法的角縁損失が提案され、スプーフィング攻撃に対する一般化を改善するために異なるマージンが割り当てられている。
データ拡張戦略として、スプーフィング音声に知覚不能な摂動を加えて、敵の例にのみ対応する正規化統計が実行されることを保証するために、補助的なバッチ正規化を用いる。
論文 参考訳(メタデータ) (2024-08-23T19:26:54Z) - Generalizing Speaker Verification for Spoof Awareness in the Embedding
Space [30.094557217931563]
ASVシステムは様々な種類の敵を用いて偽造することができる。
本稿では,ディープニューラルネットワークに基づく新しいバックエンド分類手法を提案する。
ASVspoof 2019論理アクセスデータセットで実験が行われる。
論文 参考訳(メタデータ) (2024-01-20T07:30:22Z) - Audio Anti-spoofing Using a Simple Attention Module and Joint
Optimization Based on Additive Angular Margin Loss and Meta-learning [43.519717601587864]
本研究では,畳み込み層における特徴写像に対する3次元の注意重みを推定するための単純な注意モジュールを提案する。
2進分類のための重み付き加法的角縁損失に基づく共同最適化手法を提案する。
提案手法は, プールEERが0.99%, min t-DCFが0.0289。
論文 参考訳(メタデータ) (2022-11-17T21:25:29Z) - Fully Automated End-to-End Fake Audio Detection [57.78459588263812]
本稿では,完全自動エンドツーエンド音声検出手法を提案する。
まず、wav2vec事前学習モデルを用いて、音声の高レベル表現を得る。
ネットワーク構造には, Light-DARTS という異種アーキテクチャサーチ (DARTS) の修正版を用いる。
論文 参考訳(メタデータ) (2022-08-20T06:46:55Z) - Tackling Spoofing-Aware Speaker Verification with Multi-Model Fusion [88.34134732217416]
この研究は、融合に基づくSASVソリューションに焦点を当て、複数の最先端 ASV と CM モデルのパワーを利用するマルチモデル融合フレームワークを提案する。
提案したフレームワークはSASV-EERを8.75%から1.17%に大幅に改善している。
論文 参考訳(メタデータ) (2022-06-18T06:41:06Z) - Anti-Spoofing Using Transfer Learning with Variational Information
Bottleneck [6.918364447822298]
本稿では,音声のアンチ・スプーフィングタスクのための変動情報ボトルネックを持つwav2vec 2.0事前学習モデルに基づく伝達学習手法を提案する。
提案手法は,現在最先端のアンチ・スプーフィングシステムよりも優れており,未知のスプーフィングと真正の音声を区別する性能を向上させる。
論文 参考訳(メタデータ) (2022-04-04T11:08:21Z) - Unsupervised Domain Adaptation for Speech Recognition via Uncertainty
Driven Self-Training [55.824641135682725]
WSJ をソースドメインとし,TED-Lium 3 とSWITCHBOARD を併用したドメイン適応実験を行った。
論文 参考訳(メタデータ) (2020-11-26T18:51:26Z) - Tandem Assessment of Spoofing Countermeasures and Automatic Speaker
Verification: Fundamentals [59.34844017757795]
同一誤差率(EER)測定値を用いて,スプーフィング対策(CM)の信頼性を測る。
本稿では,タンデム検出コスト関数(t-DCF)の新たな拡張について述べる。
CMアセスメントにおけるt-DCFの導入は、アンチ・スプーフィングとASV研究コミュニティの緊密な連携を促進するのに役立つと期待されている。
論文 参考訳(メタデータ) (2020-07-12T12:44:08Z) - An initial investigation on optimizing tandem speaker verification and
countermeasure systems using reinforcement learning [45.66319648049384]
我々は, 強化学習を用いて, ASV と CM コンポーネントを併用して, より優れた t-DCF 尺度を学習する。
比較した標準的な教師あり学習技術よりも信頼性の高い結果が得られることを実証する。
論文 参考訳(メタデータ) (2020-02-06T15:13:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。