論文の概要: Spoofing-Aware Speaker Verification by Multi-Level Fusion
- arxiv url: http://arxiv.org/abs/2203.15377v1
- Date: Tue, 29 Mar 2022 09:16:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 02:12:32.089750
- Title: Spoofing-Aware Speaker Verification by Multi-Level Fusion
- Title(参考訳): マルチレベル融合によるスプーフィングアウェア話者照合
- Authors: Haibin Wu, Lingwei Meng, Jiawen Kang, Jinchao Li, Xu Li, Xixin Wu,
Hung-yi Lee, Helen Meng
- Abstract要約: 自覚的話者検証(SASV)課題は、統合CMモデルとASVモデルの研究を促進することを目的としている。
本稿では,SASVタスクに対処する新しいマルチモデルとマルチレベル融合戦略を提案する。
- 参考スコア(独自算出の注目度): 86.19341932163813
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Recently, many novel techniques have been introduced to deal with spoofing
attacks, and achieve promising countermeasure (CM) performances. However, these
works only take the stand-alone CM models into account. Nowadays, a spoofing
aware speaker verification (SASV) challenge which aims to facilitate the
research of integrated CM and ASV models, arguing that jointly optimizing CM
and ASV models will lead to better performance, is taking place. In this paper,
we propose a novel multi-model and multi-level fusion strategy to tackle the
SASV task. Compared with purely scoring fusion and embedding fusion methods,
this framework first utilizes embeddings from CM models, propagating CM
embeddings into a CM block to obtain a CM score. In the second-level fusion,
the CM score and ASV scores directly from ASV systems will be concatenated into
a prediction block for the final decision. As a result, the best single fusion
system has achieved the SASV-EER of 0.97% on the evaluation set. Then by
ensembling the top-5 fusion systems, the final SASV-EER reached 0.89%.
- Abstract(参考訳): 近年,スプーフィング攻撃に対処し,有望な対策(CM)を実現する新しい手法が数多く導入されている。
しかし、これらの作品は単独のcmモデルのみを考慮に入れている。
近年,統合型CMモデルとASVモデルの研究を促進することを目的とした,認識型話者検証(SASV)の課題が表面化しており,CMモデルとASVモデルの共同最適化がパフォーマンスの向上につながると主張している。
本稿では,SASVタスクに取り組むための新しいマルチモデルとマルチレベル融合戦略を提案する。
このフレームワークは、純粋にスコアリングされた融合および埋め込み融合法と比較して、まずCMモデルからの埋め込みを利用し、CMブロックにCM埋め込みを伝播してCMスコアを得る。
第2レベル融合では、ASVシステムから直接CMスコアとASVスコアが最終決定の予測ブロックに連結される。
その結果、最高の単核融合系は、評価セットで0.97%のSASV-EERを達成した。
その後、トップ5核融合系を組み立て、最終的なSASV-EERは0.89%に達した。
関連論文リスト
- Generalizing Speaker Verification for Spoof Awareness in the Embedding
Space [30.094557217931563]
ASVシステムは様々な種類の敵を用いて偽造することができる。
本稿では,ディープニューラルネットワークに基づく新しいバックエンド分類手法を提案する。
ASVspoof 2019論理アクセスデータセットで実験が行われる。
論文 参考訳(メタデータ) (2024-01-20T07:30:22Z) - Towards single integrated spoofing-aware speaker verification embeddings [63.42889348690095]
本研究は,1つの統合スプーフィング対応話者検証埋め込みを開発することを目的とする。
単一のSASV埋め込みの劣った性能は、不十分なトレーニングデータから得られると分析する。
実験では、SASV2022チャレンジの評価プロトコルにおいて、SASV-EERが1.06%に達するという劇的な改善が示された。
論文 参考訳(メタデータ) (2023-05-30T14:15:39Z) - Adapted Multimodal BERT with Layer-wise Fusion for Sentiment Analysis [84.12658971655253]
本稿では,マルチモーダルタスクのためのBERTベースのアーキテクチャであるAdapted Multimodal BERTを提案する。
アダプタはタスクの事前訓練された言語モデルを手動で調整し、融合層はタスク固有の層ワイドな音声視覚情報とテキストBERT表現を融合させる。
われわれは、このアプローチがより効率的なモデルにつながり、微調整されたモデルよりも優れ、ノイズの入力に堅牢であることを示した。
論文 参考訳(メタデータ) (2022-12-01T17:31:42Z) - Learning with MISELBO: The Mixture Cookbook [62.75516608080322]
本稿では,VampPriorとPixelCNNデコーダネットワークを用いて,フローベース階層型変分オートエンコーダ(VAE)の正規化のための変分近似を初めて提案する。
我々は、この協調行動について、VIと適応的重要度サンプリングの新たな関係を描いて説明する。
我々は、MNISTおよびFashionMNISTデータセット上の負のログ類似度の観点から、VAEアーキテクチャの最先端結果を得る。
論文 参考訳(メタデータ) (2022-09-30T15:01:35Z) - Tackling Spoofing-Aware Speaker Verification with Multi-Model Fusion [88.34134732217416]
この研究は、融合に基づくSASVソリューションに焦点を当て、複数の最先端 ASV と CM モデルのパワーを利用するマルチモデル融合フレームワークを提案する。
提案したフレームワークはSASV-EERを8.75%から1.17%に大幅に改善している。
論文 参考訳(メタデータ) (2022-06-18T06:41:06Z) - Optimizing Tandem Speaker Verification and Anti-Spoofing Systems [45.66319648049384]
本稿では,t-DCFの微分可能なバージョンを作成し,強化学習の手法を用いてタンデムシステムを直接最適化することを提案する。
この手法は,ASVSpoof19データセットにおけるt-DCFの相対的改善率を20%向上させる。
論文 参考訳(メタデータ) (2022-01-24T14:27:28Z) - Tandem Assessment of Spoofing Countermeasures and Automatic Speaker
Verification: Fundamentals [59.34844017757795]
同一誤差率(EER)測定値を用いて,スプーフィング対策(CM)の信頼性を測る。
本稿では,タンデム検出コスト関数(t-DCF)の新たな拡張について述べる。
CMアセスメントにおけるt-DCFの導入は、アンチ・スプーフィングとASV研究コミュニティの緊密な連携を促進するのに役立つと期待されている。
論文 参考訳(メタデータ) (2020-07-12T12:44:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。