論文の概要: Spoofing-Aware Speaker Verification with Unsupervised Domain Adaptation
- arxiv url: http://arxiv.org/abs/2203.10992v1
- Date: Mon, 21 Mar 2022 14:02:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-22 21:27:05.506255
- Title: Spoofing-Aware Speaker Verification with Unsupervised Domain Adaptation
- Title(参考訳): 教師なし領域適応によるスプーフィングアウェア話者照合
- Authors: Xuechen Liu, Md Sahidullah, Tomi Kinnunen
- Abstract要約: 対策モジュールの一次存在なしに自動話者検証システムの堅牢性を向上する。
オーディオデータを用いてバックエンドを最適化するために,教師なし領域適応手法を3つ採用する。
論理アクセスシナリオと物理アクセスシナリオの両方において顕著な改善が示された。
- 参考スコア(独自算出の注目度): 18.684888457998284
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we initiate the concern of enhancing the spoofing robustness
of the automatic speaker verification (ASV) system, without the primary
presence of a separate countermeasure module. We start from the standard ASV
framework of the ASVspoof 2019 baseline and approach the problem from the
back-end classifier based on probabilistic linear discriminant analysis. We
employ three unsupervised domain adaptation techniques to optimize the back-end
using the audio data in the training partition of the ASVspoof 2019 dataset. We
demonstrate notable improvements on both logical and physical access scenarios,
especially on the latter where the system is attacked by replayed audios, with
a maximum of 36.1% and 5.3% relative improvement on bonafide and spoofed cases,
respectively. We perform additional studies such as per-attack breakdown
analysis, data composition, and integration with a countermeasure system at
score-level with Gaussian back-end.
- Abstract(参考訳): 本稿では,自動話者検証システム(ASV)のスプーフィングロバスト性向上への懸念を,個別の対策モジュールの一次存在なしに開始する。
ASVspoof 2019 ベースラインの標準 ASV フレームワークから始めて,確率線形判別分析に基づくバックエンド分類器から問題にアプローチする。
我々は,asvspoof 2019データセットのトレーニングパーティションにおける音声データを用いたバックエンドを最適化するために,教師なしドメイン適応手法を3つ採用した。
論理アクセスシナリオと物理アクセスシナリオの両方において,特にシステムが再生音声によって攻撃される場合において,ボナフィドケースとスプーフドケースにおいて,最大36.1%と5.3%の相対的な改善が見られた。
攻撃毎のブレークダウン分析,データ構成,ガウスのバックエンドとスコアレベルでの対策システムとの統合などの追加研究を行う。
関連論文リスト
- Generalizing Speaker Verification for Spoof Awareness in the Embedding
Space [30.094557217931563]
ASVシステムは様々な種類の敵を用いて偽造することができる。
本稿では,ディープニューラルネットワークに基づく新しいバックエンド分類手法を提案する。
ASVspoof 2019論理アクセスデータセットで実験が行われる。
論文 参考訳(メタデータ) (2024-01-20T07:30:22Z) - MLCA-AVSR: Multi-Layer Cross Attention Fusion based Audio-Visual Speech
Recognition [68.70787870401159]
異なるレベルのオーディオ/視覚エンコーダに融合することで、各モードの表現を促進する多層クロスアテンション融合に基づくAVSR手法を提案する。
提案手法は第1位システムを超え,新たなSOTA cpCERの29.13%をこのデータセット上に構築する。
論文 参考訳(メタデータ) (2024-01-07T08:59:32Z) - Audio Anti-spoofing Using a Simple Attention Module and Joint
Optimization Based on Additive Angular Margin Loss and Meta-learning [43.519717601587864]
本研究では,畳み込み層における特徴写像に対する3次元の注意重みを推定するための単純な注意モジュールを提案する。
2進分類のための重み付き加法的角縁損失に基づく共同最適化手法を提案する。
提案手法は, プールEERが0.99%, min t-DCFが0.0289。
論文 参考訳(メタデータ) (2022-11-17T21:25:29Z) - Low-complexity deep learning frameworks for acoustic scene
classification [64.22762153453175]
音響シーン分類(ASC)のための低複雑さ深層学習フレームワークを提案する。
提案するフレームワークは、フロントエンドのスペクトログラム抽出、オンラインデータ拡張、バックエンドの分類、予測される確率の後期融合の4つの主要なステップに分けることができる。
DCASE 2022 Task 1 Development データセットで実施した実験は,低複雑さの要求を十分に満たし,最も高い分類精度を 60.1% で達成した。
論文 参考訳(メタデータ) (2022-06-13T11:41:39Z) - Optimizing Tandem Speaker Verification and Anti-Spoofing Systems [45.66319648049384]
本稿では,t-DCFの微分可能なバージョンを作成し,強化学習の手法を用いてタンデムシステムを直接最適化することを提案する。
この手法は,ASVSpoof19データセットにおけるt-DCFの相対的改善率を20%向上させる。
論文 参考訳(メタデータ) (2022-01-24T14:27:28Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - Unsupervised Domain Adaptation for Speech Recognition via Uncertainty
Driven Self-Training [55.824641135682725]
WSJ をソースドメインとし,TED-Lium 3 とSWITCHBOARD を併用したドメイン適応実験を行った。
論文 参考訳(メタデータ) (2020-11-26T18:51:26Z) - Audio Spoofing Verification using Deep Convolutional Neural Networks by
Transfer Learning [0.0]
本稿では,スプーフィング攻撃を検出するために,ディープ畳み込みニューラルネットワークに基づく音声分類器を提案する。
提案手法は,メル周波数スケールにおけるパワースペクトル密度の音響的時間周波数表現を用いた。
我々は、開発において0.9056%、論理アクセスシナリオの評価データセットにおいて5.32%の誤差率(EER)を達成した。
論文 参考訳(メタデータ) (2020-08-08T07:14:40Z) - Dynamically Mitigating Data Discrepancy with Balanced Focal Loss for
Replay Attack Detection [10.851348154870852]
我々は、アンチ・スプーフィングにおいては、モデリングプロセスにおいて容易に分類されたサンプルよりも識別不能なサンプルに注意が必要であると論じている。
本研究は, サンプル自体の特性に基づいて, 損失を動的にスケールする訓練目的として, バランスの取れた焦点損失関数を活用することを提案する。
相補的な特徴により、3種類の機能しか持たない融合系は他のシステムよりも22.5%、min-tDCFが7%、EERが7%向上する。
論文 参考訳(メタデータ) (2020-06-25T17:06:47Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。