論文の概要: Spoofing-Aware Speaker Verification with Unsupervised Domain Adaptation
- arxiv url: http://arxiv.org/abs/2203.10992v1
- Date: Mon, 21 Mar 2022 14:02:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-22 21:27:05.506255
- Title: Spoofing-Aware Speaker Verification with Unsupervised Domain Adaptation
- Title(参考訳): 教師なし領域適応によるスプーフィングアウェア話者照合
- Authors: Xuechen Liu, Md Sahidullah, Tomi Kinnunen
- Abstract要約: 対策モジュールの一次存在なしに自動話者検証システムの堅牢性を向上する。
オーディオデータを用いてバックエンドを最適化するために,教師なし領域適応手法を3つ採用する。
論理アクセスシナリオと物理アクセスシナリオの両方において顕著な改善が示された。
- 参考スコア(独自算出の注目度): 18.684888457998284
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we initiate the concern of enhancing the spoofing robustness
of the automatic speaker verification (ASV) system, without the primary
presence of a separate countermeasure module. We start from the standard ASV
framework of the ASVspoof 2019 baseline and approach the problem from the
back-end classifier based on probabilistic linear discriminant analysis. We
employ three unsupervised domain adaptation techniques to optimize the back-end
using the audio data in the training partition of the ASVspoof 2019 dataset. We
demonstrate notable improvements on both logical and physical access scenarios,
especially on the latter where the system is attacked by replayed audios, with
a maximum of 36.1% and 5.3% relative improvement on bonafide and spoofed cases,
respectively. We perform additional studies such as per-attack breakdown
analysis, data composition, and integration with a countermeasure system at
score-level with Gaussian back-end.
- Abstract(参考訳): 本稿では,自動話者検証システム(ASV)のスプーフィングロバスト性向上への懸念を,個別の対策モジュールの一次存在なしに開始する。
ASVspoof 2019 ベースラインの標準 ASV フレームワークから始めて,確率線形判別分析に基づくバックエンド分類器から問題にアプローチする。
我々は,asvspoof 2019データセットのトレーニングパーティションにおける音声データを用いたバックエンドを最適化するために,教師なしドメイン適応手法を3つ採用した。
論理アクセスシナリオと物理アクセスシナリオの両方において,特にシステムが再生音声によって攻撃される場合において,ボナフィドケースとスプーフドケースにおいて,最大36.1%と5.3%の相対的な改善が見られた。
攻撃毎のブレークダウン分析,データ構成,ガウスのバックエンドとスコアレベルでの対策システムとの統合などの追加研究を行う。
関連論文リスト
- Toward Improving Synthetic Audio Spoofing Detection Robustness via Meta-Learning and Disentangled Training With Adversarial Examples [33.445126880876415]
自動話者検証システムに到達させる代わりに、スプーフ攻撃をフィルタリングする信頼性と堅牢なスプーフ検出システムを提案する。
データ不均衡問題に対処するために重み付き加法的角縁損失が提案され、スプーフィング攻撃に対する一般化を改善するために異なるマージンが割り当てられている。
データ拡張戦略として、スプーフィング音声に知覚不能な摂動を加えて、敵の例にのみ対応する正規化統計が実行されることを保証するために、補助的なバッチ正規化を用いる。
論文 参考訳(メタデータ) (2024-08-23T19:26:54Z) - ASVspoof 5: Crowdsourced Speech Data, Deepfakes, and Adversarial Attacks at Scale [59.25180900687571]
ASVspoof 5は、音声スプーフとディープフェイク攻撃の研究を促進する一連の課題の第5版である。
本稿では,2つの課題トラック,新しいデータベース,評価指標,評価プラットフォームについて述べる。
論文 参考訳(メタデータ) (2024-08-16T13:37:20Z) - Generalizing Speaker Verification for Spoof Awareness in the Embedding
Space [30.094557217931563]
ASVシステムは様々な種類の敵を用いて偽造することができる。
本稿では,ディープニューラルネットワークに基づく新しいバックエンド分類手法を提案する。
ASVspoof 2019論理アクセスデータセットで実験が行われる。
論文 参考訳(メタデータ) (2024-01-20T07:30:22Z) - MLCA-AVSR: Multi-Layer Cross Attention Fusion based Audio-Visual Speech Recognition [62.89464258519723]
異なるレベルのオーディオ/視覚エンコーダに融合することで、各モードの表現を促進する多層クロスアテンション融合に基づくAVSR手法を提案する。
提案手法は第1位システムを超え,新たなSOTA cpCERの29.13%をこのデータセット上に構築する。
論文 参考訳(メタデータ) (2024-01-07T08:59:32Z) - Audio Anti-spoofing Using a Simple Attention Module and Joint
Optimization Based on Additive Angular Margin Loss and Meta-learning [43.519717601587864]
本研究では,畳み込み層における特徴写像に対する3次元の注意重みを推定するための単純な注意モジュールを提案する。
2進分類のための重み付き加法的角縁損失に基づく共同最適化手法を提案する。
提案手法は, プールEERが0.99%, min t-DCFが0.0289。
論文 参考訳(メタデータ) (2022-11-17T21:25:29Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - Bayesian Learning for Deep Neural Network Adaptation [57.70991105736059]
音声認識システムにおける重要な課題は、しばしば話者差に起因する訓練データと評価データとのミスマッチを減らすことである。
モデルに基づく話者適応手法は、ロバスト性を確保するために十分な量のターゲット話者データを必要とすることが多い。
本稿では,話者依存型(SD)パラメータの不確かさをモデル化するための,ベイズ学習に基づくDNN話者適応フレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-14T12:30:41Z) - Unsupervised Domain Adaptation for Speech Recognition via Uncertainty
Driven Self-Training [55.824641135682725]
WSJ をソースドメインとし,TED-Lium 3 とSWITCHBOARD を併用したドメイン適応実験を行った。
論文 参考訳(メタデータ) (2020-11-26T18:51:26Z) - Audio Spoofing Verification using Deep Convolutional Neural Networks by
Transfer Learning [0.0]
本稿では,スプーフィング攻撃を検出するために,ディープ畳み込みニューラルネットワークに基づく音声分類器を提案する。
提案手法は,メル周波数スケールにおけるパワースペクトル密度の音響的時間周波数表現を用いた。
我々は、開発において0.9056%、論理アクセスシナリオの評価データセットにおいて5.32%の誤差率(EER)を達成した。
論文 参考訳(メタデータ) (2020-08-08T07:14:40Z) - Dynamically Mitigating Data Discrepancy with Balanced Focal Loss for
Replay Attack Detection [10.851348154870852]
我々は、アンチ・スプーフィングにおいては、モデリングプロセスにおいて容易に分類されたサンプルよりも識別不能なサンプルに注意が必要であると論じている。
本研究は, サンプル自体の特性に基づいて, 損失を動的にスケールする訓練目的として, バランスの取れた焦点損失関数を活用することを提案する。
相補的な特徴により、3種類の機能しか持たない融合系は他のシステムよりも22.5%、min-tDCFが7%、EERが7%向上する。
論文 参考訳(メタデータ) (2020-06-25T17:06:47Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。