論文の概要: Spotting adversarial samples for speaker verification by neural vocoders
- arxiv url: http://arxiv.org/abs/2107.00309v1
- Date: Thu, 1 Jul 2021 08:58:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-02 21:06:25.746609
- Title: Spotting adversarial samples for speaker verification by neural vocoders
- Title(参考訳): ニューラルボコーダによる話者検証のための対向サンプルの抽出
- Authors: Haibin Wu, Po-chun Hsu, Ji Gao, Shanshan Zhang, Shen Huang, Jian Kang,
Zhiyong Wu, Helen Meng, Hung-yi Lee
- Abstract要約: 本稿では,ASVの対立サンプルを見つけるために,ニューラルボコーダを用いる。
我々はニューラルボコーダを用いて音声を再合成し、元のオーディオと再合成オーディオのASVスコアの違いが真のサンプルを識別するのに良い指標であることを示す。
- 参考スコア(独自算出の注目度): 102.1486475058963
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Automatic speaker verification (ASV), one of the most important technology
for biometric identification, has been widely adopted in security-critic
applications, including transaction authentication and access control. However,
previous works have shown ASV is seriously vulnerable to recently emerged
adversarial attacks, yet effective countermeasures against them are limited. In
this paper, we adopt neural vocoders to spot adversarial samples for ASV. We
use neural vocoder to re-synthesize audio and find that the difference between
the ASV scores for the original and re-synthesized audio is a good indicator to
distinguish genuine and adversarial samples. As the very beginning work in this
direction of detecting adversarial samples for ASV, there is no reliable
baseline for comparison. So we first implement Griffin-Lim for detection and
set it as our baseline. The proposed method accomplishes effective detection
performance and outperforms all the baselines in all the settings. We also show
the neural vocoder adopted in the detection framework is dataset independent.
Our codes will be made open-source for future works to do comparison.
- Abstract(参考訳): 生体認証の最も重要な技術の一つである自動話者認証(ASV)は、トランザクション認証やアクセス制御を含むセキュリティクリティカルなアプリケーションで広く採用されている。
しかし、以前の研究では、ASVは最近出現した敵の攻撃に対して深刻な脆弱性があることが示されている。
本稿では,ASVの対立サンプルを見つけるために,ニューラルボコーダを用いる。
我々はニューラルボコーダを用いて音声を再合成し、元のオーディオと再合成オーディオのASVスコアの違いが真正と逆正のサンプルを識別するのに良い指標であることを示す。
asvの逆のサンプルを検出するこの方向のごく初期の作業であるため、比較のための信頼できるベースラインは存在しない。
そこでまず、検出のためにGriffin-Limを実装し、ベースラインとして設定します。
提案手法は効果的な検出性能を達成し,すべての設定においてベースラインを上回っている。
また,検出フレームワークで採用されているニューラルボコーダがデータセットに依存しないことも示す。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
関連論文リスト
- Toward Improving Synthetic Audio Spoofing Detection Robustness via Meta-Learning and Disentangled Training With Adversarial Examples [33.445126880876415]
自動話者検証システムに到達させる代わりに、スプーフ攻撃をフィルタリングする信頼性と堅牢なスプーフ検出システムを提案する。
データ不均衡問題に対処するために重み付き加法的角縁損失が提案され、スプーフィング攻撃に対する一般化を改善するために異なるマージンが割り当てられている。
データ拡張戦略として、スプーフィング音声に知覚不能な摂動を加えて、敵の例にのみ対応する正規化統計が実行されることを保証するために、補助的なバッチ正規化を用いる。
論文 参考訳(メタデータ) (2024-08-23T19:26:54Z) - LMD: A Learnable Mask Network to Detect Adversarial Examples for Speaker
Verification [17.968334617708244]
本稿では,攻撃者に依存しない,解釈可能な手法を提案する。
スコア変動検出器の中核成分は、ニューラルネットワークによりマスクされた分光図を生成することである。
提案手法は,5つの最先端のベースラインより優れている。
論文 参考訳(メタデータ) (2022-11-02T02:03:53Z) - Voice Spoofing Countermeasures: Taxonomy, State-of-the-art, experimental
analysis of generalizability, open challenges, and the way forward [2.393661358372807]
本報告では,手作り特徴,ディープラーニング,エンドツーエンド,汎用スプーフィング対策ソリューションを用いたスプーフィング検出に関する文献のレビューを行う。
本稿では,これらの対策の有効性をいくつかのデータセットで報告し,コーパス間で評価する。
論文 参考訳(メタデータ) (2022-10-02T03:53:37Z) - Voting for the right answer: Adversarial defense for speaker
verification [79.10523688806852]
ASVは敵の攻撃のレーダー下にあり、これは人間の知覚による本来の攻撃と似ている。
盲点領域におけるASVのリスクの高い決定を防止するため、「正しい回答を求める」という考え方を提案する。
実験結果から,本手法は両攻撃者に対するロバスト性を向上することが示された。
論文 参考訳(メタデータ) (2021-06-15T04:05:28Z) - Improving the Adversarial Robustness for Speaker Verification by Self-Supervised Learning [95.60856995067083]
この研究は、特定の攻撃アルゴリズムを知らずにASVの敵防衛を行う最初の試みの一つである。
本研究の目的は,1) 対向摂動浄化と2) 対向摂動検出の2つの視点から対向防御を行うことである。
実験の結果, 検出モジュールは, 約80%の精度で対向検体を検出することにより, ASVを効果的に遮蔽することがわかった。
論文 参考訳(メタデータ) (2021-06-01T07:10:54Z) - DAAIN: Detection of Anomalous and Adversarial Input using Normalizing
Flows [52.31831255787147]
我々は、アウト・オブ・ディストリビューション(OOD)インプットと敵攻撃(AA)を検出する新しい手法であるDAINを導入する。
本手法は,ニューラルネットワークの内部動作を監視し,活性化分布の密度推定器を学習する。
当社のモデルは,特別なアクセラレータを必要とせずに,効率的な計算とデプロイが可能な単一のGPUでトレーニングすることが可能です。
論文 参考訳(メタデータ) (2021-05-30T22:07:13Z) - Discriminative Nearest Neighbor Few-Shot Intent Detection by
Transferring Natural Language Inference [150.07326223077405]
データ不足を緩和するためには、ほとんどショットラーニングが注目を集めている。
深部自己注意を伴う識別的近傍分類を提示する。
自然言語推論モデル(NLI)を変換することで識別能力を高めることを提案する。
論文 参考訳(メタデータ) (2020-10-25T00:39:32Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。