論文の概要: Spotting adversarial samples for speaker verification by neural vocoders
- arxiv url: http://arxiv.org/abs/2107.00309v2
- Date: Fri, 2 Jul 2021 07:47:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 06:55:07.763178
- Title: Spotting adversarial samples for speaker verification by neural vocoders
- Title(参考訳): ニューラルボコーダによる話者検証のための対向サンプルの抽出
- Authors: Haibin Wu, Po-chun Hsu, Ji Gao, Shanshan Zhang, Shen Huang, Jian Kang,
Zhiyong Wu, Helen Meng, Hung-yi Lee
- Abstract要約: 我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
- 参考スコア(独自算出の注目度): 102.1486475058963
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Automatic speaker verification (ASV), one of the most important technology
for biometric identification, has been widely adopted in security-critical
applications, including transaction authentication and access control. However,
previous work has shown that ASV is seriously vulnerable to recently emerged
adversarial attacks, yet effective countermeasures against them are limited. In
this paper, we adopt neural vocoders to spot adversarial samples for ASV. We
use the neural vocoder to re-synthesize audio and find that the difference
between the ASV scores for the original and re-synthesized audio is a good
indicator for discrimination between genuine and adversarial samples. This
effort is, to the best of our knowledge, among the first to pursue such a
technical direction for detecting adversarial samples for ASV, and hence there
is a lack of established baselines for comparison. Consequently, we implement
the Griffin-Lim algorithm as the detection baseline. The proposed approach
achieves effective detection performance that outperforms all the baselines in
all the settings. We also show that the neural vocoder adopted in the detection
framework is dataset-independent. Our codes will be made open-source for future
works to do comparison.
- Abstract(参考訳): 生体認証の最も重要な技術の一つである自動話者認証(ASV)は、トランザクション認証やアクセス制御を含むセキュリティクリティカルなアプリケーションで広く採用されている。
しかし、以前の研究では、ASVは最近出現した敵攻撃に対して深刻な脆弱性があることが示されている。
本稿では,ASVの対立サンプルを見つけるために,ニューラルボコーダを用いる。
ニューラルボコーダを用いてオーディオを再合成し、元のオーディオと再合成オーディオのASVスコアの違いが真と逆のサンプルの識別に良い指標であることを示す。
この取り組みは、私たちの知る限り、ASVの敵対的サンプルを検出するための技術的方向性を最初に追求するものであり、そのため、比較のための確立された基準線が欠如している。
その結果,検出基準としてGriffin-Limアルゴリズムを実装した。
提案手法は,すべての設定において,すべてのベースラインを上回る効果的な検出性能を実現する。
また,検出フレームワークで採用されているニューラルボコーダはデータセットに依存しないことを示す。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
関連論文リスト
- Toward Improving Synthetic Audio Spoofing Detection Robustness via Meta-Learning and Disentangled Training With Adversarial Examples [33.445126880876415]
自動話者検証システムに到達させる代わりに、スプーフ攻撃をフィルタリングする信頼性と堅牢なスプーフ検出システムを提案する。
データ不均衡問題に対処するために重み付き加法的角縁損失が提案され、スプーフィング攻撃に対する一般化を改善するために異なるマージンが割り当てられている。
データ拡張戦略として、スプーフィング音声に知覚不能な摂動を加えて、敵の例にのみ対応する正規化統計が実行されることを保証するために、補助的なバッチ正規化を用いる。
論文 参考訳(メタデータ) (2024-08-23T19:26:54Z) - LMD: A Learnable Mask Network to Detect Adversarial Examples for Speaker
Verification [17.968334617708244]
本稿では,攻撃者に依存しない,解釈可能な手法を提案する。
スコア変動検出器の中核成分は、ニューラルネットワークによりマスクされた分光図を生成することである。
提案手法は,5つの最先端のベースラインより優れている。
論文 参考訳(メタデータ) (2022-11-02T02:03:53Z) - Voice Spoofing Countermeasures: Taxonomy, State-of-the-art, experimental
analysis of generalizability, open challenges, and the way forward [2.393661358372807]
本報告では,手作り特徴,ディープラーニング,エンドツーエンド,汎用スプーフィング対策ソリューションを用いたスプーフィング検出に関する文献のレビューを行う。
本稿では,これらの対策の有効性をいくつかのデータセットで報告し,コーパス間で評価する。
論文 参考訳(メタデータ) (2022-10-02T03:53:37Z) - Voting for the right answer: Adversarial defense for speaker
verification [79.10523688806852]
ASVは敵の攻撃のレーダー下にあり、これは人間の知覚による本来の攻撃と似ている。
盲点領域におけるASVのリスクの高い決定を防止するため、「正しい回答を求める」という考え方を提案する。
実験結果から,本手法は両攻撃者に対するロバスト性を向上することが示された。
論文 参考訳(メタデータ) (2021-06-15T04:05:28Z) - Improving the Adversarial Robustness for Speaker Verification by Self-Supervised Learning [95.60856995067083]
この研究は、特定の攻撃アルゴリズムを知らずにASVの敵防衛を行う最初の試みの一つである。
本研究の目的は,1) 対向摂動浄化と2) 対向摂動検出の2つの視点から対向防御を行うことである。
実験の結果, 検出モジュールは, 約80%の精度で対向検体を検出することにより, ASVを効果的に遮蔽することがわかった。
論文 参考訳(メタデータ) (2021-06-01T07:10:54Z) - DAAIN: Detection of Anomalous and Adversarial Input using Normalizing
Flows [52.31831255787147]
我々は、アウト・オブ・ディストリビューション(OOD)インプットと敵攻撃(AA)を検出する新しい手法であるDAINを導入する。
本手法は,ニューラルネットワークの内部動作を監視し,活性化分布の密度推定器を学習する。
当社のモデルは,特別なアクセラレータを必要とせずに,効率的な計算とデプロイが可能な単一のGPUでトレーニングすることが可能です。
論文 参考訳(メタデータ) (2021-05-30T22:07:13Z) - Discriminative Nearest Neighbor Few-Shot Intent Detection by
Transferring Natural Language Inference [150.07326223077405]
データ不足を緩和するためには、ほとんどショットラーニングが注目を集めている。
深部自己注意を伴う識別的近傍分類を提示する。
自然言語推論モデル(NLI)を変換することで識別能力を高めることを提案する。
論文 参考訳(メタデータ) (2020-10-25T00:39:32Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。