論文の概要: Audio Spoofing Verification using Deep Convolutional Neural Networks by
Transfer Learning
- arxiv url: http://arxiv.org/abs/2008.03464v1
- Date: Sat, 8 Aug 2020 07:14:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 12:12:45.388998
- Title: Audio Spoofing Verification using Deep Convolutional Neural Networks by
Transfer Learning
- Title(参考訳): 伝達学習による深部畳み込みニューラルネットワークによる音声スポーフィング検証
- Authors: Rahul T P, P R Aravind, Ranjith C, Usamath Nechiyil, Nandakumar
Paramparambath
- Abstract要約: 本稿では,スプーフィング攻撃を検出するために,ディープ畳み込みニューラルネットワークに基づく音声分類器を提案する。
提案手法は,メル周波数スケールにおけるパワースペクトル密度の音響的時間周波数表現を用いた。
我々は、開発において0.9056%、論理アクセスシナリオの評価データセットにおいて5.32%の誤差率(EER)を達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Automatic Speaker Verification systems are gaining popularity these days;
spoofing attacks are of prime concern as they make these systems vulnerable.
Some spoofing attacks like Replay attacks are easier to implement but are very
hard to detect thus creating the need for suitable countermeasures. In this
paper, we propose a speech classifier based on deep-convolutional neural
network to detect spoofing attacks. Our proposed methodology uses acoustic
time-frequency representation of power spectral densities on Mel frequency
scale (Mel-spectrogram), via deep residual learning (an adaptation of ResNet-34
architecture). Using a single model system, we have achieved an equal error
rate (EER) of 0.9056% on the development and 5.32% on the evaluation dataset of
logical access scenario and an equal error rate (EER) of 5.87% on the
development and 5.74% on the evaluation dataset of physical access scenario of
ASVspoof 2019.
- Abstract(参考訳): 最近、自動話者認証システムが人気を集めており、これらのシステムを脆弱にするため、スプーフィング攻撃が主要な関心事となっている。
Replay攻撃のような偽造攻撃は実装が容易だが、検出は非常に困難であり、適切な対策の必要性が生じる。
本稿では,スプーフィング攻撃を検出するために,深層畳み込みニューラルネットワークに基づく音声分類器を提案する。
提案手法は,メル周波数スケール (Mel-spectrogram) におけるパワースペクトル密度の音響的時間周波数表現を用いて,深層学習(ResNet-34アーキテクチャの適応)を行う。
単一モデルシステムを用いて、我々は、開発において0.9056%、論理アクセスシナリオの評価データセットで5.32%、開発において5.87%、ASVspoof 2019の物理アクセスシナリオの評価データセットで5.74%の誤差率(EER)を達成した。
関連論文リスト
- Histogram Layer Time Delay Neural Networks for Passive Sonar
Classification [58.720142291102135]
時間遅延ニューラルネットワークとヒストグラム層を組み合わせた新しい手法により,特徴学習の改善と水中音響目標分類を実現する。
提案手法はベースラインモデルより優れており,受動的ソナー目標認識のための統計的文脈を取り入れた有効性を示す。
論文 参考訳(メタデータ) (2023-07-25T19:47:26Z) - Deep Attention Recognition for Attack Identification in 5G UAV
scenarios: Novel Architecture and End-to-End Evaluation [3.3253720226707992]
5Gフレームワークに固有の堅牢なセキュリティ機能にもかかわらず、攻撃者は依然として5G無人航空機(UAV)の運用を妨害する方法を見つけるだろう。
我々は,認証されたUAVに埋め込まれた小さなディープネットワークに基づく攻撃を識別するためのソリューションとして,Deep Attention Recognition (DAtR)を提案する。
論文 参考訳(メタデータ) (2023-03-03T17:10:35Z) - ConvNext Based Neural Network for Anti-Spoofing [6.047242590232868]
自動話者認証(ASV)は、実生活においてアイデンティティ認証に広く用いられている。
音声変換, 音声アルゴリズム, 記録装置の品質向上などにより, ASVシステムはスプーフ攻撃に対して脆弱である。
論文 参考訳(メタデータ) (2022-09-14T05:53:37Z) - Mitigating Closed-model Adversarial Examples with Bayesian Neural
Modeling for Enhanced End-to-End Speech Recognition [18.83748866242237]
厳密で実証的な「閉モデル対逆ロバスト性」の設定に焦点を当てる。
本稿では,ベイズニューラルネットワーク(BNN)を用いた対角検出器を提案する。
検出率を+2.77から+5.42%(相対+3.03から+6.26%)に改善し、単語エラー率をLibriSpeechデータセットで5.02から7.47%に下げる。
論文 参考訳(メタデータ) (2022-02-17T09:17:58Z) - Robustifying automatic speech recognition by extracting slowly varying features [16.74051650034954]
敵攻撃に対する防御機構を提案する。
このような方法で事前処理されたデータに基づいてトレーニングされたハイブリッドASRモデルを使用します。
本モデルでは, ベースラインモデルと類似したクリーンデータの性能を示すとともに, 4倍以上の堅牢性を示した。
論文 参考訳(メタデータ) (2021-12-14T13:50:23Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - Continual Learning for Fake Audio Detection [62.54860236190694]
本論文では,連続学習に基づく手法である忘れずに偽物を検出することで,モデルに新たなスプーフィング攻撃をインクリメンタルに学習させる手法を提案する。
ASVspoof 2019データセットで実験が行われる。
論文 参考訳(メタデータ) (2021-04-15T07:57:05Z) - How Robust are Randomized Smoothing based Defenses to Data Poisoning? [66.80663779176979]
我々は、トレーニングデータの品質の重要性を強調する堅牢な機械学習モデルに対して、これまで認識されていなかった脅威を提示します。
本稿では,二段階最適化に基づく新たなデータ中毒攻撃法を提案し,ロバストな分類器のロバスト性を保証する。
我々の攻撃は、被害者が最先端のロバストな訓練方法を用いて、ゼロからモデルを訓練しても効果的である。
論文 参考訳(メタデータ) (2020-12-02T15:30:21Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z) - Anomaly Detection-Based Unknown Face Presentation Attack Detection [74.4918294453537]
異常検出に基づくスプーフ攻撃検出は、顔提示攻撃検出の最近の進歩である。
本稿では,異常検出に基づくスプーフ攻撃検出のためのディープラーニングソリューションを提案する。
提案手法はCNNの表現学習能力の恩恵を受け,fPADタスクの優れた特徴を学習する。
論文 参考訳(メタデータ) (2020-07-11T21:20:55Z) - Detecting Adversarial Examples for Speech Recognition via Uncertainty
Quantification [21.582072216282725]
機械学習システム、特に自動音声認識(ASR)システムは、敵の攻撃に対して脆弱である。
本稿では,ハイブリッドASRシステムに着目し,攻撃時の不確実性を示す能力に関する4つの音響モデルを比較した。
我々は、受信演算子曲線スコア0.99以上の領域の逆例を検出することができる。
論文 参考訳(メタデータ) (2020-05-24T19:31:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。