論文の概要: Multi-Task Siamese Neural Network for Improving Replay Attack Detection
- arxiv url: http://arxiv.org/abs/2002.07629v1
- Date: Sun, 16 Feb 2020 00:21:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-31 17:58:31.221805
- Title: Multi-Task Siamese Neural Network for Improving Replay Attack Detection
- Title(参考訳): リプレイアタック検出を改善するマルチタスクシアムニューラルネットワーク
- Authors: Patrick von Platen, Fei Tao, Gokhan Tur
- Abstract要約: Residual Neural Networks(ResNet)上に構築されたリプレイ攻撃検出システムは、公開ベンチマークであるASVspoof 2019 Physical Access Challengeで驚くべき結果を得た。
マルチタスク学習環境における識別的特徴学習がRA検出システムの一般化性と識別性に及ぼす影響を解析する。
- 参考スコア(独自算出の注目度): 13.379530865598408
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic speaker verification systems are vulnerable to audio replay attacks
which bypass security by replaying recordings of authorized speakers. Replay
attack detection (RA) detection systems built upon Residual Neural Networks
(ResNet)s have yielded astonishing results on the public benchmark ASVspoof
2019 Physical Access challenge. With most teams using fine-tuned feature
extraction pipelines and model architectures, the generalizability of such
systems remains questionable though. In this work, we analyse the effect of
discriminative feature learning in a multi-task learning (MTL) setting can have
on the generalizability and discriminability of RA detection systems. We use a
popular ResNet architecture optimized by the cross-entropy criterion as our
baseline and compare it to the same architecture optimized by MTL using Siamese
Neural Networks (SNN). It can be shown that SNN outperform the baseline by
relative 26.8 % Equal Error Rate (EER). We further enhance the model's
architecture and demonstrate that SNN with additional reconstruction loss yield
another significant improvement of relative 13.8 % EER.
- Abstract(参考訳): 自動話者検証システムは、認証された話者の録音を再生することでセキュリティをバイパスするオーディオ再生攻撃に対して脆弱である。
Residual Neural Networks(ResNet)上に構築されたリプレイアタック検出(RA)検出システムは、公開ベンチマークであるASVspoof 2019 Physical Access Challengeで驚くべき結果を得た。
ほとんどのチームが微調整された機能抽出パイプラインとモデルアーキテクチャを使用しているため、そのようなシステムの一般化性は疑問視されている。
本研究では,マルチタスク学習(mtl)環境における識別的特徴学習が,ra検出システムの一般化可能性と識別可能性に与える影響を分析した。
我々は、クロスエントロピー基準によって最適化された人気のあるResNetアーキテクチャをベースラインとして使用し、シームズニューラルネットワーク(SNN)を用いたMTLで最適化された同じアーキテクチャと比較する。
snn がベースラインを26.8 % の誤差率 (eer) で上回っていることを示すことができる。
モデルアーキテクチャをさらに強化し, 復元損失が増大したSNNが, 相対13.8 % EERを大幅に改善したことを示す。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Enhanced Convolution Neural Network with Optimized Pooling and Hyperparameter Tuning for Network Intrusion Detection [0.0]
ネットワーク侵入検知システム(NIDS)のための拡張畳み込みニューラルネットワーク(EnCNN)を提案する。
我々はEnCNNと、ロジスティック回帰、決定木、サポートベクトルマシン(SVM)、ランダムフォレスト、AdaBoost、Votting Ensembleといったアンサンブル手法など、さまざまな機械学習アルゴリズムを比較した。
その結果,EnCNNは検出精度を大幅に向上し,最先端アプローチよりも10%向上した。
論文 参考訳(メタデータ) (2024-09-27T11:20:20Z) - From Environmental Sound Representation to Robustness of 2D CNN Models
Against Adversarial Attacks [82.21746840893658]
本稿では, 各種環境音響表現(スペクトログラム)が, 被害者残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
DWTスペクトログラムでトレーニングしたResNet-18モデルでは高い認識精度が得られたが、このモデルに対する攻撃は敵にとって比較的コストがかかる。
論文 参考訳(メタデータ) (2022-04-14T15:14:08Z) - Composing Recurrent Spiking Neural Networks using Locally-Recurrent
Motifs and Risk-Mitigating Architectural Optimization [9.104190653846048]
神経回路では、リカレント接続はネットワーク機能と安定性において重要な役割を果たす。
既存の繰り返しスパイクニューラルネットワーク(RSNN)は、しばしば最適化なしでランダムな接続によって構築される。
我々は、新しいスケーラブルRSNNアーキテクチャと自動アーキテクチャ最適化により、大規模RSNNの体系的設計を可能にすることを目指している。
論文 参考訳(メタデータ) (2021-08-04T00:09:39Z) - A novel Deep Neural Network architecture for non-linear system
identification [78.69776924618505]
非線形システム識別のための新しいDeep Neural Network (DNN)アーキテクチャを提案する。
メモリシステムにインスパイアされたインダクティブバイアス(アーキテクチャ)と正規化(損失関数)を導入する。
このアーキテクチャは、利用可能なデータのみに基づいて、自動的な複雑性の選択を可能にする。
論文 参考訳(メタデータ) (2021-06-06T10:06:07Z) - Implementing a foveal-pit inspired filter in a Spiking Convolutional
Neural Network: a preliminary study [0.0]
我々は,網膜卵管刺激によるガウスフィルタとランク順符号化の差異を取り入れたスポーキング畳み込みニューラルネットワーク(SCNN)を提示した。
このモデルは、Nengoライブラリーで実装されているように、スパイキングニューロンで動作するように適応されたバックプロパゲーションアルゴリズムの変種を用いて訓練される。
ネットワークは最大90%の精度で達成され、損失はクロスエントロピー関数を用いて計算される。
論文 参考訳(メタデータ) (2021-05-29T15:28:30Z) - Neural Architecture Search For LF-MMI Trained Time Delay Neural Networks [61.76338096980383]
TDNN(State-of-the-the-art Factored Time delay Neural Network)の2種類のハイパーパラメータを自動的に学習するために、さまざまなニューラルネットワークサーチ(NAS)技術が使用されている。
DARTSメソッドはアーキテクチャ選択とLF-MMI(格子のないMMI)TDNNトレーニングを統合する。
300時間のSwitchboardコーパスで行われた実験では、自動構成システムはベースラインLF-MMI TDNNシステムより一貫して優れていることが示唆された。
論文 参考訳(メタデータ) (2020-07-17T08:32:11Z) - When Residual Learning Meets Dense Aggregation: Rethinking the
Aggregation of Deep Neural Networks [57.0502745301132]
我々は,グローバルな残差学習と局所的なマイクロセンスアグリゲーションを備えた新しいアーキテクチャであるMicro-Dense Netsを提案する。
我々のマイクロセンスブロックはニューラルアーキテクチャ検索に基づくモデルと統合して性能を向上させることができる。
論文 参考訳(メタデータ) (2020-04-19T08:34:52Z) - HyNNA: Improved Performance for Neuromorphic Vision Sensor based
Surveillance using Hybrid Neural Network Architecture [7.293414498855147]
領域提案のための形態素画像処理アルゴリズムを用いて,最近提案されたハイブリッドイベントフレームアプローチを改善した。
また、様々な畳み込みニューラルネットワーク(CNN)アーキテクチャを探索することにより、オブジェクト検出と分類の低消費電力要求にも対処する。
具体的には、対象検出フレームワークから得られた結果を最先端の低出力NVS監視システムと比較し、63.1%から82.16%の改善精度を示した。
論文 参考訳(メタデータ) (2020-03-19T07:18:33Z) - Deep Speaker Embeddings for Far-Field Speaker Recognition on Short
Utterances [53.063441357826484]
深層話者埋め込みに基づく話者認識システムは,制御条件下での大幅な性能向上を実現している。
制御されていない雑音環境下での短い発話に対する話者検証は、最も困難で要求の高いタスクの1つである。
本稿では,a)環境騒音の有無による遠距離話者検証システムの品質向上,b)短時間発話におけるシステム品質劣化の低減という2つの目標を達成するためのアプローチを提案する。
論文 参考訳(メタデータ) (2020-02-14T13:34:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。