論文の概要: Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing
- arxiv url: http://arxiv.org/abs/2106.06362v1
- Date: Fri, 11 Jun 2021 13:03:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-14 19:34:29.542750
- Title: Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing
- Title(参考訳): 視覚的分類器隣接関係:話者検証と音声アンチスプーフィングを事例として
- Authors: Tomi Kinnunen, Andreas Nautsch, Md Sahidullah, Nicholas Evans, Xin
Wang, Massimiliano Todisco, H\'ector Delgado, Junichi Yamagishi, Kong Aik Lee
- Abstract要約: 任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
- 参考スコア(独自算出の注目度): 72.4445825335561
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Whether it be for results summarization, or the analysis of classifier
fusion, some means to compare different classifiers can often provide
illuminating insight into their behaviour, (dis)similarity or complementarity.
We propose a simple method to derive 2D representation from detection scores
produced by an arbitrary set of binary classifiers in response to a common
dataset. Based upon rank correlations, our method facilitates a visual
comparison of classifiers with arbitrary scores and with close relation to
receiver operating characteristic (ROC) and detection error trade-off (DET)
analyses. While the approach is fully versatile and can be applied to any
detection task, we demonstrate the method using scores produced by automatic
speaker verification and voice anti-spoofing systems. The former are produced
by a Gaussian mixture model system trained with VoxCeleb data whereas the
latter stem from submissions to the ASVspoof 2019 challenge.
- Abstract(参考訳): 結果の要約や分類器融合の分析のいずれにせよ、異なる分類器を比較する方法によっては、その振る舞い、(異なる)相似性、または相補性についての照明的な洞察を与えることがある。
本稿では,任意のバイナリ分類器が生成する検出スコアから,共通データセットに対応する2次元表現を簡易に導出する手法を提案する。
ランク相関に基づいて,任意のスコアと受信動作特性(ROC)および検出誤差トレードオフ(DET)分析と密接な関係を持つ分類器の視覚的比較を容易にする。
本手法は完全に汎用性があり,任意の検出タスクに応用できるが,自動話者照合と音声アンチスプーフィングシステムによるスコアを用いてその手法を実証する。
前者はvoxcelebデータでトレーニングされたガウス混合モデルシステムによって作成され、後者はasvspoof 2019チャレンジへの提出に由来する。
関連論文リスト
- Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition [0.0]
本稿では,音声認識のための新しい2段階アクティブ・ラーニング・パイプラインを提案する。
第1段階では、ラベルなし音声データから多様なサンプル選択を行うために、xベクトルクラスタリングを用いて教師なしALを利用する。
第2段階には、ASR用に特別に開発されたバッチALメソッドを備えた、教師付きAL戦略が組み込まれている。
論文 参考訳(メタデータ) (2024-05-03T19:24:41Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Identifying Spurious Correlations using Counterfactual Alignment [5.782952470371709]
急激な相関によって駆動されるモデルは、しばしば一般化性能が劣る。
本稿では,突発的相関を検出・定量化するためのCFアライメント手法を提案する。
論文 参考訳(メタデータ) (2023-12-01T20:16:02Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - Efficient Failure Pattern Identification of Predictive Algorithms [15.02620042972929]
本稿では,人間のアノテータチームとシーケンシャルレコメンデーションアルゴリズムからなる人間機械協調フレームワークを提案する。
その結果、様々な信号対雑音比で複数のデータセット上でのフレームワークの競合性能を実証的に実証した。
論文 参考訳(メタデータ) (2023-06-01T14:54:42Z) - Connective Reconstruction-based Novelty Detection [3.7706789983985303]
ディープラーニングにより、説明できないサンプルを含む実世界のデータを分析できるようになった。
GANベースのアプローチは、分散フィッティングを行う能力のため、この問題に対処するために広く利用されている。
本稿では,GANモデルの制約を補うために複雑化を伴わない,シンプルで効率的な再構成手法を提案する。
論文 参考訳(メタデータ) (2022-10-25T11:09:39Z) - Speaker Embedding-aware Neural Diarization: a Novel Framework for
Overlapped Speech Diarization in the Meeting Scenario [51.5031673695118]
重なり合う音声のダイアリゼーションを単一ラベル予測問題として再構成する。
話者埋め込み認識型ニューラルダイアリゼーション(SEND)システムを提案する。
論文 参考訳(メタデータ) (2022-03-18T06:40:39Z) - Dual Adversarial Auto-Encoders for Clustering [152.84443014554745]
教師なしクラスタリングのためのDual-AAE(Dual-AAE)を提案する。
Dual-AAEの目的関数に対する変分推論を行うことで,一対のオートエンコーダをトレーニングすることで最適化可能な新たな再構成損失を導出する。
4つのベンチマーク実験により、Dual-AAEは最先端のクラスタリング手法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-08-23T13:16:34Z) - Open-Set Recognition with Gaussian Mixture Variational Autoencoders [91.3247063132127]
推論において、オープンセット分類は、サンプルをトレーニングから既知のクラスに分類するか、未知のクラスとして拒絶するかのどちらかである。
我々は,協調的に再構築を学習し,潜在空間におけるクラスベースのクラスタリングを行うよう,我々のモデルを訓練する。
我々のモデルは、より正確で堅牢なオープンセット分類結果を実現し、平均的なF1改善率は29.5%である。
論文 参考訳(メタデータ) (2020-06-03T01:15:19Z) - Random Hyperboxes [9.061408029414455]
本稿では,個々のハイパーボックスに基づく分類器の強度に基づいて,提案した分類器の一般化誤差を示す。
提案する分類器の有効性は、慎重に選択された例を用いて分析する。
実データセットの一般化誤差境界に関する既存の問題を特定し,潜在的研究の方向性を報告する。
論文 参考訳(メタデータ) (2020-06-01T03:42:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。