論文の概要: Query Expansion System for the VoxCeleb Speaker Recognition Challenge
2020
- arxiv url: http://arxiv.org/abs/2011.02882v1
- Date: Wed, 4 Nov 2020 05:24:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 23:01:38.029737
- Title: Query Expansion System for the VoxCeleb Speaker Recognition Challenge
2020
- Title(参考訳): VoxCeleb Speaker Recognition Challenge 2020におけるクエリ拡張システム
- Authors: Yu-Sen Cheng, Chun-Liang Shih, Tien-Hong Lo, Wen-Ting Tseng, Berlin
Chen
- Abstract要約: 本稿では,VoxCeleb Speaker Recognition Challenge (VoxSRC) 2020への応募について述べる。
1つは、話者検証にクエリ拡張を適用することであり、これは研究のベースラインと比較して大きな進歩を示している。
もう1つは、確率線形判別分析(PLDA)スコアとResNetスコアを組み合わせることである。
- 参考スコア(独自算出の注目度): 9.908371711364717
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this report, we describe our submission to the VoxCeleb Speaker
Recognition Challenge (VoxSRC) 2020. Two approaches are adopted. One is to
apply query expansion on speaker verification, which shows significant progress
compared to baseline in the study. Another is to use Kaldi extract x-vector and
to combine its Probabilistic Linear Discriminant Analysis (PLDA) score with
ResNet score.
- Abstract(参考訳): 本稿では,VoxCeleb Speaker Recognition Challenge (VoxSRC) 2020への応募について述べる。
2つのアプローチが採用されている。
1つは話者照合にクエリ拡張を適用することであり、これは研究のベースラインと比較して大きな進歩を示している。
もう一つの方法は、カルディ抽出x-ベクトルを使い、その確率的線形判別分析(plda)スコアとresnetスコアを組み合わせることである。
関連論文リスト
- Improving Speaker Assignment in Speaker-Attributed ASR for Real Meeting Applications [18.151884620928936]
本稿では,実生活シナリオにおける話者分散ASR(SA-ASR)システムの最適化を目的とした新しい研究を提案する。
本稿では,Voice Activity Detection (VAD), Speaker Diarization (SD), SA-ASRを含む実生活用パイプラインを提案する。
論文 参考訳(メタデータ) (2024-03-11T10:11:29Z) - DASA: Difficulty-Aware Semantic Augmentation for Speaker Verification [55.306583814017046]
本稿では,話者認証のための難易度認識型セマンティック拡張(DASA)手法を提案する。
DASAは、話者埋め込み空間における多様なトレーニングサンプルを、無視できる余分な計算コストで生成する。
最も良い結果は、CN-Celeb評価セット上でのEER測定値の14.6%の相対的な減少を達成する。
論文 参考訳(メタデータ) (2023-10-18T17:07:05Z) - Exploring the Integration of Speech Separation and Recognition with
Self-Supervised Learning Representation [83.36685075570232]
本研究は,ASRフロントエンドとしての残響・雑音・残響シナリオにおける音声分離に関する洞察に富んだ研究である。
我々は,マルチチャネル分離法,マスクベースのビームフォーミング,複雑なスペクトルマッピング,およびASRバックエンドモデルで使用する最良の特徴について検討する。
TF-GridNetベースの複素スペクトルマッピングとWavLMベースのSSLRを併用することで、残響WHAMRテストセットにおいて2.5%のワードエラー率が得られる。
論文 参考訳(メタデータ) (2023-07-23T05:39:39Z) - VoxSRC 2022: The Fourth VoxCeleb Speaker Recognition Challenge [95.6159736804855]
VoxCeleb Speaker Recognition Challenge 2022 (VoxSRC-22)は、InterSPEECH 2022と共同で開催された。
この課題の目的は、最先端の話者認識システムが「野生」で得られた音声から話者を識別し、分類し、認識できるかどうかを評価することである。
論文 参考訳(メタデータ) (2023-02-20T19:27:14Z) - The Newsbridge -Telecom SudParis VoxCeleb Speaker Recognition Challenge
2022 System Description [0.0]
本稿では,VoxCeleb Speaker Recognition Challenge 2022(VoxSRC 2022)の話者ダイアリゼーショントラックで使用するシステムについて述べる。
我々のソリューションは、複数のシステムの強度を利用する音声活動検出アルゴリズムの新たな組み合わせに基づいて設計されている。
論文 参考訳(メタデータ) (2023-01-17T15:52:39Z) - STC speaker recognition systems for the NIST SRE 2021 [56.05258832139496]
本稿では,NIST 2021話者認識評価に提出されたSTCシステムについて述べる。
これらのシステムは、ディープニューラルネットワークを特徴抽出器として利用する様々なサブシステムで構成されている。
ビデオモダリティのために、大きな顔画像データセットに基づいて訓練されたRetinaFace顔検出器と深層ResNet顔埋め込み抽出器を用いた最良のソリューションを開発した。
論文 参考訳(メタデータ) (2021-11-03T15:31:01Z) - The Phonexia VoxCeleb Speaker Recognition Challenge 2021 System
Description [1.3687617973585977]
教師なし話者検証トラックにおけるVoxCeleb Speaker Recognition Challenge 2021(VoxSRC-21)のPhonexia提案について述べる。
モーメントコントラスト学習を用いて埋め込み抽出器をブートストラップし,入力増強を唯一の監督源とした。
5種類の埋め込み抽出器のzt正規化コサインスコアを平均化してスコア融合を行った。
論文 参考訳(メタデータ) (2021-09-05T12:10:26Z) - Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing [72.4445825335561]
任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
論文 参考訳(メタデータ) (2021-06-11T13:03:33Z) - VoxSRC 2020: The Second VoxCeleb Speaker Recognition Challenge [99.82500204110015]
第2回「VoxCeleb Speaker Recognition Challenge」をInterspeech 2020と共に開催しました。
この課題の目的は、現在のスピーカー認識技術が、制約のないデータまたは野生のデータでスピーカーをダイアライズして認識できるかどうかを評価することでした。
本稿では,その課題を概説し,ベースライン,使用方法,結果について述べる。
論文 参考訳(メタデータ) (2020-12-12T17:20:57Z) - Tongji University Undergraduate Team for the VoxCeleb Speaker
Recognition Challenge2020 [10.836635938778684]
RSBU-CW モジュールを ResNet34 フレームワークに適用し,ネットワークの認知能力を向上させる。
我々は,モデルの性能向上のために,ResNetの2つの変種であるスコア融合とデータ拡張法を訓練した。
論文 参考訳(メタデータ) (2020-10-20T09:25:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。