論文の概要: VoxSRC 2020: The Second VoxCeleb Speaker Recognition Challenge
- arxiv url: http://arxiv.org/abs/2012.06867v1
- Date: Sat, 12 Dec 2020 17:20:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 06:30:18.627600
- Title: VoxSRC 2020: The Second VoxCeleb Speaker Recognition Challenge
- Title(参考訳): VoxSRC 2020: 第二のVoxCeleb話者認識チャレンジ
- Authors: Arsha Nagrani, Joon Son Chung, Jaesung Huh, Andrew Brown, Ernesto
Coto, Weidi Xie, Mitchell McLaren, Douglas A Reynolds and Andrew Zisserman
- Abstract要約: 第2回「VoxCeleb Speaker Recognition Challenge」をInterspeech 2020と共に開催しました。
この課題の目的は、現在のスピーカー認識技術が、制約のないデータまたは野生のデータでスピーカーをダイアライズして認識できるかどうかを評価することでした。
本稿では,その課題を概説し,ベースライン,使用方法,結果について述べる。
- 参考スコア(独自算出の注目度): 99.82500204110015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We held the second installment of the VoxCeleb Speaker Recognition Challenge
in conjunction with Interspeech 2020. The goal of this challenge was to assess
how well current speaker recognition technology is able to diarise and
recognize speakers in unconstrained or `in the wild' data. It consisted of: (i)
a publicly available speaker recognition and diarisation dataset from YouTube
videos together with ground truth annotation and standardised evaluation
software; and (ii) a virtual public challenge and workshop held at Interspeech
2020. This paper outlines the challenge, and describes the baselines, methods
used, and results. We conclude with a discussion of the progress over the first
installment of the challenge.
- Abstract(参考訳): 我々は、Interspeech 2020と共同でVoxCeleb Speaker Recognition Challengeの2回目の実施を行った。
この課題の目標は、現在の話者認識技術が、制約のない、あるいは“野生の”データで話者を分類し、認識できるかどうかを評価することである。
i)youtubeビデオから入手可能な話者認識とダイアリゼーションデータセット、および ground truth アノテーションと標準化された評価ソフトウェア、および (ii)interspeech 2020で開催される仮想パブリックチャレンジとワークショップ。
本稿では,その課題を概説し,ベースライン,使用方法,結果について述べる。
最後に,課題の最初のインストールに関する進捗状況に関する議論を締めくくった。
関連論文リスト
- The VoxCeleb Speaker Recognition Challenge: A Retrospective [75.40776645175585]
VoxCeleb Speaker Recognition Challenges (VoxSRC)は、2019年から2023年にかけて毎年開催される一連の課題とワークショップである。
課題は主に、様々な環境下で話者認識とダイアリゼーションのタスクを評価した。
私たちは、これらの課題について、彼らが何を探求したのか、課題参加者によって開発された方法、そしてそれらがどのように進化したのかをレビューします。
論文 参考訳(メタデータ) (2024-08-27T08:57:31Z) - CNVSRC 2023: The First Chinese Continuous Visual Speech Recognition Challenge [12.178918299455898]
この挑戦は非常に成功し、最も優れた応募はベースラインを大幅に上回った。
本稿では,データプロファイル,タスク仕様,ベースラインシステム構築といった課題を包括的にレビューする。
論文 参考訳(メタデータ) (2024-06-14T12:49:38Z) - VoxSRC 2022: The Fourth VoxCeleb Speaker Recognition Challenge [95.6159736804855]
VoxCeleb Speaker Recognition Challenge 2022 (VoxSRC-22)は、InterSPEECH 2022と共同で開催された。
この課題の目的は、最先端の話者認識システムが「野生」で得られた音声から話者を識別し、分類し、認識できるかどうかを評価することである。
論文 参考訳(メタデータ) (2023-02-20T19:27:14Z) - The VoicePrivacy 2020 Challenge Evaluation Plan [53.14981205333593]
VoicePrivacy Challengeは、音声技術のプライバシー保護ツールの開発を促進することを目的としている。
本稿では,VoicePrivacy 2020 Challengeで選択された音声匿名化タスクを定式化し,システム開発と評価に使用するデータセットについて述べる。
論文 参考訳(メタデータ) (2022-05-14T20:05:51Z) - Query Expansion System for the VoxCeleb Speaker Recognition Challenge
2020 [9.908371711364717]
本稿では,VoxCeleb Speaker Recognition Challenge (VoxSRC) 2020への応募について述べる。
1つは、話者検証にクエリ拡張を適用することであり、これは研究のベースラインと比較して大きな進歩を示している。
もう1つは、確率線形判別分析(PLDA)スコアとResNetスコアを組み合わせることである。
論文 参考訳(メタデータ) (2020-11-04T05:24:18Z) - The End-of-End-to-End: A Video Understanding Pentathlon Challenge (2020) [186.7816349401443]
我々は、IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2020と共同で開かれたオープンコンペティションである、新しいビデオ理解ペンタトロンチャレンジを紹介する。
課題は,テキスト・ビデオ検索の新しい手法を探求し,評価することであった。
論文 参考訳(メタデータ) (2020-08-03T09:55:26Z) - CHiME-6 Challenge:Tackling Multispeaker Speech Recognition for
Unsegmented Recordings [87.37967358673252]
第6回CiME音声分離認識チャレンジ(CHiME-6)の開催
この課題は、従来のCHiME-5課題を再考し、遠隔マルチマイクロホン音声のダイアリゼーションと認識の問題をさらに検討する。
本稿では, セグメント化多話者音声認識と非セグメント化多話者音声認識におけるCHiME-6チャレンジのベースライン記述について述べる。
論文 参考訳(メタデータ) (2020-04-20T12:59:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。