論文の概要: VoxSRC 2022: The Fourth VoxCeleb Speaker Recognition Challenge
- arxiv url: http://arxiv.org/abs/2302.10248v1
- Date: Mon, 20 Feb 2023 19:27:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-22 17:18:13.470285
- Title: VoxSRC 2022: The Fourth VoxCeleb Speaker Recognition Challenge
- Title(参考訳): VoxSRC 2022: 第4回VoxCeleb話者認識チャレンジ
- Authors: Jaesung Huh, Andrew Brown, Jee-weon Jung, Joon Son Chung, Arsha
Nagrani, Daniel Garcia-Romero, Andrew Zisserman
- Abstract要約: VoxCeleb Speaker Recognition Challenge 2022 (VoxSRC-22)は、InterSPEECH 2022と共同で開催された。
この課題の目的は、最先端の話者認識システムが「野生」で得られた音声から話者を識別し、分類し、認識できるかどうかを評価することである。
- 参考スコア(独自算出の注目度): 95.6159736804855
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper summarises the findings from the VoxCeleb Speaker Recognition
Challenge 2022 (VoxSRC-22), which was held in conjunction with INTERSPEECH
2022. The goal of this challenge was to evaluate how well state-of-the-art
speaker recognition systems can diarise and recognise speakers from speech
obtained "in the wild". The challenge consisted of: (i) the provision of
publicly available speaker recognition and diarisation data from YouTube videos
together with ground truth annotation and standardised evaluation software; and
(ii) a public challenge and hybrid workshop held at INTERSPEECH 2022. We
describe the four tracks of our challenge along with the baselines, methods,
and results. We conclude with a discussion on the new domain-transfer focus of
VoxSRC-22, and on the progression of the challenge from the previous three
editions.
- Abstract(参考訳): 本稿では,InterSPEECH 2022とともに開催されたVoxCeleb Speaker Recognition Challenge 2022(VoxSRC-22)の成果を要約する。
この課題の目的は、最先端の話者認識システムがいかに「野放し」で得られた音声から話者を識別し認識できるかを評価することである。
挑戦は以下の通りである。
(i)youtubeビデオからの公に入手可能な話者認識及びダイアリゼーションデータの提供及び地上真実の注釈及び標準化評価ソフトウェア
(II)InterSPEECH 2022で開かれた公的なチャレンジとハイブリッドワークショップ。
我々は、ベースライン、メソッド、結果とともに、課題の4つのトラックについて説明する。
我々は、VoxSRC-22の新しいドメイン・トランスファーの焦点と、以前の3版からの挑戦の進行について議論する。
関連論文リスト
- ICMC-ASR: The ICASSP 2024 In-Car Multi-Channel Automatic Speech
Recognition Challenge [94.13624830833314]
この課題は、新しいエネルギー車両内で記録された100時間以上のマルチチャネル音声データを収集する。
1位チームのUSTCiflytekはASRトラックで13.16%のCER、ASDRトラックで21.48%のcpCERを達成した。
論文 参考訳(メタデータ) (2024-01-07T12:51:42Z) - Perception Test 2023: A Summary of the First Challenge And Outcome [67.0525378209708]
最初のパーセプションテストは、IEEE/CVF International Conference on Computer Vision (ICCV) 2023と共に半日間のワークショップとして開催された。
目標は、最近提案されたPerception Testベンチマークで最先端のビデオモデルをベンチマークすることであった。
このレポートでは、タスク記述、メトリクス、ベースライン、結果について要約しています。
論文 参考訳(メタデータ) (2023-12-20T15:12:27Z) - Summary on the ISCSLP 2022 Chinese-English Code-Switching ASR Challenge [25.69349931845173]
ISCSLP 2022 CSASRチャレンジでは、TAL_CSASRコーパスとMagicData-RAMCコーパス、参加者向けの開発とテストセットの2つのトレーニングセットが提供された。
40以上のチームがこの挑戦に参加し、勝者チームは16.70%の混合誤差率(MER)をテストセットで達成した。
本稿では、データセット、関連するベースラインシステム、および要件を説明し、CSASRチャレンジ結果と提案システムで使用される主要なテクニックとトリックを要約する。
論文 参考訳(メタデータ) (2022-10-12T11:05:13Z) - Domain Specific Wav2vec 2.0 Fine-tuning For The SE&R 2022 Challenge [0.0]
本稿では,ポルトガル語における自発・準備音声・音声感情認識のための共有タスク音声認識のための頑健なASRモデルの構築について述べる(SE&R2022)。
この課題の目標は、異なる方言で準備された、自発的なスピーチを考慮して、ポルトガル語のためのASR研究を進めることである。
論文 参考訳(メタデータ) (2022-07-29T00:48:40Z) - VoxSRC 2020: The Second VoxCeleb Speaker Recognition Challenge [99.82500204110015]
第2回「VoxCeleb Speaker Recognition Challenge」をInterspeech 2020と共に開催しました。
この課題の目的は、現在のスピーカー認識技術が、制約のないデータまたは野生のデータでスピーカーをダイアライズして認識できるかどうかを評価することでした。
本稿では,その課題を概説し,ベースライン,使用方法,結果について述べる。
論文 参考訳(メタデータ) (2020-12-12T17:20:57Z) - The End-of-End-to-End: A Video Understanding Pentathlon Challenge (2020) [186.7816349401443]
我々は、IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2020と共同で開かれたオープンコンペティションである、新しいビデオ理解ペンタトロンチャレンジを紹介する。
課題は,テキスト・ビデオ検索の新しい手法を探求し,評価することであった。
論文 参考訳(メタデータ) (2020-08-03T09:55:26Z) - CHiME-6 Challenge:Tackling Multispeaker Speech Recognition for
Unsegmented Recordings [87.37967358673252]
第6回CiME音声分離認識チャレンジ(CHiME-6)の開催
この課題は、従来のCHiME-5課題を再考し、遠隔マルチマイクロホン音声のダイアリゼーションと認識の問題をさらに検討する。
本稿では, セグメント化多話者音声認識と非セグメント化多話者音声認識におけるCHiME-6チャレンジのベースライン記述について述べる。
論文 参考訳(メタデータ) (2020-04-20T12:59:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。