論文の概要: The NIST CTS Speaker Recognition Challenge
- arxiv url: http://arxiv.org/abs/2204.10228v1
- Date: Thu, 21 Apr 2022 16:06:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-22 15:54:06.304673
- Title: The NIST CTS Speaker Recognition Challenge
- Title(参考訳): NIST CTS話者認識チャレンジ
- Authors: Seyed Omid Sadjadi, Craig Greenberg, Elliot Singer, Lisa Mason,
Douglas Reynolds
- Abstract要約: アメリカ国立標準技術研究所(NIST)は2020年8月からCTSチャレンジの第2回を実施中である。
本稿では,CTSチャレンジにおけるシステム性能の評価と解析について概説する。
- 参考スコア(独自算出の注目度): 1.5282767384702267
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The US National Institute of Standards and Technology (NIST) has been
conducting a second iteration of the CTS challenge since August 2020. The
current iteration of the CTS Challenge is a leaderboard-style speaker
recognition evaluation using telephony data extracted from the unexposed
portions of the Call My Net 2 (CMN2) and Multi-Language Speech (MLS) corpora
collected by the LDC. The CTS Challenge is currently organized in a similar
manner to the SRE19 CTS Challenge, offering only an open training condition
using two evaluation subsets, namely Progress and Test. Unlike in the SRE19
Challenge, no training or development set was initially released, and NIST has
publicly released the leaderboards on both subsets for the CTS Challenge. Which
subset (i.e., Progress or Test) a trial belongs to is unknown to challenge
participants, and each system submission needs to contain outputs for all of
the trials. The CTS Challenge has also served, and will continue to do so, as a
prerequisite for entrance to the regular SREs (such as SRE21). Since August
2020, a total of 53 organizations (forming 33 teams) from academia and industry
have participated in the CTS Challenge and submitted more than 4400 valid
system outputs. This paper presents an overview of the evaluation and several
analyses of system performance for some primary conditions in the CTS
Challenge. The CTS Challenge results thus far indicate remarkable improvements
in performance due to 1) speaker embeddings extracted using large-scale and
complex neural network architectures such as ResNets along with angular margin
losses for speaker embedding extraction, 2) extensive data augmentation, 3) the
use of large amounts of in-house proprietary data from a large number of
labeled speakers, 4) long-duration fine-tuning.
- Abstract(参考訳): アメリカ国立標準技術研究所(NIST)は2020年8月からCTSチャレンジの第2回を実施中である。
CTS Challengeの現在のイテレーションは、LCCが収集したCall My Net 2(CMN2)とMulti-Language Speech(MLS)コーパスの未公開部分から抽出した電話データを用いて、リーダーボード形式の話者認識評価である。
CTS Challengeは現在、SRE19 CTS Challengeと同じような方法で組織されており、プログレスとテストという2つの評価サブセットを使用して、オープンなトレーニング条件のみを提供する。
SRE19 Challengeとは異なり、当初トレーニングや開発セットはリリースされておらず、NISTはCTS Challengeの両サブセットのリーダーボードを公開している。
トライアルのどのサブセット(すなわちプログレスまたはテスト)が、参加者に挑戦するためには未知であり、各システムがトライアルのすべてのアウトプットを含む必要がある。
CTSチャレンジは、通常のSRE(SRE21など)への出入口の前提条件として、引き続き実施される。
2020年8月以降、学界と産業界から合計53の組織(33チーム)がCTSチャレンジに参加し、4400以上の有効なシステムアウトプットを提出している。
本稿では,CTSチャレンジにおけるシステム性能の評価と解析について概説する。
CTS Challengeの結果は、パフォーマンスが著しく向上したことを示している。
1)話者埋め込み抽出のためのresnetsのような大規模で複雑なニューラルネットワークアーキテクチャを用いて抽出された話者埋め込みと角マージン損失
2)広範囲なデータ拡張
3)多数のラベル付き話者からの自社独自の膨大なデータの使用。
4)長期の微調整。
関連論文リスト
- Overview of AI-Debater 2023: The Challenges of Argument Generation Tasks [62.443665295250035]
第2023回中国影響コンピューティング会議(CCAC 2023)におけるAI-Debater 2023チャレンジの結果を提示する。
合計で32のチームがチャレンジに登録し、そこから11の応募をもらいました。
論文 参考訳(メタデータ) (2024-07-20T10:13:54Z) - ICMC-ASR: The ICASSP 2024 In-Car Multi-Channel Automatic Speech
Recognition Challenge [94.13624830833314]
この課題は、新しいエネルギー車両内で記録された100時間以上のマルチチャネル音声データを収集する。
1位チームのUSTCiflytekはASRトラックで13.16%のCER、ASDRトラックで21.48%のcpCERを達成した。
論文 参考訳(メタデータ) (2024-01-07T12:51:42Z) - QS-TTS: Towards Semi-Supervised Text-to-Speech Synthesis via
Vector-Quantized Self-Supervised Speech Representation Learning [65.35080911787882]
本稿では、教師付きデータ要求の少ないTS品質を実現するための、新しい半教師付きTSフレームワークQS-TTSを提案する。
2つのVQ-S3R学習者は、TSのための有益な音声表現と事前訓練されたモデルを提供する。
その結果、QS-TTSの優れた性能を示し、教師付きまたは半教師付きベースラインTSアプローチよりも最高のMOSを獲得した。
論文 参考訳(メタデータ) (2023-08-31T20:25:44Z) - The STOIC2021 COVID-19 AI challenge: applying reusable training
methodologies to private data [60.94672667514737]
本研究は、プライベートデータ上でのトレーニングソリューションを可能にするType Three (T3)チャレンジフォーマットを実装した。
T3では、チャレンジオーガナイザが参加者の提供するトレーニングデータに基づいてトレーニングを行う。
勝利解は、重篤なCOVID-19と非重症なCOVID-19(0.815)の鑑別のために、受信機動作特性曲線の下にある領域を得た。
論文 参考訳(メタデータ) (2023-06-18T05:48:28Z) - VoxSRC 2022: The Fourth VoxCeleb Speaker Recognition Challenge [95.6159736804855]
VoxCeleb Speaker Recognition Challenge 2022 (VoxSRC-22)は、InterSPEECH 2022と共同で開催された。
この課題の目的は、最先端の話者認識システムが「野生」で得られた音声から話者を識別し、分類し、認識できるかどうかを評価することである。
論文 参考訳(メタデータ) (2023-02-20T19:27:14Z) - THUEE system description for NIST 2020 SRE CTS challenge [19.2916501364633]
本稿では,NIST 2020 Speaker Recognition Evaluation (SRE) のためのTHUEEチームのシステム記述について述べる。
この評価では、ResNet74、ResNet152、RepVGG-B2などのサブシステムが話者埋め込み抽出器として開発された。
論文 参考訳(メタデータ) (2022-10-12T12:01:59Z) - Summary on the ISCSLP 2022 Chinese-English Code-Switching ASR Challenge [25.69349931845173]
ISCSLP 2022 CSASRチャレンジでは、TAL_CSASRコーパスとMagicData-RAMCコーパス、参加者向けの開発とテストセットの2つのトレーニングセットが提供された。
40以上のチームがこの挑戦に参加し、勝者チームは16.70%の混合誤差率(MER)をテストセットで達成した。
本稿では、データセット、関連するベースラインシステム、および要件を説明し、CSASRチャレンジ結果と提案システムで使用される主要なテクニックとトリックを要約する。
論文 参考訳(メタデータ) (2022-10-12T11:05:13Z) - The 2021 NIST Speaker Recognition Evaluation [1.5282767384702267]
2021話者認識評価 (2021 Speaker Recognition Evaluation, SRE21) は、1996年からアメリカ合衆国国立標準技術研究所 (NIST) が実施している評価シリーズの最新サイクルである。
本稿では,タスク,評価基準,データ,評価プロトコル,結果,システム性能分析などを含むSRE21の概要について述べる。
論文 参考訳(メタデータ) (2022-04-21T16:18:52Z) - NIST SRE CTS Superset: A large-scale dataset for telephony speaker
recognition [2.5403247066589074]
本論文は,国立標準技術研究所(NIST)話者認識評価(SRE)会話電話音声(CTS)スーパーセットの概要を述べる。
CTS Supersetは、研究コミュニティに大規模なデータセットを提供することを目的として開発された。
6800人以上の話者の電話音声セグメントが多数含まれており、[10s, 60s]の範囲で一様に分散している。
論文 参考訳(メタデータ) (2021-08-16T14:39:23Z) - Two-Stream Consensus Network: Submission to HACS Challenge 2021
Weakly-Supervised Learning Track [78.64815984927425]
弱い監督による時間的行動ローカライゼーションの目標は、ビデオの興味ある動作を時間的に特定し、分類することである。
この課題では,2ストリームコンセンサスネットワーク(TSCN)を主要なフレームワークとして採用しています。
この課題では,本手法が今後の学術研究のベースラインとなることを期待して,第2位にランクインした。
論文 参考訳(メタデータ) (2021-06-21T03:36:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。