論文の概要: THUEE system description for NIST 2020 SRE CTS challenge
- arxiv url: http://arxiv.org/abs/2210.06111v1
- Date: Wed, 12 Oct 2022 12:01:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 15:50:04.353576
- Title: THUEE system description for NIST 2020 SRE CTS challenge
- Title(参考訳): NIST 2020 SRE CTSチャレンジのためのTHUEEシステム記述
- Authors: Yu Zheng, Jinghan Peng, Miao Zhao, Yufeng Ma, Min Liu, Xinyue Ma,
Tianyu Liang, Tianlong Kong, Liang He, Minqiang Xu
- Abstract要約: 本稿では,NIST 2020 Speaker Recognition Evaluation (SRE) のためのTHUEEチームのシステム記述について述べる。
この評価では、ResNet74、ResNet152、RepVGG-B2などのサブシステムが話者埋め込み抽出器として開発された。
- 参考スコア(独自算出の注目度): 19.2916501364633
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents the system description of the THUEE team for the NIST
2020 Speaker Recognition Evaluation (SRE) conversational telephone speech (CTS)
challenge. The subsystems including ResNet74, ResNet152, and RepVGG-B2 are
developed as speaker embedding extractors in this evaluation. We used combined
AM-Softmax and AAM-Softmax based loss functions, namely CM-Softmax. We adopted
a two-staged training strategy to further improve system performance. We fused
all individual systems as our final submission. Our approach leads to excellent
performance and ranks 1st in the challenge.
- Abstract(参考訳): 本稿では、nist 2020 speaker recognition evaluation (sre) conversational telephone speech (cts) チャレンジにおけるtheeチームのシステム記述について述べる。
この評価では、ResNet74、ResNet152、RepVGG-B2などのサブシステムが話者埋め込み抽出器として開発された。
我々はAM-SoftmaxとAAM-Softmaxに基づく損失関数(CM-Softmax)を組み合わせた。
システム性能をさらに向上するための2段階のトレーニング戦略を採用した。
個々のシステムを最終提出として融合しました。
我々のアプローチは優れたパフォーマンスをもたらし、挑戦で1位にランクインします。
関連論文リスト
- Robust, General, and Low Complexity Acoustic Scene Classification
Systems and An Effective Visualization for Presenting a Sound Scene Context [53.80051967863102]
音響シーン分類(ASC)の包括的解析について述べる。
ASCベースラインと呼ばれる,創発的かつ低フットプリントのASCモデルを提案する。
次に、新しいディープニューラルネットワークアーキテクチャを提案することにより、ASCベースラインを改善する。
論文 参考訳(メタデータ) (2022-10-16T19:07:21Z) - The NIST CTS Speaker Recognition Challenge [1.5282767384702267]
アメリカ国立標準技術研究所(NIST)は2020年8月からCTSチャレンジの第2回を実施中である。
本稿では,CTSチャレンジにおけるシステム性能の評価と解析について概説する。
論文 参考訳(メタデータ) (2022-04-21T16:06:27Z) - Wider or Deeper Neural Network Architecture for Acoustic Scene
Classification with Mismatched Recording Devices [59.86658316440461]
音響シーン分類(ASC)のためのロバストで低複雑性なシステムを提案する。
本稿では,まず,新しい入出力型ネットワークアーキテクチャを設計し,不一致な記録装置問題に対処する,ASCベースラインシステムを構築する。
さらなる性能向上を図りながら、低複雑性モデルを満たすために、多重スペクトルのアンサンブルとチャネル縮小の2つの手法を適用した。
論文 参考訳(メタデータ) (2022-03-23T10:27:41Z) - STC speaker recognition systems for the NIST SRE 2021 [56.05258832139496]
本稿では,NIST 2021話者認識評価に提出されたSTCシステムについて述べる。
これらのシステムは、ディープニューラルネットワークを特徴抽出器として利用する様々なサブシステムで構成されている。
ビデオモダリティのために、大きな顔画像データセットに基づいて訓練されたRetinaFace顔検出器と深層ResNet顔埋め込み抽出器を用いた最良のソリューションを開発した。
論文 参考訳(メタデータ) (2021-11-03T15:31:01Z) - The USYD-JD Speech Translation System for IWSLT 2021 [85.64797317290349]
本稿では,シドニー大学とJDが共同でIWSLT 2021低リソース音声翻訳タスクを提出したことを述べる。
私たちは、公式に提供されたASRとMTデータセットでモデルをトレーニングしました。
翻訳性能の向上を目的として, バック翻訳, 知識蒸留, 多機能再構成, トランスダクティブファインタニングなど, 最新の効果的な手法について検討した。
論文 参考訳(メタデータ) (2021-07-24T09:53:34Z) - Joint System-Wise Optimization for Pipeline Goal-Oriented Dialog System [76.22810715401147]
本稿では,パイプラインダイアログシステムのための新しい統合システムワイド最適化手法を提案する。
まず,NLUトレーニングのためのラベル付けプロセスを自動化する新しいデータ拡張手法を提案する。
第2に,ポアソン分布を用いた新しいポリシパラメータ化を提案する。
論文 参考訳(メタデータ) (2021-06-09T06:44:57Z) - USTC-NELSLIP System Description for DIHARD-III Challenge [78.40959509760488]
我々のシステムの革新は、ダイアリゼーション問題を解決するための様々なフロントエンド技術の組み合わせにある。
私達の最もよいシステムは評価セットのトラック1および16.78%のトラック2で11.30%のDERを達成しました。
論文 参考訳(メタデータ) (2021-03-19T07:00:51Z) - Tongji University Undergraduate Team for the VoxCeleb Speaker
Recognition Challenge2020 [10.836635938778684]
RSBU-CW モジュールを ResNet34 フレームワークに適用し,ネットワークの認知能力を向上させる。
我々は,モデルの性能向上のために,ResNetの2つの変種であるスコア融合とデータ拡張法を訓練した。
論文 参考訳(メタデータ) (2020-10-20T09:25:40Z) - The NTNU System at the Interspeech 2020 Non-Native Children's Speech ASR
Challenge [13.232899176888575]
本稿では,ISCAのSIG-ChiLDグループによって支援された,2020年の非Native Children's Speech ASR Challengeについて述べる。
すべての参加者は、主催者が提供した音声とテキストのコーパスに基づいてシステムを開発することを制限された。
そこで我々は,CNN-TDNNFをベースとした音響モデル上にASRシステムを構築した。
論文 参考訳(メタデータ) (2020-05-18T02:51:26Z) - LEAP System for SRE19 CTS Challenge -- Improvements and Error Analysis [36.35711634925221]
CTSチャレンジに提出されたLEAP SREシステムの詳細な説明を提供する。
すべてのシステムは、TDNNベースのxベクトル埋め込みを使用していた。
生成的PLDAモデルとニューラルPLDAモデルの組み合わせにより、SRE評価データセットが大幅に改善された。
論文 参考訳(メタデータ) (2020-02-07T12:28:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。