論文の概要: The NUS-HLT System for ICASSP2024 ICMC-ASR Grand Challenge
- arxiv url: http://arxiv.org/abs/2312.16002v1
- Date: Tue, 26 Dec 2023 11:11:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 15:22:11.293868
- Title: The NUS-HLT System for ICASSP2024 ICMC-ASR Grand Challenge
- Title(参考訳): ICASSP2024ICMC-ASRグランドチャレンジのためのNUS-HLTシステム
- Authors: Meng Ge, Yizhou Peng, Yidi Jiang, Jingru Lin, Junyi Ao, Mehmet Sinan
Yildirim, Shuai Wang, Haizhou Li, Mengling Feng
- Abstract要約: 本稿では,車載マルチチャネル音声認識におけるICMC-ASR Challengeの両トラックにおけるチームの取り組みを要約する。
提案システムには、マルチチャネルフロントエンド拡張とダイアリゼーション、トレーニングデータ拡張、マルチチャネル分岐を用いた音声認識モデリングが含まれる。
The offical Eval1 and Eval2 set, our best system achieve a relative 34.3% improve in CER and 56.5% improve in cpCER, than the offical baseline system。
- 参考スコア(独自算出の注目度): 50.41897641763171
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper summarizes our team's efforts in both tracks of the ICMC-ASR
Challenge for in-car multi-channel automatic speech recognition. Our submitted
systems for ICMC-ASR Challenge include the multi-channel front-end enhancement
and diarization, training data augmentation, speech recognition modeling with
multi-channel branches. Tested on the offical Eval1 and Eval2 set, our best
system achieves a relative 34.3% improvement in CER and 56.5% improvement in
cpCER, compared to the offical baseline system.
- Abstract(参考訳): 本稿では,車載マルチチャネル音声認識におけるICMC-ASR Challengeの両トラックにおけるチームの取り組みを要約する。
提案するicmc-asrチャレンジには,マルチチャネルフロントエンド拡張とダイアリゼーション,トレーニングデータ拡張,マルチチャネル分岐による音声認識モデリングなどが含まれる。
The offical Eval1 and Eval2 set, our best system achieve a relative 34.3% improve in CER and 56.5% improve in cpCER, than the offical baseline system。
関連論文リスト
- The NPU-ASLP-LiAuto System Description for Visual Speech Recognition in
CNVSRC 2023 [67.11294606070278]
本稿では,第1回中国連続視覚音声認識チャレンジ(CNVSRC)2023において,NPU-ASLP-LiAuto(Team 237)が導入した視覚音声認識システムについて述べる。
データ処理に関しては,ベースライン1からリップモーション抽出器を利用してマルチスケール映像データを生成する。
トレーニング中に、速度摂動、ランダム回転、水平反転、色変換を含む様々な拡張技術が適用される。
論文 参考訳(メタデータ) (2024-01-07T14:20:52Z) - ICMC-ASR: The ICASSP 2024 In-Car Multi-Channel Automatic Speech
Recognition Challenge [94.13624830833314]
この課題は、新しいエネルギー車両内で記録された100時間以上のマルチチャネル音声データを収集する。
1位チームのUSTCiflytekはASRトラックで13.16%のCER、ASDRトラックで21.48%のcpCERを達成した。
論文 参考訳(メタデータ) (2024-01-07T12:51:42Z) - MLCA-AVSR: Multi-Layer Cross Attention Fusion based Audio-Visual Speech Recognition [62.89464258519723]
異なるレベルのオーディオ/視覚エンコーダに融合することで、各モードの表現を促進する多層クロスアテンション融合に基づくAVSR手法を提案する。
提案手法は第1位システムを超え,新たなSOTA cpCERの29.13%をこのデータセット上に構築する。
論文 参考訳(メタデータ) (2024-01-07T08:59:32Z) - Two-pass Decoding and Cross-adaptation Based System Combination of
End-to-end Conformer and Hybrid TDNN ASR Systems [61.90743116707422]
本稿では,ハイブリッドTDNNとConformer E2E ASRシステムのためのマルチパス再構成とクロスアダプティブに基づくシステムの組み合わせについて検討する。
NIST Hub5'00、Rt03、Rt02の評価データに対して、マルチパス再構成を用いて得られた最良の組み合わせシステムにより、統計的に有意な単語誤り率(WER)が2.5%から3.9%の絶対値(22.5%から28.9%の相対値)に低下した。
論文 参考訳(メタデータ) (2022-06-23T10:17:13Z) - The USTC-Ximalaya system for the ICASSP 2022 multi-channel multi-party
meeting transcription (M2MeT) challenge [43.262531688434215]
ターゲットスピーカ音声活動検出(TS-VAD)における2つの改善点を提案する。
これらの手法は,高話者オーバラップ比,高残響・雑音条件下での実世界会議シナリオにおける多話者会話を処理するように設計されている。
論文 参考訳(メタデータ) (2022-02-10T06:06:48Z) - Royalflush Speaker Diarization System for ICASSP 2022 Multi-channel
Multi-party Meeting Transcription Challenge [4.022057598291766]
マルチチャンネル多人数会議記述課題へのRoyalflush話者ダイアリゼーションシステムの適用
システムは、音声強調、重複音声検出、話者埋め込み抽出、話者クラスタリング、音声分離、システム融合を含む。
論文 参考訳(メタデータ) (2022-02-10T03:35:05Z) - The Volcspeech system for the ICASSP 2022 multi-channel multi-party
meeting transcription challenge [18.33054364289739]
本稿ではICASSP 2022 Multi-channel Multi-party Meeting Transcription (M2MeT) Challengeについて述べる。
トラック1では,クラスタリングに基づく話者ダイアリゼーションシステムを実現するために,いくつかのアプローチを提案する。
トラック2では,コンバータモデルを用いた共同CTCアテンションアーキテクチャを用いたシステムを開発した。
論文 参考訳(メタデータ) (2022-02-09T03:38:39Z) - USTC-NELSLIP System Description for DIHARD-III Challenge [78.40959509760488]
我々のシステムの革新は、ダイアリゼーション問題を解決するための様々なフロントエンド技術の組み合わせにある。
私達の最もよいシステムは評価セットのトラック1および16.78%のトラック2で11.30%のDERを達成しました。
論文 参考訳(メタデータ) (2021-03-19T07:00:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。