論文の概要: OLR 2021 Challenge: Datasets, Rules and Baselines
- arxiv url: http://arxiv.org/abs/2107.11113v1
- Date: Fri, 23 Jul 2021 09:57:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-26 14:00:38.865910
- Title: OLR 2021 Challenge: Datasets, Rules and Baselines
- Title(参考訳): OLR 2021チャレンジ:データセット、ルール、ベースライン
- Authors: Binling Wang, Wenxuan Hu, Jing Li, Yiming Zhi, Zheng Li, Qingyang
Hong, Lin Li, Dong Wang, Liming Song and Cheng Yang
- Abstract要約: 本稿では,データプロファイル,4つのタスク,2つのベースライン,評価原則を紹介する。
言語識別(LID)タスクに加えて、OLR 2021 Challengeに初めて多言語自動音声認識(ASR)タスクが導入された。
- 参考スコア(独自算出の注目度): 23.878103387338918
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces the sixth Oriental Language Recognition (OLR) 2021
Challenge, which intends to improve the performance of language recognition
systems and speech recognition systems within multilingual scenarios. The data
profile, four tasks, two baselines, and the evaluation principles are
introduced in this paper. In addition to the Language Identification (LID)
tasks, multilingual Automatic Speech Recognition (ASR) tasks are introduced to
OLR 2021 Challenge for the first time. The challenge this year focuses on more
practical and challenging problems, with four tasks: (1) constrained LID, (2)
unconstrained LID, (3) constrained multilingual ASR, (4) unconstrained
multilingual ASR. Baselines for LID tasks and multilingual ASR tasks are
provided, respectively. The LID baseline system is an extended TDNN x-vector
model constructed with Pytorch. A transformer-based end-to-end model is
provided as the multilingual ASR baseline system. These recipes will be online
published, and available for participants to construct their own LID or ASR
systems. The baseline results demonstrate that those tasks are rather
challenging and deserve more effort to achieve better performance.
- Abstract(参考訳): 本稿では,多言語シナリオにおける音声認識システムと音声認識システムの性能向上を目的とした,第6回オリエンタル言語認識(olr)2021チャレンジを提案する。
本稿では,データプロファイル,4つのタスク,2つのベースライン,評価原則について述べる。
言語識別(LID)タスクに加えて、OLR 2021 Challengeに初めて多言語自動音声認識(ASR)タスクが導入された。
この課題は,(1)制約付きLID,(2)制約なしLID,(3)制約付きマルチリンガルASR,(4)制約なしマルチリンガルASRの4つのタスクを含む,より実践的で困難な問題に焦点を当てている。
LIDタスクと多言語ASRタスクのベースラインがそれぞれ提供される。
LIDベースラインシステムは、Pytorchで構築された拡張TDNN x-vectorモデルである。
多言語asrベースラインシステムとしてトランスフォーマティブベースのエンドツーエンドモデルが提供される。
これらのレシピはオンラインで公開され、参加者は自身のLIDまたはASRシステムを構築することができる。
ベースラインの結果は、これらのタスクがかなり困難であり、より良いパフォーマンスを達成するための努力に値することを示している。
関連論文リスト
- Efficiently Aligned Cross-Lingual Transfer Learning for Conversational
Tasks using Prompt-Tuning [98.60739735409243]
英語のような高リソース言語で訓練された言語モデルの言語間移動は、多くのNLPタスクのために広く研究されている。
並列および大規模多言語会話データセットである言語間アライメント事前学習のためのXSGDを導入する。
協調的な言語間表現を容易にするために,アライメントプロンプトを学習するための効率的なプロンプトチューニング手法を開発した。
論文 参考訳(メタデータ) (2023-04-03T18:46:01Z) - Bridging Cross-Lingual Gaps During Leveraging the Multilingual
Sequence-to-Sequence Pretraining for Text Generation [80.16548523140025]
プレトレインとファインチューンの間のギャップを埋めるために、コードスイッチングの復元タスクを追加して、バニラプレトレイン-ファインチューンパイプラインを拡張します。
提案手法は,言語間文表現距離を狭くし,簡単な計算コストで低周波語翻訳を改善する。
論文 参考訳(メタデータ) (2022-04-16T16:08:38Z) - Oriental Language Recognition (OLR) 2020: Summary and Analysis [21.212345251874513]
第5回Oriental Language Recognition (OLR) Challengeは、様々な複雑な環境での言語認識に焦点を当てている。
本稿では,3つの課題,データベースプロファイル,課題の最終結果について述べる。
論文 参考訳(メタデータ) (2021-07-05T12:42:40Z) - Dual Script E2E framework for Multilingual and Code-Switching ASR [4.697788649564087]
インド語のための多言語およびコードスイッチングASRシステムを訓練する。
テキスト音声合成の結果に触発されて、私たちは社内ルールベースの共通ラベルセット(CLS)表現を使用する。
Indic ASR Challenge 2021の多言語およびコードスイッチングタスクについて,本研究の結果を示す。
論文 参考訳(メタデータ) (2021-06-02T18:08:27Z) - Low-Resource Spoken Language Identification Using Self-Attentive Pooling
and Deep 1D Time-Channel Separable Convolutions [0.0]
本稿では,言語識別タスクの低リソース設定において,自己認識型プーリング層を用いた畳み込みニューラルネットワークが有望な結果を示すことを示す。
また、性別、年齢などの他の分類要素が良好に評価されるようにデータセットが十分に多様である場合、LIDシステムの混乱行列が言語類似度測定を担っているという仮説を定式化する。
論文 参考訳(メタデータ) (2021-05-31T18:35:27Z) - Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems [51.328224222640614]
大規模な学習済みニューラルネットワークモデルに基づく最新のTODモデルは、データ空腹です。
ToDのユースケースのデータ取得は高価で面倒だ。
論文 参考訳(メタデータ) (2021-04-17T15:19:56Z) - Multilingual and code-switching ASR challenges for low resource Indian
languages [59.2906853285309]
インドの7つの言語に関連する2つのサブタスクを通じて、多言語およびコードスイッチングASRシステムの構築に重点を置いている。
これらの言語では、列車とテストセットからなる600時間分の音声データを合計で提供します。
また,マルチリンガルサブタスクとコードスイッチサブタスクのテストセットでは,それぞれ30.73%と32.45%という,タスクのベースラインレシピも提供しています。
論文 参考訳(メタデータ) (2021-04-01T03:37:01Z) - Adversarial Meta Sampling for Multilingual Low-Resource Speech
Recognition [159.9312272042253]
多言語メタラーニングASR(MML-ASR)を改善するための新しい逆メタサンプリング(AMS)アプローチを開発しています。
AMSは、各ソース言語のタスクサンプリング確率を適応的に決定する。
MML-ASRにAMSを適用すると、2つの多言語データセットの実験結果が大幅にパフォーマンス向上します。
論文 参考訳(メタデータ) (2020-12-22T09:33:14Z) - Streaming End-to-End Bilingual ASR Systems with Joint Language
Identification [19.09014345299161]
本稿では,ASRと言語識別の両方を実行するストリーミング,エンドツーエンド,バイリンガルシステムを提案する。
提案手法は、アメリカ合衆国で話される英語とスペイン語、インドで話される英語とヒンディー語という2つの言語対に適用される。
論文 参考訳(メタデータ) (2020-07-08T05:00:25Z) - AP20-OLR Challenge: Three Tasks and Their Baselines [29.652143329022817]
本稿では,データプロファイル,3つのタスク,対応するベースライン,評価原則を紹介する。
AP20-OLRチャレンジには、SpeechoceanとNSFC M2ASRプロジェクトが提供する言語、方言、実生活データが含まれる。
論文 参考訳(メタデータ) (2020-06-04T16:29:21Z) - XGLUE: A New Benchmark Dataset for Cross-lingual Pre-training,
Understanding and Generation [100.09099800591822]
XGLUEは、大規模な言語間の事前トレーニングモデルのトレーニングに使用できる、新しいベンチマークデータセットである。
XGLUEは、自然言語理解と生成シナリオの両方をカバーする、11の多様化されたタスクを提供する。
論文 参考訳(メタデータ) (2020-04-03T07:03:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。