論文の概要: \`{I}r\`{o}y\`{i}nSpeech: A multi-purpose Yor\`{u}b\'{a} Speech Corpus
- arxiv url: http://arxiv.org/abs/2307.16071v1
- Date: Sat, 29 Jul 2023 20:42:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-01 17:45:31.138675
- Title: \`{I}r\`{o}y\`{i}nSpeech: A multi-purpose Yor\`{u}b\'{a} Speech Corpus
- Title(参考訳): i}r\`{o}y\`{i}nspeech:多目的yor\`{u}b\'{a}音声コーパス
- Authors: Tolulope Ogunremi, Kola Tubosun, Anuoluwapo Aremu, Iroro Orife, David
Ifeoluwa Adelani
- Abstract要約: IroyinSpeech corpusは、高品質で自由に利用できる、現代のヨルバのスピーチの量を増やしたいという願望に影響された新しいデータセットである。
データセットには合計38.5時間のデータがあり、80人のボランティアが記録している。
- 参考スコア(独自算出の注目度): 2.3711621915578136
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce the \`{I}r\`{o}y\`{i}nSpeech corpus -- a new dataset influenced
by a desire to increase the amount of high quality, freely available,
contemporary Yor\`{u}b\'{a} speech. We release a multi-purpose dataset that can
be used for both TTS and ASR tasks. We curated text sentences from the news and
creative writing domains under an open license i.e., CC-BY-4.0 and had multiple
speakers record each sentence. We provide 5000 of our utterances to the Common
Voice platform to crowdsource transcriptions online. The dataset has 38.5 hours
of data in total, recorded by 80 volunteers.
- Abstract(参考訳): 高品質で自由に利用できるYor\`{u}b\'{a} 音声の量を増やしたいという欲求に影響された新しいデータセットである \`{I}r\`{o}y\`{i}nSpeech corpus を導入する。
我々は、TSタスクとASRタスクの両方に使用できる多目的データセットをリリースする。
オープンライセンス(cc-by-4.0)の下でニュース・クリエイティブ・ライティング・ドメインからテキスト文をキュレートし,複数の話者が各文を記録させた。
われわれの5000通の音声をCommon Voiceプラットフォームに提供し、オンラインで書き起こしをクラウドソースしています。
データセットには合計38.5時間のデータがあり、80人のボランティアが記録している。
関連論文リスト
- ASR2K: Speech Recognition for Around 2000 Languages without Audio [100.41158814934802]
対象言語に音声を必要としない音声認識パイプラインを提案する。
私たちのパイプラインは、音響、発音、言語モデルという3つのコンポーネントで構成されています。
我々は、1909年の言語をCrubadanと組み合わせて、大きな絶滅危惧言語n-gramデータベースを構築した。
論文 参考訳(メタデータ) (2022-09-06T22:48:29Z) - BibleTTS: a large, high-fidelity, multilingual, and uniquely African
speech corpus [7.050790497916012]
BibleTTSは、サハラ以南のアフリカで話されている10の言語のための、大規模で高品質でオープンな音声データセットである。
コーパスは最大86時間、スタジオ品質48kHzのシングルスピーカーを言語ごとに記録する。
論文 参考訳(メタデータ) (2022-07-07T19:35:43Z) - Building African Voices [125.92214914982753]
本稿では,低リソースのアフリカ言語を対象とした音声合成について述べる。
我々は,最小限の技術資源で音声合成システムを構築するための汎用的な指示セットを作成する。
研究者や開発者を支援するために、12のアフリカ言語のための音声データ、コード、訓練された音声をリリースします。
論文 参考訳(メタデータ) (2022-07-01T23:28:16Z) - Bengali Common Voice Speech Dataset for Automatic Speech Recognition [0.9218853132156671]
ベンガル語は世界で3億人以上の話者を抱える世界有数の言語の一つである。
その人気にもかかわらず、ベンガル音声認識システムの開発に関する研究は、多様なオープンソースデータセットが不足しているために妨げられている。
このデータセットから得られた知見を提示し、今後のバージョンで対処すべき重要な言語的課題について議論する。
論文 参考訳(メタデータ) (2022-06-28T14:52:08Z) - Few-Shot Cross-Lingual TTS Using Transferable Phoneme Embedding [55.989376102986654]
本稿では,言語間テキスト-音声間問題に対処するための移動可能な音素埋め込みフレームワークについて,数ショット設定で検討する。
本稿では,音素ベースのTSモデルと,異なる言語からの音素を学習潜在空間に投影するコードブックモジュールからなるフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-27T11:24:40Z) - Textless Speech-to-Speech Translation on Real Data [49.134208897722246]
本研究では、ある言語から別の言語への翻訳が可能なテキストなし音声音声翻訳システム(S2ST)を提案する。
マルチ話者ターゲット音声をモデル化し、実世界のS2STデータを用いてシステムを訓練する際の課題に対処する。
論文 参考訳(メタデータ) (2021-12-15T18:56:35Z) - MLS: A Large-Scale Multilingual Dataset for Speech Research [37.803100082550294]
データセットは、LibriVoxの読み出しオーディオブックに由来する。
英語の約44.5K時間と、他の言語で約6K時間を含む8つの言語で構成されている。
論文 参考訳(メタデータ) (2020-12-07T01:53:45Z) - Consecutive Decoding for Speech-to-text Translation [51.155661276936044]
COnSecutive Transcription and Translation (COSTT)は、音声からテキストへの翻訳に不可欠な手法である。
鍵となるアイデアは、ソースの書き起こしとターゲットの翻訳テキストを1つのデコーダで生成することである。
本手法は3つの主流データセットで検証する。
論文 参考訳(メタデータ) (2020-09-21T10:10:45Z) - Improving Yor\`ub\'a Diacritic Restoration [3.301896537513352]
ヨルバ語(Yorub'a)は西アフリカで広く話されている言語で、書記体系は正書法や音節の発音に富んでいる。
ダイアクリティカルマークは、デバイスやアプリケーションのサポートの制限や、適切な使用に関する一般的な教育のため、電子テキストから除外されることが多い。
事前訓練されたモデル、データセット、ソースコードはすべて、Yorub'a言語技術への取り組みを進めるためのオープンソースプロジェクトとしてリリースされた。
論文 参考訳(メタデータ) (2020-03-23T22:07:15Z) - CoVoST: A Diverse Multilingual Speech-To-Text Translation Corpus [57.641761472372814]
CoVoSTは11言語から英語への多言語による音声からテキストへの翻訳コーパスである。
11,000人以上の話者と60以上のアクセントで多様化した。
CoVoSTはCC0ライセンスでリリースされており、無料で利用できる。
論文 参考訳(メタデータ) (2020-02-04T14:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。