論文の概要: Google Crowdsourced Speech Corpora and Related Open-Source Resources for
Low-Resource Languages and Dialects: An Overview
- arxiv url: http://arxiv.org/abs/2010.06778v1
- Date: Wed, 14 Oct 2020 02:24:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 13:20:30.524903
- Title: Google Crowdsourced Speech Corpora and Related Open-Source Resources for
Low-Resource Languages and Dialects: An Overview
- Title(参考訳): Googleが低オープンソースの言語と方言のための音声コーパスと関連オープンソースリソースをクラウドソーシング
- Authors: Alena Butryna and Shan-Hui Cathy Chu and Isin Demirsahin and Alexander
Gutkin and Linne Ha and Fei He and Martin Jansche and Cibu Johny and Anna
Katanova and Oddur Kjartansson and Chenfang Li and Tatiana Merkulova and Yin
May Oo and Knot Pipatsrisawat and Clara Rivera and Supheakmungkol Sarin and
Pasindu de Silva and Keshan Sodimana and Richard Sproat and Theeraphol
Wattanavekin and Jaka Aris Eko Wibawa
- Abstract要約: テキスト音声と自動音声認識アプリケーションを構築するために38のデータセットをリリースした。
本稿では,このようなコーパスの開発に使用される方法論について述べるとともに,表現不足の言語コミュニティに恩恵をもたらす可能性のある知見をいくつか提示する。
- 参考スコア(独自算出の注目度): 43.92114369646489
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper presents an overview of a program designed to address the growing
need for developing freely available speech resources for under-represented
languages. At present we have released 38 datasets for building text-to-speech
and automatic speech recognition applications for languages and dialects of
South and Southeast Asia, Africa, Europe and South America. The paper describes
the methodology used for developing such corpora and presents some of our
findings that could benefit under-represented language communities.
- Abstract(参考訳): 本稿では,表現不足言語に対する自由な音声リソース開発の必要性の高まりに対処するプログラムの概要を述べる。
現在、南アジア、アフリカ、ヨーロッパ、南米の言語や方言に対して、テキスト音声および自動音声認識アプリケーションを構築するための38のデータセットをリリースしています。
本稿は,コーパスの開発に使用する方法論について述べるとともに,表現不足の言語コミュニティに利益をもたらす可能性のある知見をいくつか提示する。
関連論文リスト
- LIMBA: An Open-Source Framework for the Preservation and Valorization of Low-Resource Languages using Generative Models [62.47865866398233]
この白書は低リソース言語のための言語ツールを生成するためのフレームワークを提案する。
このような言語に対するインテリジェントな応用を妨げるデータ不足に対処することにより、言語多様性の促進に寄与する。
論文 参考訳(メタデータ) (2024-11-20T16:59:41Z) - Improving Speech Emotion Recognition in Under-Resourced Languages via Speech-to-Speech Translation with Bootstrapping Data Selection [49.27067541740956]
音声感情認識(SER)は、人間とコンピュータの自然な相互作用が可能な汎用AIエージェントを開発する上で重要な要素である。
英語や中国語以外の言語でラベル付きデータが不足しているため、堅牢な多言語SERシステムの構築は依然として困難である。
本稿では,低SERリソース言語におけるSERの性能向上のための手法を提案する。
論文 参考訳(メタデータ) (2024-09-17T08:36:45Z) - Conversations in Galician: a Large Language Model for an
Underrepresented Language [2.433983268807517]
本稿では,ガリシア語に対する自然言語処理(NLP)を強化するために設計された2つの新しい資源を紹介する。
52,000の指示と実演を含むアルパカデータセットのガリシア適応について述べる。
データセットユーティリティのデモとして、元々モデルでサポートされていない言語であるGalicianで、LLaMA-7Bの理解と応答を微調整した。
論文 参考訳(メタデータ) (2023-11-07T08:52:28Z) - Contextualising Levels of Language Resourcedness affecting Digital
Processing of Text [0.5620321106679633]
我々は,全言語における直交型論 LRL と HRL が問題であると主張している。
特徴付けは、ツールを数えるのではなく、各カテゴリの文脈的特徴の類型化に基づいている。
論文 参考訳(メタデータ) (2023-09-29T07:48:24Z) - Lip Reading for Low-resource Languages by Learning and Combining General
Speech Knowledge and Language-specific Knowledge [57.38948190611797]
本稿では,特に低リソース言語を対象とした新しい唇読解フレームワークを提案する。
低リソース言語は、そのモデルを訓練するのに十分なビデオテキストペアデータを持っていないため、低リソース言語のための唇読解モデルを開発するのは難しいと考えられている。
論文 参考訳(メタデータ) (2023-08-18T05:19:03Z) - Building African Voices [125.92214914982753]
本稿では,低リソースのアフリカ言語を対象とした音声合成について述べる。
我々は,最小限の技術資源で音声合成システムを構築するための汎用的な指示セットを作成する。
研究者や開発者を支援するために、12のアフリカ言語のための音声データ、コード、訓練された音声をリリースします。
論文 参考訳(メタデータ) (2022-07-01T23:28:16Z) - Resources for Turkish Natural Language Processing: A critical survey [0.0]
我々は、公開されているリソースを中心に、幅広いリソースをレビューする。
本稿では,トルコ語と自然言語処理における研究・構築のために利用可能なデータのギャップを,一連のレコメンデーションと識別する。
論文 参考訳(メタデータ) (2022-04-11T12:23:07Z) - Toward More Meaningful Resources for Lower-resourced Languages [2.3513645401551333]
Wikidataに格納されているいくつかの低リソース言語の名前の内容について検討する。
WikiAnnにある品質問題について議論し、手書きのアノテートデータに有用なサプリメントであるかどうかを評価する。
資源開発に関する推奨ガイドラインをまとめる。
論文 参考訳(メタデータ) (2022-02-24T18:39:57Z) - Cross-lingual Transfer for Speech Processing using Acoustic Language
Similarity [81.51206991542242]
言語間の移動は、このデジタル分割を橋渡しする魅力的な方法を提供する。
現在の言語間アルゴリズムは、テキストベースのタスクや音声関連タスクを低リソース言語で実現している。
本稿では,数百の言語をまたがる音響的言語間移動対を効率的に同定する言語類似性手法を提案する。
論文 参考訳(メタデータ) (2021-11-02T01:55:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。