論文の概要: The Esethu Framework: Reimagining Sustainable Dataset Governance and Curation for Low-Resource Languages
- arxiv url: http://arxiv.org/abs/2502.15916v1
- Date: Fri, 21 Feb 2025 20:12:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:55:39.224880
- Title: The Esethu Framework: Reimagining Sustainable Dataset Governance and Curation for Low-Resource Languages
- Title(参考訳): Esethu Framework:低リソース言語のための持続可能なデータセットガバナンスとキュレーションを再考する
- Authors: Jenalea Rajab, Anuoluwapo Aremu, Everlyn Asiko Chimoto, Dale Dunbar, Graham Morrissey, Fadel Thior, Luandrie Potgieter, Jessico Ojo, Atnafu Lambebo Tonja, Maushami Chetty, Onyothi Nekoto, Pelonomi Moiloa, Jade Abbott, Vukosi Marivate, Benjamin Rosman,
- Abstract要約: 本稿では,Esethu Framework and Licenseの下で開発されたオープンソースのコーパスであるVuk'uzenzele isiXhosa Speech dataset (ViXSD)を紹介する。
このデータセットには、人口統計や言語メタデータに富んだ、ネイティブのisiXhosa話者からの読み上げ音声が含まれており、コミュニティ主導のライセンスとキュレーションの原則が、自動音声認識におけるリソースギャップをいかに埋めるかを示している。
- 参考スコア(独自算出の注目度): 7.279275740858448
- License:
- Abstract: This paper presents the Esethu Framework, a sustainable data curation framework specifically designed to empower local communities and ensure equitable benefit-sharing from their linguistic resources. This framework is supported by the Esethu license, a novel community-centric data license. As a proof of concept, we introduce the Vuk'uzenzele isiXhosa Speech Dataset (ViXSD), an open-source corpus developed under the Esethu Framework and License. The dataset, containing read speech from native isiXhosa speakers enriched with demographic and linguistic metadata, demonstrates how community-driven licensing and curation principles can bridge resource gaps in automatic speech recognition (ASR) for African languages while safeguarding the interests of data creators. We describe the framework guiding dataset development, outline the Esethu license provisions, present the methodology for ViXSD, and present ASR experiments validating ViXSD's usability in building and refining voice-driven applications for isiXhosa.
- Abstract(参考訳): 本稿では,地域コミュニティの活性化と,言語資源からの公平な利益分配を確保することを目的とした,持続可能なデータキュレーションフレームワークであるEsethu Frameworkを提案する。
このフレームワークは、新しいコミュニティ中心のデータライセンスであるEsethuライセンスによってサポートされている。
概念実証として,Esethu Framework and Licenseの下で開発されたオープンソースのコーパスであるVuk'uzenzele isiXhosa Speech Dataset (ViXSD)を紹介する。
このデータセットは、人口統計と言語メタデータに富んだ、ネイティブのisiXhosa話者からの読み上げ音声を含んでおり、コミュニティ主導のライセンスとキュレーションの原則が、データ作成者の利益を守りながら、アフリカの言語の自動音声認識(ASR)におけるリソースギャップを橋渡しする方法を示している。
本稿では,データセット開発を指導するフレームワーク,Esethuライセンス条項の概要,ViXSDの方法論,およびIsiXhosaの音声駆動アプリケーションの構築と改善におけるViXSDのユーザビリティを検証するASR実験について述べる。
関連論文リスト
- Enhancing Multilingual ASR for Unseen Languages via Language Embedding Modeling [50.62091603179394]
最も先進的なASRモデルの1つであるWhisperは99の言語を効果的に扱う。
しかし、ウィスパーは未確認の言語と戦っているが、それらは事前訓練には含まれていない。
本研究では,これらの関係を利用して未知言語上でのASR性能を向上させる手法を提案する。
論文 参考訳(メタデータ) (2024-12-21T04:05:43Z) - LIMBA: An Open-Source Framework for the Preservation and Valorization of Low-Resource Languages using Generative Models [62.47865866398233]
この白書は低リソース言語のための言語ツールを生成するためのフレームワークを提案する。
このような言語に対するインテリジェントな応用を妨げるデータ不足に対処することにより、言語多様性の促進に寄与する。
論文 参考訳(メタデータ) (2024-11-20T16:59:41Z) - The Evolution of Darija Open Dataset: Introducing Version 2 [0.0]
DODaは、Darija-English翻訳における、同種のコラボレーションプロジェクトとしては最大である。
本稿では,DODAの戦略的重要性,その業績,今後の発展について考察する。
論文 参考訳(メタデータ) (2024-05-14T15:08:32Z) - Killkan: The Automatic Speech Recognition Dataset for Kichwa with Morphosyntactic Information [8.099700053397278]
本稿では,エクアドル原住民の言語であるキチワ語における自動音声認識(ASR)のための最初のデータセットであるキルカンについて述べる。
このデータセットは、スペイン語への翻訳と、Universal Dependenciesの形式でのモルフォシンタクティックアノテーションを含む約4時間の音声を含む。
実験の結果、データセットのサイズが小さいにもかかわらず、信頼性の高い品質で、データセットが最初のASRシステムの開発を可能にすることが示された。
論文 参考訳(メタデータ) (2024-04-23T20:26:07Z) - Label Aware Speech Representation Learning For Language Identification [49.197215416945596]
本稿では,自己指導型表現学習と事前学習タスクのための言語ラベル情報を組み合わせた新しいフレームワークを提案する。
このフレームワークは、ラベル認識音声表現(LASR)学習と呼ばれ、三重項に基づく目的関数を使用して、言語ラベルと自己教師付き損失関数を組み込む。
論文 参考訳(メタデータ) (2023-06-07T12:14:16Z) - NusaCrowd: Open Source Initiative for Indonesian NLP Resources [104.5381571820792]
NusaCrowdは、インドネシア語の既存のリソースを収集し、統一する共同イニシアチブである。
我々の研究は、広く話されているにもかかわらず表現されていない言語に対する自然言語処理(NLP)の研究を進めようとしている。
論文 参考訳(メタデータ) (2022-12-19T17:28:22Z) - Phonemic Representation and Transcription for Speech to Text
Applications for Under-resourced Indigenous African Languages: The Case of
Kiswahili [0.0]
キスワヒリを含むいくつかのアフリカ先住民の言語が技術的に不足していることが判明した。
本稿では,Kiswahili音声コーパスの転写過程と展開について検討する。
これは、CMU Sphinx 音声認識ツールボックスを使用して作成された ASR モデルのために、更新された Kiswahili 音素辞書を提供する。
論文 参考訳(メタデータ) (2022-10-29T09:04:09Z) - Building African Voices [125.92214914982753]
本稿では,低リソースのアフリカ言語を対象とした音声合成について述べる。
我々は,最小限の技術資源で音声合成システムを構築するための汎用的な指示セットを作成する。
研究者や開発者を支援するために、12のアフリカ言語のための音声データ、コード、訓練された音声をリリースします。
論文 参考訳(メタデータ) (2022-07-01T23:28:16Z) - Google Crowdsourced Speech Corpora and Related Open-Source Resources for
Low-Resource Languages and Dialects: An Overview [43.92114369646489]
テキスト音声と自動音声認識アプリケーションを構築するために38のデータセットをリリースした。
本稿では,このようなコーパスの開発に使用される方法論について述べるとともに,表現不足の言語コミュニティに恩恵をもたらす可能性のある知見をいくつか提示する。
論文 参考訳(メタデータ) (2020-10-14T02:24:04Z) - CoVoST: A Diverse Multilingual Speech-To-Text Translation Corpus [57.641761472372814]
CoVoSTは11言語から英語への多言語による音声からテキストへの翻訳コーパスである。
11,000人以上の話者と60以上のアクセントで多様化した。
CoVoSTはCC0ライセンスでリリースされており、無料で利用できる。
論文 参考訳(メタデータ) (2020-02-04T14:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。