論文の概要: Voice of a Continent: Mapping Africa's Speech Technology Frontier
- arxiv url: http://arxiv.org/abs/2505.18436v1
- Date: Sat, 24 May 2025 00:11:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.421461
- Title: Voice of a Continent: Mapping Africa's Speech Technology Frontier
- Title(参考訳): 大陸の声:アフリカの音声技術フロンティアのマッピング
- Authors: AbdelRahim Elmadany, Sang Yun Kwon, Hawau Olamide Toyin, Alcides Alcoba Inciarte, Hanan Aldarmaki, Muhammad Abdul-Mageed,
- Abstract要約: アフリカの豊かな言語多様性は、音声技術では著しく不足している。
我々は、複数のアフリカの言語と音声タスクにまたがって最先端のパフォーマンスを実現するため、Simbaファミリのモデルを紹介した。
我々の研究は、アフリカの言語多様性を反映した拡張された音声技術資源の必要性を強調している。
- 参考スコア(独自算出の注目度): 14.063189144905074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Africa's rich linguistic diversity remains significantly underrepresented in speech technologies, creating barriers to digital inclusion. To alleviate this challenge, we systematically map the continent's speech space of datasets and technologies, leading to a new comprehensive benchmark SimbaBench for downstream African speech tasks. Using SimbaBench, we introduce the Simba family of models, achieving state-of-the-art performance across multiple African languages and speech tasks. Our benchmark analysis reveals critical patterns in resource availability, while our model evaluation demonstrates how dataset quality, domain diversity, and language family relationships influence performance across languages. Our work highlights the need for expanded speech technology resources that better reflect Africa's linguistic diversity and provides a solid foundation for future research and development efforts toward more inclusive speech technologies.
- Abstract(参考訳): アフリカの豊かな言語多様性は、音声技術において著しく不足しており、デジタル・インクルージョンの障壁となっている。
この課題を軽減するために、大陸のデータセットと技術のスピーチ空間を体系的にマッピングし、下流アフリカのスピーチタスクのための新しい包括的なベンチマークSimbaBenchを作る。
SimbaBenchを用いてSimbaファミリーモデルを導入し、複数のアフリカの言語や音声タスクで最先端のパフォーマンスを実現する。
評価モデルでは, データセットの品質, ドメインの多様性, 言語家族の関係が, 言語間のパフォーマンスにどのように影響するかを示す。
我々の研究は、アフリカの言語多様性を反映した拡張された音声技術資源の必要性を強調し、より包括的な音声技術に向けた将来の研究と開発のための確かな基盤を提供する。
関連論文リスト
- Automatic Speech Recognition for African Low-Resource Languages: Challenges and Future Directions [4.524096445909663]
アフリカにおける低資源言語は、研究と実践の双方において、著しく過小評価されている。
本研究では,これらの言語に対するASRシステムの開発に支障をきたす主要な課題について検討する。
論文 参考訳(メタデータ) (2025-05-16T20:57:39Z) - Where Are We? Evaluating LLM Performance on African Languages [16.206469767073155]
アフリカにおける豊かな言語遺産は、NLPでは残っていない。
本稿では,アフリカにおける言語景観に関する理論的知見と,サハラ語を用いた経験的評価を統合する。
論文 参考訳(メタデータ) (2025-02-26T21:49:54Z) - Voices Unheard: NLP Resources and Models for Yorùbá Regional Dialects [72.18753241750964]
Yorub'aは、約4700万人の話者を持つアフリカの言語である。
アフリカ語のためのNLP技術開発への最近の取り組みは、彼らの標準方言に焦点を当てている。
我々は、このギャップを埋めるために、新しい高品質のパラレルテキストと音声コーパスを導入する。
論文 参考訳(メタデータ) (2024-06-27T22:38:04Z) - AfroBench: How Good are Large Language Models on African Languages? [55.35674466745322]
AfroBenchは、64のアフリカ言語にわたるLLMのパフォーマンスを評価するためのベンチマークである。
AfroBenchは9つの自然言語理解データセット、6つのテキスト生成データセット、6つの知識と質問応答タスク、1つの数学的推論タスクで構成される。
論文 参考訳(メタデータ) (2023-11-14T08:10:14Z) - MasakhaNER 2.0: Africa-centric Transfer Learning for Named Entity
Recognition [55.95128479289923]
アフリカ系言語は10億人を超える人々によって話されているが、NLPの研究や開発ではあまり語られていない。
我々は、20のアフリカ言語で最大の人間アノテーション付きNERデータセットを作成します。
最適な転送言語を選択すると、ゼロショットF1スコアが平均14ポイント向上することを示す。
論文 参考訳(メタデータ) (2022-10-22T08:53:14Z) - Building African Voices [125.92214914982753]
本稿では,低リソースのアフリカ言語を対象とした音声合成について述べる。
我々は,最小限の技術資源で音声合成システムを構築するための汎用的な指示セットを作成する。
研究者や開発者を支援するために、12のアフリカ言語のための音声データ、コード、訓練された音声をリリースします。
論文 参考訳(メタデータ) (2022-07-01T23:28:16Z) - MasakhaNER: Named Entity Recognition for African Languages [48.34339599387944]
アフリカで10の言語で名前付きエンティティ認識のための、最初の大規模な公開可能な高品質データセットを作成します。
我々は,これらの言語がNERにもたらす課題を理解するために,言語の特徴を詳述する。
論文 参考訳(メタデータ) (2021-03-22T13:12:44Z) - OkwuGb\'e: End-to-End Speech Recognition for Fon and Igbo [0.015863809575305417]
本稿では,Fon の最先端 ASR モデルと Igbo のベンチマーク ASR モデルについて述べる。
本稿では,各言語の包括的言語分析を行い,両言語間のエンドツーエンド,ディープニューラルネットワークに基づく音声認識モデルの作成について述べる。
論文 参考訳(メタデータ) (2021-03-13T18:02:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。