論文の概要: Charting the Landscape of African NLP: Mapping Progress and Shaping the Road Ahead
- arxiv url: http://arxiv.org/abs/2505.21315v2
- Date: Wed, 28 May 2025 12:08:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 15:04:28.122262
- Title: Charting the Landscape of African NLP: Mapping Progress and Shaping the Road Ahead
- Title(参考訳): アフリカNLPの景観図の作成 : 地図作成の進展と道路の前方形成
- Authors: Jesujoba O. Alabi, Michael A. Hedderich, David Ifeoluwa Adelani, Dietrich Klakow,
- Abstract要約: アフリカは2000以上の言語を持つ世界で最も豊かな言語圏の1つである。
この多様性は、最先端の自然言語処理システムにはほとんど反映されない。
我々は過去5年間に出版されたアフリカ言語のためのNLPに関する734の研究論文を分析した。
- 参考スコア(独自算出の注目度): 24.670007883062475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With over 2,000 languages and potentially millions of speakers, Africa represents one of the richest linguistic regions in the world. Yet, this diversity is scarcely reflected in state-of-the-art natural language processing (NLP) systems and large language models (LLMs), which predominantly support a narrow set of high-resource languages. This exclusion not only limits the reach and utility of modern NLP technologies but also risks widening the digital divide across linguistic communities. Nevertheless, NLP research on African languages is active and growing. In recent years, there has been a surge of interest in this area, driven by several factors-including the creation of multilingual language resources, the rise of community-led initiatives, and increased support through funding programs. In this survey, we analyze 734 research papers on NLP for African languages published over the past five years, offering a comprehensive overview of recent progress across core tasks. We identify key trends shaping the field and conclude by outlining promising directions to foster more inclusive and sustainable NLP research for African languages.
- Abstract(参考訳): 2,000以上の言語と数百万人の話者を抱えるアフリカは、世界で最も豊かな言語圏の1つである。
しかし、この多様性は、最先端の自然言語処理(NLP)システムと大規模言語モデル(LLM)にはほとんど反映されない。
この除外は、現代のNLP技術のリーチと実用性を制限するだけでなく、言語コミュニティ間のデジタル格差を広げるリスクも負う。
それでも、アフリカ語に関するNLP研究は活発で成長している。
近年、多言語資源の創出、コミュニティ主導のイニシアチブの興隆、資金提供プログラムによる支援強化など、いくつかの要因により、この分野への関心が高まっている。
本調査では,過去5年間に公表されたアフリカの言語におけるNLPに関する734の研究論文を分析し,コアタスクにおける最近の進歩を概観する。
我々は、この分野を形作る重要なトレンドを特定し、アフリカ言語に対するより包括的で持続可能なNLP研究を促進するための有望な方向性を概説することによって結論付ける。
関連論文リスト
- HausaNLP: Current Status, Challenges and Future Directions for Hausa Natural Language Processing [5.5473811549393774]
Hausaは、世界で1億2000万の第一言語(L1)と8000万の第二言語(L2)を持つ低リソース言語である。
本稿では,Hausa NLPの現状を概観し,既存の資源,研究コントリビューション,基本的なNLPタスク間のギャップを体系的に検討する。
アクセシビリティを高め、さらなる開発を促進するために、データセット、ツール、研究成果を集約する、キュレートされたカタログであるHausaNLPを紹介します。
論文 参考訳(メタデータ) (2025-05-20T12:59:55Z) - NaijaNLP: A Survey of Nigerian Low-Resource Languages [0.0]
3つの言語(Hausa、Yorub'a、Igbo)がナイジェリアの話し言葉の約60%を占めている。
これらの言語は、計算言語学におけるタスクを支援するリソースが不足しているため、低リソースに分類される。
本研究は,ナイジェリアの3大言語を対象とした低リソースNLP(LR-NLP)研究の進展を概観する。
論文 参考訳(メタデータ) (2025-02-27T05:48:51Z) - Bridging Gaps in Natural Language Processing for Yorùbá: A Systematic Review of a Decade of Progress and Prospects [0.6554326244334868]
このレビューでは、注釈付きコーパスの不足、事前訓練された言語モデルの可用性の制限、音節複雑性やダイアクリティカル依存といった言語的課題を重要な障害として取り上げている。
この結果から,多言語・モノリンガル資源の増大が明らかとなった。ただし,この分野は,コードスイッチングやデジタル利用のための言語放棄といった社会文化的要因に制約されている。
論文 参考訳(メタデータ) (2025-02-24T17:41:48Z) - A Survey on Large Language Models with Multilingualism: Recent Advances and New Frontiers [51.8203871494146]
LLM(Large Language Models)の急速な開発は、自然言語処理における顕著な多言語機能を示している。
LLMのブレークスルーにもかかわらず、多言語シナリオの研究は依然として不十分である。
本調査は,多言語問題に対する研究コミュニティの取り組みを支援することを目的としており,LLMに基づく多言語自然言語処理における中核概念,鍵技術,最新の発展の包括的理解を提供する。
論文 参考訳(メタデータ) (2024-05-17T17:47:39Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットにおけるNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - One Country, 700+ Languages: NLP Challenges for Underrepresented
Languages and Dialects in Indonesia [60.87739250251769]
インドネシアの700以上の言語を対象としたNLP研究の現状について概説する。
インドネシアのNLPにおける課題と、現在のNLPシステムの性能にどのように影響するかを強調します。
論文 参考訳(メタデータ) (2022-03-24T22:07:22Z) - Systematic Inequalities in Language Technology Performance across the
World's Languages [94.65681336393425]
本稿では,言語技術のグローバルな有用性を評価するためのフレームワークを紹介する。
本分析では, ユーザ対応技術と言語的NLPタスクの両面において, より深く研究されている。
論文 参考訳(メタデータ) (2021-10-13T14:03:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。