Fugu-MT 論文翻訳(概要): Natural Language Processing in Ethiopian Languages: Current State, Challenges, and Opportunities

論文の概要: Natural Language Processing in Ethiopian Languages: Current State, Challenges, and Opportunities

arxiv url: http://arxiv.org/abs/2303.14406v1
Date: Sat, 25 Mar 2023 09:04:29 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-28 20:02:51.727878
Title: Natural Language Processing in Ethiopian Languages: Current State, Challenges, and Opportunities
Title（参考訳）: エチオピア語における自然言語処理の現状,課題,機会
Authors: Atnafu Lambebo Tonja, Tadesse Destaw Belay, Israel Abebe Azime, Abinew Ali Ayele, Moges Ahmed Mehamed, Olga Kolesnikova, Seid Muhie Yimam
Abstract要約: この調査は、Amharic、Afaan Oromo、Tigrinya、Wolayttaの4つのエチオピア語に対する自然言語処理(NLP)の現状を掘り下げるものである。
参考スコア（独自算出の注目度）: 3.6328558641172553
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This survey delves into the current state of natural language processing (NLP) for four Ethiopian languages: Amharic, Afaan Oromo, Tigrinya, and Wolaytta. Through this paper, we identify key challenges and opportunities for NLP research in Ethiopia. Furthermore, we provide a centralized repository on GitHub that contains publicly available resources for various NLP tasks in these languages. This repository can be updated periodically with contributions from other researchers. Our objective is to identify research gaps and disseminate the information to NLP researchers interested in Ethiopian languages and encourage future research in this domain.
Abstract（参考訳）: この調査は、Amharic、Afaan Oromo、Tigrinya、Wolayttaの4つのエチオピア語に対する自然言語処理(NLP)の現状を掘り下げるものである。本稿では,エチオピアにおけるNLP研究の課題と機会を明らかにする。さらに、これらの言語でさまざまなNLPタスクのための公開リソースを含む集中リポジトリをGitHubに提供しています。このリポジトリは、他の研究者からのコントリビューションとともに定期的に更新することができる。本研究の目的は,エチオピア語に興味のあるNLP研究者に研究ギャップを特定し,その情報を広めることである。

関連論文リスト

Opportunities and Challenges of Natural Language Processing for Low-Resource Senegalese Languages in Social Science Research [0.6016863427924156]
本稿では,セネガル憲法で公式に認められた6つの国語(Wolof, Pulaar, Sereer, Joola, Mandingue, Soninke)の進歩と課題について概観する。言語的・社会技術的・インフラ的要素を合成し、それらのデジタル準備性を形作り、データ、ツール、ベンチマークのギャップを識別する。この論文は、セネガル語のための持続可能なコミュニティ中心のNLPエコシステムに向けたロードマップを概説することで締めくくっている。
論文参考訳（メタデータ） (2025-12-24T20:20:31Z)
NaijaNLP: A Survey of Nigerian Low-Resource Languages [0.0]
3つの言語(Hausa、Yorub'a、Igbo)がナイジェリアの話し言葉の約60%を占めている。これらの言語は、計算言語学におけるタスクを支援するリソースが不足しているため、低リソースに分類される。本研究は,ナイジェリアの3大言語を対象とした低リソースNLP(LR-NLP)研究の進展を概観する。
論文参考訳（メタデータ） (2025-02-27T05:48:51Z)
State of NLP in Kenya: A Survey [0.25454395163615406]
ケニアは言語多様性で知られており、自然言語処理の進歩において固有の課題と有望な機会に直面している。本調査はケニアにおけるNLPの現状を詳細に評価する。論文では、利用可能なデータセットと既存のNLPモデルを批判的に評価することで、大きなギャップを明らかにする。
論文参考訳（メタデータ） (2024-10-13T18:08:24Z)
The Nature of NLP: Analyzing Contributions in NLP Papers [77.31665252336157]
我々は,NLP研究を構成するものについて,研究論文から定量的に検討する。以上の結果から,NLPにおける機械学習の関与は,90年代前半から増加傾向にあることが明らかとなった。 2020年以降、言語と人々への関心が復活した。
論文参考訳（メタデータ） (2024-09-29T01:29:28Z)
NLP for The Greek Language: A Longer Survey [1.6114012813668932]
さまざまな処理レイヤやコンテキストに応じて分類された関連する作業,リソース,ツールをリストアップし,簡単に議論する。この調査は、ギリシャ語のNLPタスク、情報検索、知識管理に関心のある研究者や学生に有用である。
論文参考訳（メタデータ） (2024-08-20T15:57:18Z)
Towards Systematic Monolingual NLP Surveys: GenA of Greek NLP [2.3499129784547663]
本研究は, 体系的かつ総合的な単言語NLPサーベイを作成する手法を導入することで, ギャップを埋めるものである。構造化された検索プロトコルによって特徴づけられ、出版物を選定し、NLPタスクの分類によってそれらを整理することができる。本手法の適用により,2012年から2022年にかけて,ギリシャNLPの体系的文献レビューを行った。
論文参考訳（メタデータ） (2024-07-13T12:01:52Z)
The Ghanaian NLP Landscape: A First Look [9.17372840572907]
特にガーナ語は絶滅が記録され、いくつかは危険にさらされている。本研究は、ガーナ語に焦点をあてた自然言語処理(NLP)研究の包括的調査のパイオニアである。
論文参考訳（メタデータ） (2024-05-10T21:39:09Z)
Can a Multichoice Dataset be Repurposed for Extractive Question Answering? [52.28197971066953]
我々は,Multiple-choice Question answering (MCQA)のために設計されたBandarkar et al.(Bandarkar et al., 2023)を再利用した。本稿では,英語と現代標準アラビア語(MSA)のためのガイドラインと並列EQAデータセットを提案する。私たちの目標は、ベレベレにおける120以上の言語変異に対して、他者が私たちのアプローチを適応できるようにすることです。
論文参考訳（メタデータ） (2024-04-26T11:46:05Z)
EthioMT: Parallel Corpus for Low-resource Ethiopian Languages [49.80726355048843]
15言語用の新しい並列コーパスであるEthioMTを紹介する。また、エチオピアのより優れた言語のためのデータセットを収集して、新しいベンチマークを作成する。トランスフォーマーと微調整手法を用いて,新たに収集したコーパスと23のエチオピア語に対するベンチマークデータセットを評価した。
論文参考訳（メタデータ） (2024-03-28T12:26:45Z)
Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文参考訳（メタデータ） (2024-01-11T03:04:38Z)
NusaCrowd: Open Source Initiative for Indonesian NLP Resources [104.5381571820792]
NusaCrowdは、インドネシア語の既存のリソースを収集し、統一する共同イニシアチブである。我々の研究は、広く話されているにもかかわらず表現されていない言語に対する自然言語処理(NLP)の研究を進めようとしている。
論文参考訳（メタデータ） (2022-12-19T17:28:22Z)
One Country, 700+ Languages: NLP Challenges for Underrepresented Languages and Dialects in Indonesia [60.87739250251769]
インドネシアの700以上の言語を対象としたNLP研究の現状について概説する。インドネシアのNLPにおける課題と、現在のNLPシステムの性能にどのように影響するかを強調します。
論文参考訳（メタデータ） (2022-03-24T22:07:22Z)
MasakhaNER: Named Entity Recognition for African Languages [48.34339599387944]
アフリカで10の言語で名前付きエンティティ認識のための、最初の大規模な公開可能な高品質データセットを作成します。我々は,これらの言語がNERにもたらす課題を理解するために,言語の特徴を詳述する。
論文参考訳（メタデータ） (2021-03-22T13:12:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。