論文の概要: Towards Supervised and Unsupervised Neural Machine Translation Baselines
for Nigerian Pidgin
- arxiv url: http://arxiv.org/abs/2003.12660v1
- Date: Fri, 27 Mar 2020 22:40:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 04:26:47.929235
- Title: Towards Supervised and Unsupervised Neural Machine Translation Baselines
for Nigerian Pidgin
- Title(参考訳): ナイジェリアピジンの教師付き・教師なしニューラルマシン翻訳ベースラインに向けて
- Authors: Orevaoghene Ahia and Kelechi Ogueji
- Abstract要約: ナイジェリアのピジン語はおそらくナイジェリアで最も広く話されている言語である。この言語は西アフリカや中央アフリカでも話されている。
この研究は、英語とナイジェリアのピジンの間で、教師付きおよび教師なしのニューラルネットワーク翻訳ベースラインを確立することを目的としている。
- 参考スコア(独自算出の注目度): 0.2792030485253753
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Nigerian Pidgin is arguably the most widely spoken language in Nigeria.
Variants of this language are also spoken across West and Central Africa,
making it a very important language. This work aims to establish supervised and
unsupervised neural machine translation (NMT) baselines between English and
Nigerian Pidgin. We implement and compare NMT models with different
tokenization methods, creating a solid foundation for future works.
- Abstract(参考訳): ナイジェリア語はおそらくナイジェリアで最も広く話されている言語である。
この言語は西アフリカや中央アフリカでも話されており、非常に重要な言語である。
この研究は、英語とナイジェリアのピジン間の教師なしニューラルネットワーク翻訳(NMT)ベースラインを確立することを目的としている。
我々はNMTモデルと異なるトークン化手法を実装・比較し、将来の研究のための確かな基盤を作る。
関連論文リスト
- Does Generative AI speak Nigerian-Pidgin?: Issues about Representativeness and Bias for Multilingualism in LLMs [8.829688681748413]
ナイジャ語はナイジェリアのピジン語で、約120万人の話者によって話されている。
西アフリカ・ピジン英語(西アフリカ・ピジン英語、西アフリカ・ピジン英語、西アフリカ・ピジン英語、西アフリカ・ピジン英語、西アフリカ・ピジン英語、西アフリカ・ピジン英語、西アフリカ・ピジン
論文 参考訳(メタデータ) (2024-04-30T10:45:40Z) - Neural Machine Translation for the Indigenous Languages of the Americas:
An Introduction [102.13536517783837]
アメリカ大陸のほとんどの言語は、もしあるならば、並列データと単言語データしか持たない。
これらの言語におけるNLPコミュニティの関心が高まった結果、最近の進歩、発見、オープンな質問について論じる。
論文 参考訳(メタデータ) (2023-06-11T23:27:47Z) - NollySenti: Leveraging Transfer Learning and Machine Translation for
Nigerian Movie Sentiment Classification [10.18858070640917]
アフリカには2000以上の先住民族の言語があるが、データセットが不足しているため、NLPの研究では不足している。
私たちは、ナイジェリアで広く話されている5つの言語(英語、ハウサ語、イグボ語、ナイジェリア・ピジン語、ヨルバ語)のノリーウッド映画レビューに基づいて、新しいデータセット、NollySentiを作成しました。
論文 参考訳(メタデータ) (2023-05-18T13:38:36Z) - Language Modeling, Lexical Translation, Reordering: The Training Process
of NMT through the Lens of Classical SMT [64.1841519527504]
ニューラルマシン翻訳は、翻訳プロセス全体をモデル化するために、単一のニューラルネットワークを使用する。
ニューラルネットワーク翻訳はデファクトスタンダードであるにもかかわらず、NMTモデルがトレーニングの過程でどのように異なる能力を獲得するのかは、まだ明らかになっていない。
論文 参考訳(メタデータ) (2021-09-03T09:38:50Z) - Exploring Unsupervised Pretraining Objectives for Machine Translation [99.5441395624651]
教師なし言語間事前訓練は、ニューラルマシン翻訳(NMT)の強力な結果を得た
ほとんどのアプローチは、入力の一部をマスキングしてデコーダで再構成することで、シーケンス・ツー・シーケンスアーキテクチャにマスク付き言語モデリング(MLM)を適用する。
マスキングと、実際の(完全な)文に似た入力を生成する代替目的を、文脈に基づいて単語を並べ替えて置き換えることにより比較する。
論文 参考訳(メタデータ) (2021-06-10T10:18:23Z) - Towards End-to-End Training of Automatic Speech Recognition for Nigerian
Pidgin [0.0]
ナイジェリアのピジンは西アフリカで最も人気のある言語の一つである。
我々はナイジェリアのピジンについて最初のパラレル(音声からテキスト)データを提示する。
また,この言語を用いた最初のエンドツーエンド音声認識システムを訓練した。
論文 参考訳(メタデータ) (2020-10-21T16:32:58Z) - SJTU-NICT's Supervised and Unsupervised Neural Machine Translation
Systems for the WMT20 News Translation Task [111.91077204077817]
我々は英語・中国語・英語・ポーランド語・ドイツ語・アッパー・ソルビアンという3つの言語対の4つの翻訳指導に参加した。
言語ペアの異なる条件に基づいて、我々は多様なニューラルネットワーク翻訳(NMT)技術の実験を行った。
私たちの提出書では、主要なシステムは英語、中国語、ポーランド語、英語、ドイツ語から上セルビア語への翻訳の道順で第一位を獲得しました。
論文 参考訳(メタデータ) (2020-10-11T00:40:05Z) - HausaMT v1.0: Towards English-Hausa Neural Machine Translation [0.012691047660244334]
英語・ハウサ語機械翻訳のベースラインモデルを構築した。
ハーサ語は、アラビア語に次いで世界で2番目に大きいアフロ・アジア語である。
論文 参考訳(メタデータ) (2020-06-09T02:08:03Z) - Neural Machine Translation: Challenges, Progress and Future [62.75523637241876]
機械翻訳(英: Machine translation, MT)は、コンピュータを利用して人間の言語を自動翻訳する技術である。
ニューラルマシン翻訳(NMT)は、ディープニューラルネットワークを用いたソース言語とターゲット言語間の直接マッピングをモデル化する。
この記事では、NMTフレームワークをレビューし、NMTの課題について論じ、最近のエキサイティングな進歩を紹介します。
論文 参考訳(メタデータ) (2020-04-13T07:53:57Z) - Cross-lingual Supervision Improves Unsupervised Neural Machine
Translation [97.84871088440102]
我々は,高リソース言語対からゼロリソース翻訳方向への弱教師付き信号を活用するために,多言語非教師付きNMTフレームワークを導入する。
6つのベンチマークの教師なし翻訳方向において,BLEUスコアが3以上あることにより,翻訳品質が大幅に向上する。
論文 参考訳(メタデータ) (2020-04-07T05:46:49Z) - Towards Neural Machine Translation for Edoid Languages [2.144787054581292]
多くのナイジェリアの言語は、現代の社会における彼らの以前の名声と目的を、英語とナイジェリアのピジンに放棄した。
本研究は,南ナイジェリアの江戸語族におけるニューラルマシン翻訳の実現可能性について考察する。
論文 参考訳(メタデータ) (2020-03-24T07:53:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。