Fugu-MT 論文翻訳(概要): Which Nigerian-Pidgin does Generative AI speak?: Issues about Representativeness and Bias for Multilingual and Low Resource Languages

論文の概要: Which Nigerian-Pidgin does Generative AI speak?: Issues about Representativeness and Bias for Multilingual and Low Resource Languages

arxiv url: http://arxiv.org/abs/2404.19442v1
Date: Tue, 30 Apr 2024 10:45:40 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-01 14:34:58.865193
Title: Which Nigerian-Pidgin does Generative AI speak?: Issues about Representativeness and Bias for Multilingual and Low Resource Languages
Title（参考訳）: ナイジェリア・ピジンはジェネレーティブAIを話すのか?:多言語・低資源言語における代表性とバイアスの問題
Authors: David Ifeoluwa Adelani, A. Seza Doğruöz, Iyanuoluwa Shode, Anuoluwapo Aremu,
Abstract要約: ナイジャ語はナイジェリアで約1億2000万人の話者が話していたナイジェリア・ピジン語である。現在、ナイジャには2つのジャンル(BBCとウィキペディア)がある。 Generative AIはBBCのジャンルで書かれたNaijaをベースとしている。
参考スコア（独自算出の注目度）: 8.829688681748413
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Naija is the Nigerian-Pidgin spoken by approx. 120M speakers in Nigeria and it is a mixed language (e.g., English, Portuguese and Indigenous languages). Although it has mainly been a spoken language until recently, there are currently two written genres (BBC and Wikipedia) in Naija. Through statistical analyses and Machine Translation experiments, we prove that these two genres do not represent each other (i.e., there are linguistic differences in word order and vocabulary) and Generative AI operates only based on Naija written in the BBC genre. In other words, Naija written in Wikipedia genre is not represented in Generative AI.
Abstract（参考訳）: ナイジャ(英: Naija)は、ナイジェリア・ピジン州で、アポックスによって話される言語である。ナイジェリアでは1億2000万人が話者であり、混成言語(英語、ポルトガル語、先住民語など)である。主に最近まで話し言葉だったが、現在ナイジャには2つのジャンル(BBCとウィキペディア)がある。統計的分析と機械翻訳実験により、これらの2つのジャンルが互いに表現していないこと(すなわち、単語順と語彙の言語的差異がある)、生成AIはBBCのジャンルで書かれたナイジャに基づいてのみ動作することを証明した。言い換えれば、ウィキペディアのジャンルで書かれたナイジャは生成AIでは表現されない。

関連論文リスト

Ibom NLP: A Step Toward Inclusive Natural Language Processing for Nigeria's Minority Languages [5.5078606217036965]
ナイジェリアはアフリカで最も人口の多い国であり、人口は2億人を超えている。ナイジェリアでは500以上の言語が話されており、世界で最も言語的に多様である。それにもかかわらず、自然言語処理(NLP)の研究は主に、Hausa、Igbo、ナイジェリア・ピジン、Yorubaの4つの言語に焦点を当てている。
論文参考訳（メタデータ） (2025-11-09T20:33:39Z)
Do You Know About My Nation? Investigating Multilingual Language Models' Cultural Literacy Through Factual Knowledge [68.6805229085352]
ほとんどの多言語質問答えベンチマークは、取得した情報の地域的多様性を規定していない。 XNationQAには、9カ国の地理、文化、歴史に関する合計49,280の質問が7つの言語で提示されている。我々はXNationQA上で8つの標準多言語LLMをベンチマークし、2つの新しい転送指標を用いて評価した。
論文参考訳（メタデータ） (2025-11-01T18:41:34Z)
Mind the Gap! Choice Independence in Using Multilingual LLMs for Persuasive Co-Writing Tasks in Different Languages [51.96666324242191]
チャリティー広告作成タスクにおける新規筆記アシスタントのユーザ利用が、第2言語におけるAIの性能に影響を及ぼすかどうかを分析する。我々は、これらのパターンが、生成したチャリティー広告の説得力に変換される程度を定量化する。
論文参考訳（メタデータ） (2025-02-13T17:49:30Z)
Nollywood: Let's Go to the Movies! [3.818480245025447]
ナイジェリア英語をアメリカ英語に翻訳できる音声サブタイトルモデルを作成する。また、最も高度な毒性検知器を用いて、音声がどれほど有害であるかを検知します。我々の狙いは、方言理解の欠如からしばしば無視されるこれらのビデオのテキストを強調することである。
論文参考訳（メタデータ） (2024-07-02T19:50:55Z)
Voices Unheard: NLP Resources and Models for Yorùbá Regional Dialects [72.18753241750964]
Yorub'aは、約4700万人の話者を持つアフリカの言語である。アフリカ語のためのNLP技術開発への最近の取り組みは、彼らの標準方言に焦点を当てている。我々は、このギャップを埋めるために、新しい高品質のパラレルテキストと音声コーパスを導入する。
論文参考訳（メタデータ） (2024-06-27T22:38:04Z)
What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文参考訳（メタデータ） (2024-02-19T09:15:28Z)
Neural Machine Translation for the Indigenous Languages of the Americas: An Introduction [102.13536517783837]
アメリカ大陸のほとんどの言語は、もしあるならば、並列データと単言語データしか持たない。これらの言語におけるNLPコミュニティの関心が高まった結果、最近の進歩、発見、オープンな質問について論じる。
論文参考訳（メタデータ） (2023-06-11T23:27:47Z)
AfriSenti: A Twitter Sentiment Analysis Benchmark for African Languages [45.88640066767242]
アフリカには6以上の言語族から2000以上の言語があり、全大陸で最高の言語多様性がある。しかし、アフリカ語で実施されているNLP研究はほとんどない。そのような研究を可能にする上で重要なのは、高品質な注釈付きデータセットが利用可能であることだ。本稿では,14のアフリカ語で110,000以上のツイートを含む感情分析ベンチマークであるAfriSentiを紹介する。
論文参考訳（メタデータ） (2023-02-17T15:40:12Z)
\`It\`ak\'ur\`oso: Exploiting Cross-Lingual Transferability for Natural Language Generation of Dialogues in Low-Resource, African Languages [0.9511471519043974]
本研究では,最先端のモノリンガルモデル(SoTA)から6つのアフリカ語への言語間移動の可能性について検討する。言語はスワヒリ語、ヴロフ語、ハウサ語、ナイジェリア語、ピジン語、キンヤルワンダ語、ヨルバ語である。結果は、深い単言語モデルが言語にまたがって一般化する抽象性を学ぶという仮説が成り立つことを示している。
論文参考訳（メタデータ） (2022-04-17T20:23:04Z)
One Country, 700+ Languages: NLP Challenges for Underrepresented Languages and Dialects in Indonesia [60.87739250251769]
インドネシアの700以上の言語を対象としたNLP研究の現状について概説する。インドネシアのNLPにおける課題と、現在のNLPシステムの性能にどのように影響するかを強調します。
論文参考訳（メタデータ） (2022-03-24T22:07:22Z)
Towards End-to-End Training of Automatic Speech Recognition for Nigerian Pidgin [0.0]
ナイジェリアのピジンは西アフリカで最も人気のある言語の一つである。我々はナイジェリアのピジンについて最初のパラレル(音声からテキスト)データを提示する。また,この言語を用いた最初のエンドツーエンド音声認識システムを訓練した。
論文参考訳（メタデータ） (2020-10-21T16:32:58Z)
SIGMORPHON 2020 Shared Task 0: Typologically Diverse Morphological Inflection [81.85463892070085]
形態的回帰に関するSIGMORPHON 2020の課題は、型的に異なる言語にまたがるシステムの一般化能力を調査することを目的としている。システムは45言語と5つの言語ファミリーのデータを使用して開発され、追加の45言語と10の言語ファミリー(合計13言語)のデータで微調整され、90言語すべてで評価された。
論文参考訳（メタデータ） (2020-06-20T13:24:14Z)
Towards Supervised and Unsupervised Neural Machine Translation Baselines for Nigerian Pidgin [0.2792030485253753]
ナイジェリアのピジン語はおそらくナイジェリアで最も広く話されている言語である。この言語は西アフリカや中央アフリカでも話されている。この研究は、英語とナイジェリアのピジンの間で、教師付きおよび教師なしのニューラルネットワーク翻訳ベースラインを確立することを目的としている。
論文参考訳（メタデータ） (2020-03-27T22:40:01Z)
Towards Neural Machine Translation for Edoid Languages [2.144787054581292]
多くのナイジェリアの言語は、現代の社会における彼らの以前の名声と目的を、英語とナイジェリアのピジンに放棄した。本研究は,南ナイジェリアの江戸語族におけるニューラルマシン翻訳の実現可能性について考察する。
論文参考訳（メタデータ） (2020-03-24T07:53:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。