論文の概要: Classifying several dialectal Nawatl varieties
- arxiv url: http://arxiv.org/abs/2601.02303v1
- Date: Mon, 05 Jan 2026 17:38:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:23.325611
- Title: Classifying several dialectal Nawatl varieties
- Title(参考訳): いくつかの方言のナワトル品種を分類する
- Authors: Juan-José Guzmán-Landa, Juan-Manuel Torres-Moreno, Miguel Figueroa-Saavedra, Carlos-Emiliano González-Gallardo, Graham Ranger, Martha Lorena-Avendaño-Garrido,
- Abstract要約: メキシコで最も広く話されている先住民言語はナワトル語であり、現在200万人以上がそれを使用している。
その豊かな文化遺産にもかかわらず、ナワトル語はコンピュータ資源がほとんどない言語である。
この問題は方言の変種に関して複雑であり、約30の変種が認識されており、言語の書体で異なる綴りを数えていない。
本研究では,機械学習とニューラルネットワークを用いてナワトル品種を分類する問題に対処する。
- 参考スコア(独自算出の注目度): 0.21498988090998952
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mexico is a country with a large number of indigenous languages, among which the most widely spoken is Nawatl, with more than two million people currently speaking it (mainly in North and Central America). Despite its rich cultural heritage, which dates back to the 15th century, Nawatl is a language with few computer resources. The problem is compounded when it comes to its dialectal varieties, with approximately 30 varieties recognised, not counting the different spellings in the written forms of the language. In this research work, we addressed the problem of classifying Nawatl varieties using Machine Learning and Neural Networks.
- Abstract(参考訳): メキシコは多くの先住民族の言語を持つ国であり、最も広く話されているのはナワトル語であり、現在200万人以上の人々がこの言語を話している(主に北アメリカと中央アメリカ)。
15世紀にさかのぼる豊かな文化遺産にもかかわらず、ナワトル語はコンピュータ資源がほとんどない言語である。
この問題は方言の変種に関して複雑であり、約30の変種が認識されており、言語の記述形式で異なる綴りを数えていない。
本研究では,機械学習とニューラルネットワークを用いてナワトル品種を分類する問題に対処する。
関連論文リスト
- Is It Navajo? Accurate Language Detection in Endangered Athabaskan Languages [34.78841410279943]
ナヴァホのような絶滅危惧言語は、現代の言語技術では著しく不足している。
本研究では、現在ネイティブアメリカン言語をサポートしていないGoogleの言語識別(LangID)ツールを評価する。
論文 参考訳(メタデータ) (2025-01-27T04:43:18Z) - Indigenous Languages Spoken in Argentina: A Survey of NLP and Speech Resources [45.07333085270152]
アルゼンチンには、少なくとも40の異なる言語を含む、大きながほとんど知られていない先住民族の言語多様性がある。
我々はアルゼンチンで話される先住民族の言語を体系化し、それらを7つの言語族に分類する。
それぞれについて、最新のアルゼンチンの国勢調査に基づいて、全国の先住民の人口規模を推定する。
論文 参考訳(メタデータ) (2025-01-17T03:47:19Z) - Curated Datasets and Neural Models for Machine Translation of Informal Registers between Mayan and Spanish Vernaculars [2.2061683015812026]
我々はグアテマラとメキシコ南部で話されているいくつかのマヤ語言語でコーパスを開発し、キュレートし、公開する。
データセットは、その地域の支配的な言語であるスペイン語と平行している。
我々は、可能な限り多くのリソースとマヤ語で訓練されたニューラルマシン翻訳モデルを提示し、データセットでのみ評価する。
論文 参考訳(メタデータ) (2024-04-11T12:09:47Z) - Same Neurons, Different Languages: Probing Morphosyntax in Multilingual
Pre-trained Models [84.86942006830772]
多言語事前学習モデルは文法に関する言語・ユニバーサルの抽象化を導出できると推測する。
43の言語と14のモルフォシンタクティックなカテゴリーで、最先端のニューロンレベルのプローブを用いて、初めて大規模な実験を行った。
論文 参考訳(メタデータ) (2022-05-04T12:22:31Z) - Phoneme Recognition through Fine Tuning of Phonetic Representations: a
Case Study on Luhya Language Varieties [77.2347265289855]
音韻アノテーションに基づく多言語認識手法であるAllosaurus を用いた音素認識に焦点を当てた。
挑戦的な実世界シナリオで評価するために,我々は,ケニア西部とウガンダ東部のluhya言語クラスタの2つの種類であるbukusuとsaamiaの音声認識データセットをキュレートした。
私たちは、アロサウルスの微調整がわずか100発話であっても、電話のエラー率を大幅に改善することが分かりました。
論文 参考訳(メタデータ) (2021-04-04T15:07:55Z) - SIGMORPHON 2020 Shared Task 0: Typologically Diverse Morphological
Inflection [81.85463892070085]
形態的回帰に関するSIGMORPHON 2020の課題は、型的に異なる言語にまたがるシステムの一般化能力を調査することを目的としている。
システムは45言語と5つの言語ファミリーのデータを使用して開発され、追加の45言語と10の言語ファミリー(合計13言語)のデータで微調整され、90言語すべてで評価された。
論文 参考訳(メタデータ) (2020-06-20T13:24:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。