論文の概要: A Digital Corpus of St. Lawrence Island Yupik
- arxiv url: http://arxiv.org/abs/2101.10496v1
- Date: Tue, 26 Jan 2021 00:14:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-13 19:58:32.149406
- Title: A Digital Corpus of St. Lawrence Island Yupik
- Title(参考訳): セントローレンス島ユピックのデジタルコーパス
- Authors: Lane Schwartz and Emily Chen and Hyunji Hayley Park and Edward Jahn
and Sylvia L.R. Schreiner
- Abstract要約: セントローレンス島ユピク語(St. Lawrence Island Yupik)は、アラスカやチュコッカに自生するイヌイット・ユピク語族の絶滅の危機的多合成言語である。
この研究は、文章のデジタル化のためのステップバイステップパイプラインと、セントローレンス島ユピックで公開された最初のデジタルコーパスを提示する。
- 参考スコア(独自算出の注目度): 8.961418142411487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: St. Lawrence Island Yupik (ISO 639-3: ess) is an endangered polysynthetic
language in the Inuit-Yupik language family indigenous to Alaska and Chukotka.
This work presents a step-by-step pipeline for the digitization of written
texts, and the first publicly available digital corpus for St. Lawrence Island
Yupik, created using that pipeline. This corpus has great potential for future
linguistic inquiry and research in NLP. It was also developed for use in Yupik
language education and revitalization, with a primary goal of enabling easy
access to Yupik texts by educators and by members of the Yupik community. A
secondary goal is to support development of language technology such as
spell-checkers, text-completion systems, interactive e-books, and language
learning apps for use by the Yupik community.
- Abstract(参考訳): セントローレンス・アイランド・ユピク(英語: St. Lawrence Island Yupik, ISO 639-3: ess)は、アラスカやチュコトカに自生するイヌイット・ユピク語族の絶滅危うい多合成言語である。
この研究は、文章のデジタル化のためのステップバイステップパイプラインと、そのパイプラインを使用して作成されたセントローレンス島ユピックのための最初の公開デジタルコーパスを提示する。
このコーパスは今後のNLPにおける言語調査や研究に大きな可能性を持っている。
また、Yupik言語教育と活性化のために開発され、教育者やYupikコミュニティのメンバーによってYupikテキストに簡単にアクセスできます。
第二の目標は、スペルチェッカー、テキスト補完システム、インタラクティブな電子ブック、Yupikコミュニティが使用する言語学習アプリなどの言語技術の開発を支援することです。
関連論文リスト
- ILiAD: An Interactive Corpus for Linguistic Annotated Data from Twitter Posts [0.0]
英語のTwitter投稿から言語コーパスの開発と展開について述べる。
主な目標は、言語分析のための完全な注釈付き英語コーパスを作ることであった。
形態や構文に関する情報に加えて,トークン化やレムマ,n-gramなどのNLP機能も含んでいます。
論文 参考訳(メタデータ) (2024-07-22T04:48:04Z) - Enhancing Language Learning through Technology: Introducing a New English-Azerbaijani (Arabic Script) Parallel Corpus [0.9051256541674136]
本稿では,英語・アゼルバイジャン語の並列コーパスについて紹介する。
これは、低リソース言語のための言語学習と機械翻訳の技術的ギャップを埋めるように設計されている。
論文 参考訳(メタデータ) (2024-07-06T21:23:20Z) - A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.77214818319054]
自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文 参考訳(メタデータ) (2024-05-20T08:41:15Z) - Teacher Perception of Automatically Extracted Grammar Concepts for L2
Language Learning [66.79173000135717]
本研究は、カンナダ語とマラティ語という2つのインドの言語教育に適用する。
我々は、形態素構文(単語順、一致、ケースマーキング、または単語形成の学習)と意味論(語彙の学習)に関する疑問に答える自然なテキストコーパスから記述を抽出する。
我々は,北米の学校から言語教育者の助けを借りて手作業による評価を行い,教材が授業の準備や学習者評価に利用できる可能性を見出した。
論文 参考訳(メタデータ) (2023-10-27T18:17:29Z) - Building an Endangered Language Resource in the Classroom: Universal
Dependencies for Kakataibo [0.8938910048099864]
ペルーで話されているパノア語であるカタイボ語(Kakataibo)という、絶滅危惧言語のための新しいユニバーサル依存ツリーバンクをAmazoniaから立ち上げました。
まず,大学生を対象とした計算言語コースの文脈において,木バンクの作成に有効な協調手法について論じる。
論文 参考訳(メタデータ) (2022-06-21T12:58:56Z) - The Open corpus of the Veps and Karelian languages: overview and
applications [52.77024349608834]
The Open Corpus of the Veps and Karelian Languages (VepKar)は、2009年に設立されたVepsの拡張である。
VepKarコーパスは、カレリア語とヴェプス語のテキスト、それにリンクされた多機能辞書、高度な検索システムを備えたソフトウェアで構成されている。
今後の計画には、音声録音を扱うための音声モジュールと、形態解析出力を用いた構文タグ付けモジュールの開発が含まれる。
論文 参考訳(メタデータ) (2022-06-08T13:05:50Z) - How can NLP Help Revitalize Endangered Languages? A Case Study and
Roadmap for the Cherokee Language [91.79339725967073]
世界で話されている言語の43%以上が危険にさらされている。
本研究では,NLPが絶滅危惧言語の再活性化にどう役立つかについて議論する。
私たちは、深刻な絶滅危惧言語であるチェロキーをケーススタディとして捉えています。
論文 参考訳(メタデータ) (2022-04-25T18:25:57Z) - Including Signed Languages in Natural Language Processing [48.62744923724317]
署名された言語は、聴覚障害者や難聴者のコミュニケーションの主な手段です。
このポジショニングペーパーは、NLPコミュニティに対して、社会的および科学的影響の高い研究領域として署名された言語を含めるよう求めている。
論文 参考訳(メタデータ) (2021-05-11T17:37:55Z) - A Summary of the First Workshop on Language Technology for Language
Documentation and Revitalization [70.14668193220528]
2019年8月、カーネギーメロン大学でワークショップが開かれ、言語コミュニティのメンバー、ドキュメンタリー言語学者、技術者を集結させようとした。
本報告では,ワークショップの結果を報告するとともに,9言語を対象とした様々な技術が開発され,実装されている。
論文 参考訳(メタデータ) (2020-04-27T22:55:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。