論文の概要: Building an Endangered Language Resource in the Classroom: Universal
Dependencies for Kakataibo
- arxiv url: http://arxiv.org/abs/2206.10343v1
- Date: Tue, 21 Jun 2022 12:58:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 23:43:02.856158
- Title: Building an Endangered Language Resource in the Classroom: Universal
Dependencies for Kakataibo
- Title(参考訳): 教室における絶滅危惧言語資源の構築:カタイボの普遍的依存
- Authors: Roberto Zariquiey, Claudia Alvarado, Ximena Echevarria, Luisa Gomez,
Rosa Gonzales, Mariana Illescas, Sabina Oporto, Frederic Blum, Arturo
Oncevay, Javier Vera
- Abstract要約: ペルーで話されているパノア語であるカタイボ語(Kakataibo)という、絶滅危惧言語のための新しいユニバーサル依存ツリーバンクをAmazoniaから立ち上げました。
まず,大学生を対象とした計算言語コースの文脈において,木バンクの作成に有効な協調手法について論じる。
- 参考スコア(独自算出の注目度): 0.8938910048099864
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we launch a new Universal Dependencies treebank for an
endangered language from Amazonia: Kakataibo, a Panoan language spoken in Peru.
We first discuss the collaborative methodology implemented, which proved
effective to create a treebank in the context of a Computational Linguistic
course for undergraduates. Then, we describe the general details of the
treebank and the language-specific considerations implemented for the proposed
annotation. We finally conduct some experiments on part-of-speech tagging and
syntactic dependency parsing. We focus on monolingual and transfer learning
settings, where we study the impact of a Shipibo-Konibo treebank, another
Panoan language resource.
- Abstract(参考訳): 本稿では,ペルーで話されるパノア語であるカタイボ語(Kataibo)という,絶滅危惧言語のための新しいユニバーサル依存ツリーバンクをAmazoniaから立ち上げる。
まず,大学生を対象とした計算言語コースの文脈において,木バンクの作成に有効な協調手法について論じる。
次に,木々バンクの詳細と,提案するアノテーションに実装された言語固有の考察について述べる。
音声タグ付けと構文依存解析の実験を行った。
我々はモノリンガルと移動学習の設定に焦点を合わせ、別のパノア語リソースであるShitibo-Koniboツリーバンクの影響について研究する。
関連論文リスト
- Building a Language-Learning Game for Brazilian Indigenous Languages: A Case of Study [0.0]
本稿では,依存ツリーバンクから言語演習や質問を自動的に生成するプロセスと,トゥピアン言語のための語彙データベースについて述べる。
我々は、新たなデータ収集プロセスは、先住民コミュニティと連携して確立され、教育目的に向けられるべきであると結論付けている。
論文 参考訳(メタデータ) (2024-03-21T16:11:44Z) - MaiBaam: A Multi-Dialectal Bavarian Universal Dependency Treebank [56.810282574817414]
We present the first multi-dialect Bavarian treebank (MaiBaam) based with part-of-speech and syntactic dependency information in Universal Dependencies (UD)。
我々は、近縁なバイエルン語とドイツ語のモルフォシンタクティックな相違を強調し、話者の正書法の豊富な多様性を示す。
私たちのコーパスには15kのトークンが含まれており、3つの国にまたがるバイエルン語を話すすべての地域の方言をカバーしています。
論文 参考訳(メタデータ) (2024-03-15T13:33:10Z) - JamPatoisNLI: A Jamaican Patois Natural Language Inference Dataset [7.940548890754674]
JamPatoisNLIは、クレオール言語であるジャマイカのパトワで、自然言語推論のための最初のデータセットを提供する。
最もスポークな低リソース言語の多くはクレオールである。
実験の結果,JamPatoisNLIは非関連言語よりも,比較的優れた学習結果が得られた。
論文 参考訳(メタデータ) (2022-12-07T03:07:02Z) - LyS_ACoru\~na at SemEval-2022 Task 10: Repurposing Off-the-Shelf Tools
for Sentiment Analysis as Semantic Dependency Parsing [10.355938901584567]
本稿では,バイファイン・セマンティック・依存性を用いた構造化感情分析の課題に対処する。
i)1つのツリーバンクでのトレーニング、(ii)異なる言語から来るツリーバンクのトレーニングによってセットアップを緩和する。
i) 他の言語で利用可能なツリーバンクを単語レベルで翻訳して、騒々しく、文法的にも、注釈付きのデータを得る。
評価後の段階では、英語のすべてのツリーを単純にマージする言語間モデルも訓練した。
論文 参考訳(メタデータ) (2022-04-27T10:21:28Z) - Linking Emergent and Natural Languages via Corpus Transfer [98.98724497178247]
創発言語と自然言語のコーパス転送によるリンクを確立する新しい方法を提案する。
このアプローチでは,言語モデリングとイメージキャプションという,2つの異なるタスクに対して,非自明な転送メリットを示す。
また,同一画像に基づく自然言語キャプションに創発的メッセージを翻訳することで,創発的言語の伝達可能性を予測する新しい指標を提案する。
論文 参考訳(メタデータ) (2022-03-24T21:24:54Z) - Towards Zero-shot Language Modeling [90.80124496312274]
人間の言語学習に誘導的に偏りを持つニューラルモデルを構築した。
類型的に多様な訓練言語のサンプルからこの分布を推測する。
我々は、保留言語に対する遠隔監視として、追加の言語固有の側情報を利用する。
論文 参考訳(メタデータ) (2021-08-06T23:49:18Z) - Apurin\~a Universal Dependencies Treebank [0.4893345190925178]
本稿では,アプリーナ語における最初のユニバーサル依存ツリーバンクについて論じる。
ツリーバンクには、76の完全注釈文、14のパート・オブ・スペル、および7つの追加または新機能が含まれている。
論文 参考訳(メタデータ) (2021-06-07T07:42:00Z) - Automatically Identifying Language Family from Acoustic Examples in Low
Resource Scenarios [48.57072884674938]
ディープラーニングを用いて言語類似性を解析する手法を提案する。
すなわち、Willernessデータセットのモデルをトレーニングし、その潜在空間が古典的な言語家族の発見とどのように比較されるかを調べる。
論文 参考訳(メタデータ) (2020-12-01T22:44:42Z) - XCOPA: A Multilingual Dataset for Causal Commonsense Reasoning [68.57658225995966]
XCOPA (Cross-lingual Choice of Plausible Alternatives) は11言語における因果コモンセンス推論のための多言語データセットである。
提案手法は,翻訳に基づく転送と比較して,現在の手法の性能が低下していることを明らかにする。
論文 参考訳(メタデータ) (2020-05-01T12:22:33Z) - A Summary of the First Workshop on Language Technology for Language
Documentation and Revitalization [70.14668193220528]
2019年8月、カーネギーメロン大学でワークショップが開かれ、言語コミュニティのメンバー、ドキュメンタリー言語学者、技術者を集結させようとした。
本報告では,ワークショップの結果を報告するとともに,9言語を対象とした様々な技術が開発され,実装されている。
論文 参考訳(メタデータ) (2020-04-27T22:55:55Z) - Resources for Turkish Dependency Parsing: Introducing the BOUN Treebank
and the BoAT Annotation Tool [0.0]
トルコの係り受け解析のために開発した資源について紹介し,手作業による注釈付きツリーバンク(BOUN Treebank)について紹介する。
BOUNツリーバンクのアノテーションに関する決定は、Universal Dependencies (UD)フレームワークに従って行われた。
BOUNツリーバンクおよびトルコの他の2つのツリーバンク上で得られた最先端の依存性アノテーションの結果を報告する。
論文 参考訳(メタデータ) (2020-02-24T17:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。