論文の概要: Developing Universal Dependency Treebanks for Magahi and Braj
- arxiv url: http://arxiv.org/abs/2204.12633v1
- Date: Tue, 26 Apr 2022 23:43:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-28 13:01:00.389169
- Title: Developing Universal Dependency Treebanks for Magahi and Braj
- Title(参考訳): MagahiとBrajのためのユニバーサル依存ツリーバンクの開発
- Authors: Mohit Raj, Shyam Ratan, Deepak Alok, Ritesh Kumar, Atul Kr. Ojha
- Abstract要約: 本稿では、マガヒ語とブラージュ語という2つの低リソースのインドの言語のためのツリーバンクの開発について論じる。
マガヒの木バンクには945の文と500の文からなるブラージュの木バンクがあり、その補題、部分音声、形態的特徴、普遍的な依存関係が特徴である。
- 参考スコア(独自算出の注目度): 0.7349727826230861
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we discuss the development of treebanks for two low-resourced
Indian languages - Magahi and Braj based on the Universal Dependencies
framework. The Magahi treebank contains 945 sentences and Braj treebank around
500 sentences marked with their lemmas, part-of-speech, morphological features
and universal dependencies. This paper gives a description of the different
dependency relationship found in the two languages and give some statistics of
the two treebanks. The dataset will be made publicly available on Universal
Dependency (UD) repository
(https://github.com/UniversalDependencies/UD_Magahi-MGTB/tree/master) in the
next(v2.10) release.
- Abstract(参考訳): 本稿では,Universal Dependenciesフレームワークに基づく2つの低リソースインド言語(MagahiとBraj)のためのツリーバンクの開発について論じる。
マガヒの木バンクには945の文と500の文からなるブラージュの木バンクがあり、その補題、部分音声、形態的特徴、普遍的な依存関係が特徴である。
本稿では,2つの言語における依存関係の異なる記述と,二つの木々バンクの統計について述べる。
データセットは次の(v2.10)リリースでUniversal Dependency(UD)リポジトリ(https://github.com/UniversalDependencies/UD_Magahi-MGTB/tree/master)で公開される。
関連論文リスト
- MaiBaam: A Multi-Dialectal Bavarian Universal Dependency Treebank [56.810282574817414]
We present the first multi-dialect Bavarian treebank (MaiBaam) based with part-of-speech and syntactic dependency information in Universal Dependencies (UD)。
我々は、近縁なバイエルン語とドイツ語のモルフォシンタクティックな相違を強調し、話者の正書法の豊富な多様性を示す。
私たちのコーパスには15kのトークンが含まれており、3つの国にまたがるバイエルン語を話すすべての地域の方言をカバーしています。
論文 参考訳(メタデータ) (2024-03-15T13:33:10Z) - Cross-Lingual Question Answering over Knowledge Base as Reading
Comprehension [61.079852289005025]
知識ベース(xKBQA)に対する言語間質問応答は、提供された知識ベースとは異なる言語での質問に答えることを目的としている。
xKBQAが直面する大きな課題の1つは、データアノテーションのコストが高いことである。
読解パラダイムにおけるxKBQAの新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-02-26T05:52:52Z) - Building an Endangered Language Resource in the Classroom: Universal
Dependencies for Kakataibo [0.8938910048099864]
ペルーで話されているパノア語であるカタイボ語(Kakataibo)という、絶滅危惧言語のための新しいユニバーサル依存ツリーバンクをAmazoniaから立ち上げました。
まず,大学生を対象とした計算言語コースの文脈において,木バンクの作成に有効な協調手法について論じる。
論文 参考訳(メタデータ) (2022-06-21T12:58:56Z) - UniMorph 4.0: Universal Morphology [104.69846084893298]
本稿は,過去2年間のいくつかの前線における展開と改善について述べる。
多くの言語学者による共同作業により、30の絶滅危惧言語を含む67の新しい言語が追加された。
前回のUniMorphリリースに合わせて,16言語で形態素セグメンテーションを施したデータベースも拡張した。
論文 参考訳(メタデータ) (2022-05-07T09:19:02Z) - Sememe Prediction for BabelNet Synsets using Multilingual and Multimodal
Information [89.24684041258747]
セメムナレッジベース(KB)は、手動でセメムでアノテートすることで構築される。
既存のSememe KBはいくつかの言語しかサポートしていないため、Sememeの利用を妨げている。
本稿では,多言語百科事典BabelNetをベースとした多言語セメムKBの構築を目的とする。
論文 参考訳(メタデータ) (2022-03-14T18:37:09Z) - Prix-LM: Pretraining for Multilingual Knowledge Base Construction [59.02868906044296]
複数言語による知識構築と完成のための統合フレームワークである Prix-LM を提案する。
既存の多言語KBから抽出したモノリンガルトリプルとクロスリンガルリンクの2種類の知識を利用する。
複数の言語におけるリンク予測、言語間リンク、バイリンガル語彙誘導など、標準的なエンティティ関連タスクの実験は、その効果を実証している。
論文 参考訳(メタデータ) (2021-10-16T02:08:46Z) - Apurin\~a Universal Dependencies Treebank [0.4893345190925178]
本稿では,アプリーナ語における最初のユニバーサル依存ツリーバンクについて論じる。
ツリーバンクには、76の完全注釈文、14のパート・オブ・スペル、および7つの追加または新機能が含まれている。
論文 参考訳(メタデータ) (2021-06-07T07:42:00Z) - Linguistic dependencies and statistical dependence [76.89273585568084]
文脈における単語の確率を推定するために,事前学習した言語モデルを用いる。
最大CPMI木は非文脈PMI推定値から抽出した木よりも言語的依存関係によく対応していることがわかった。
論文 参考訳(メタデータ) (2021-04-18T02:43:37Z) - Prague Dependency Treebank -- Consolidated 1.0 [1.7147127043116672]
Prague Dependency Treebank-Consolidated 1.0 (PDT-C 1.0)
PDT-C 1.0はチェコの4つの異なるデータセットを含み、標準のPDTスキームで一様に注釈付けされている。
ツリーバンクには、その形態的、表面的、そして深い構文的アノテーションを含む約180,000の文が含まれている。
論文 参考訳(メタデータ) (2020-06-05T20:52:55Z) - Universal Dependencies v2: An Evergrowing Multilingual Treebank
Collection [33.86322085911299]
Universal Dependenciesは、多くの言語に対して言語横断的に一貫性のあるツリーバンクアノテーションを作成するためのオープンコミュニティの取り組みである。
ガイドライン(UD v2)のバージョン2を説明し、UD v1からUD v2への大きな変更について論じ、現在90言語で利用可能なツリーバンクについて概説する。
論文 参考訳(メタデータ) (2020-04-22T15:38:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。