論文の概要: Apurin\~a Universal Dependencies Treebank
- arxiv url: http://arxiv.org/abs/2106.03391v1
- Date: Mon, 7 Jun 2021 07:42:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-09 10:11:08.370532
- Title: Apurin\~a Universal Dependencies Treebank
- Title(参考訳): Apurin\~a Universal Dependencies Treebank
- Authors: Jack Rueter, Mar\'ilia Fernanda Pereira de Freitas, Sidney da Silva
Facundes, Mika H\"am\"al\"ainen, Niko Partanen
- Abstract要約: 本稿では,アプリーナ語における最初のユニバーサル依存ツリーバンクについて論じる。
ツリーバンクには、76の完全注釈文、14のパート・オブ・スペル、および7つの追加または新機能が含まれている。
- 参考スコア(独自算出の注目度): 0.4893345190925178
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents and discusses the first Universal Dependencies treebank
for the Apurin\~a language. The treebank contains 76 fully annotated sentences,
applies 14 parts-of-speech, as well as seven augmented or new features - some
of which are unique to Apurin\~a. The construction of the treebank has also
served as an opportunity to develop finite-state description of the language
and facilitate the transfer of open-source infrastructure possibilities to an
endangered language of the Amazon. The source materials used in the initial
treebank represent fieldwork practices where not all tokens of all sentences
are equally annotated. For this reason, establishing regular annotation
practices for the entire Apurin\~a treebank is an ongoing project.
- Abstract(参考訳): 本稿では,アプリン・ア言語における最初のユニバーサル依存ツリーバンクについて論じる。
ツリーバンクには76の注釈文が含まれており、14のパート・オブ・スパイチと7つの拡張または新機能が適用される。
ツリーバンクの構築は、言語の有限状態記述を開発し、オープンソースのインフラストラクチャ可能性のAmazonの絶滅危惧言語への移行を促進する機会にもなっている。
最初のツリーバンクで使われるソース資料は、すべての文のすべてのトークンが等しくアノテートされていないフィールドワークのプラクティスを表している。
このため、apurin\~aツリーバンク全体に対して通常のアノテーションプラクティスを確立することは進行中のプロジェクトである。
関連論文リスト
- MaiBaam: A Multi-Dialectal Bavarian Universal Dependency Treebank [56.810282574817414]
We present the first multi-dialect Bavarian treebank (MaiBaam) based with part-of-speech and syntactic dependency information in Universal Dependencies (UD)。
我々は、近縁なバイエルン語とドイツ語のモルフォシンタクティックな相違を強調し、話者の正書法の豊富な多様性を示す。
私たちのコーパスには15kのトークンが含まれており、3つの国にまたがるバイエルン語を話すすべての地域の方言をカバーしています。
論文 参考訳(メタデータ) (2024-03-15T13:33:10Z) - Structured Dialogue Discourse Parsing [79.37200787463917]
談話解析は、多人数会話の内部構造を明らかにすることを目的としている。
本稿では,符号化と復号化という2つの観点から,従来の作業を改善する原理的手法を提案する。
実験の結果,本手法は,STACでは2.3,Mollweniでは1.5,先行モデルでは2.3を上回った。
論文 参考訳(メタデータ) (2023-06-26T22:51:01Z) - RLET: A Reinforcement Learning Based Approach for Explainable QA with
Entailment Trees [47.745218107037786]
本稿では,強化学習に基づくEntailment Tree生成フレームワークであるRLETを提案する。
RLETは文の選択と推論生成モジュールによる単一ステップ推論を反復的に行う。
EntailmentBankデータセットの3つの設定の実験では、RLフレームワークを使用することの強みが示されている。
論文 参考訳(メタデータ) (2022-10-31T06:45:05Z) - Building an Endangered Language Resource in the Classroom: Universal
Dependencies for Kakataibo [0.8938910048099864]
ペルーで話されているパノア語であるカタイボ語(Kakataibo)という、絶滅危惧言語のための新しいユニバーサル依存ツリーバンクをAmazoniaから立ち上げました。
まず,大学生を対象とした計算言語コースの文脈において,木バンクの作成に有効な協調手法について論じる。
論文 参考訳(メタデータ) (2022-06-21T12:58:56Z) - Universal Dependency Treebank for Odia Language [0.24466725954625887]
本稿では,形態学的に豊かな低資源のインド語であるオディア(Odia)の公用ツリーバンクについて紹介する。
ツリーバンクには、インド語で最大の並列コーパスコレクションである「サマンタル」から選ばれたオディアに約1082のトークン(100文)が含まれている。
オディア・ツリーバンクの形態解析は機械学習を用いて行った。
論文 参考訳(メタデータ) (2022-05-24T11:19:26Z) - LyS_ACoru\~na at SemEval-2022 Task 10: Repurposing Off-the-Shelf Tools
for Sentiment Analysis as Semantic Dependency Parsing [10.355938901584567]
本稿では,バイファイン・セマンティック・依存性を用いた構造化感情分析の課題に対処する。
i)1つのツリーバンクでのトレーニング、(ii)異なる言語から来るツリーバンクのトレーニングによってセットアップを緩和する。
i) 他の言語で利用可能なツリーバンクを単語レベルで翻訳して、騒々しく、文法的にも、注釈付きのデータを得る。
評価後の段階では、英語のすべてのツリーを単純にマージする言語間モデルも訓練した。
論文 参考訳(メタデータ) (2022-04-27T10:21:28Z) - Developing Universal Dependency Treebanks for Magahi and Braj [0.7349727826230861]
本稿では、マガヒ語とブラージュ語という2つの低リソースのインドの言語のためのツリーバンクの開発について論じる。
マガヒの木バンクには945の文と500の文からなるブラージュの木バンクがあり、その補題、部分音声、形態的特徴、普遍的な依存関係が特徴である。
論文 参考訳(メタデータ) (2022-04-26T23:43:41Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - Strongly Incremental Constituency Parsing with Graph Neural Networks [70.16880251349093]
文を構文木にパースすることは、NLPの下流アプリケーションに恩恵をもたらす。
トランジッションベースは、状態遷移システムでアクションを実行することでツリーを構築する。
既存のトランジションベースは主にシフト・リデュース・トランジション・システムに基づいている。
論文 参考訳(メタデータ) (2020-10-27T19:19:38Z) - Span-based Semantic Parsing for Compositional Generalization [53.24255235340056]
SpanBasedSPは入力発話上のスパンツリーを予測し、部分的なプログラムが入力内のスパンをどのように構成するかを明示的に符号化する。
GeoQuery、SCAN、CLOSUREでは、SpanBasedSPはランダムスプリットの強いseq2seqベースラインと似ているが、構成一般化を必要とするスプリットのベースラインに比べて劇的に性能が向上する。
論文 参考訳(メタデータ) (2020-09-13T16:42:18Z) - Resources for Turkish Dependency Parsing: Introducing the BOUN Treebank
and the BoAT Annotation Tool [0.0]
トルコの係り受け解析のために開発した資源について紹介し,手作業による注釈付きツリーバンク(BOUN Treebank)について紹介する。
BOUNツリーバンクのアノテーションに関する決定は、Universal Dependencies (UD)フレームワークに従って行われた。
BOUNツリーバンクおよびトルコの他の2つのツリーバンク上で得られた最先端の依存性アノテーションの結果を報告する。
論文 参考訳(メタデータ) (2020-02-24T17:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。