論文の概要: Modern Uyghur Dependency Treebank (MUDT): An Integrated Morphosyntactic Framework for a Low-Resource Language
- arxiv url: http://arxiv.org/abs/2507.21536v1
- Date: Tue, 29 Jul 2025 07:02:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:55.767393
- Title: Modern Uyghur Dependency Treebank (MUDT): An Integrated Morphosyntactic Framework for a Low-Resource Language
- Title(参考訳): Modern Uyghur Dependency Treebank (MUDT):低リソース言語のための統合型モルフォシンタクティックフレームワーク
- Authors: Jiaxin Zuo, Yiquan Wang, Yuan Pan, Xiadiya Yibulayin,
- Abstract要約: 本研究では、既存のツリーバンクの制限を克服するために設計された依存性アノテーションフレームワークを紹介する。
現代のUyghur Dependency Treebank (MUDT)はより正確でセマンティックに透過的な表現を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: To address a critical resource gap in Uyghur Natural Language Processing (NLP), this study introduces a dependency annotation framework designed to overcome the limitations of existing treebanks for the low-resource, agglutinative language. This inventory includes 18 main relations and 26 subtypes, with specific labels such as cop:zero for verbless clauses and instr:case=loc/dat for nuanced instrumental functions. To empirically validate the necessity of this tailored approach, we conducted a cross-standard evaluation using a pre-trained Universal Dependencies parser. The analysis revealed a systematic 47.9% divergence in annotations, pinpointing the inadequacy of universal schemes for handling Uyghur-specific structures. Grounded in nine annotation principles that ensure typological accuracy and semantic transparency, the Modern Uyghur Dependency Treebank (MUDT) provides a more accurate and semantically transparent representation, designed to enable significant improvements in parsing and downstream NLP tasks, and offers a replicable model for other morphologically complex languages.
- Abstract(参考訳): Uyghur Natural Language Processing (NLP) における重要なリソースギャップを解決するため,本研究では,低リソース・集約型言語に対する既存のツリーバンクの限界を克服するための依存性アノテーションフレームワークを提案する。
このインベントリには18の主関係と26のサブタイプが含まれており、動詞のない節の cop:zero や、ニュアンス化されたインストゥルメンタル関数の instr:case=loc/dat といった特定のラベルがある。
本手法の必要性を実証的に検証するために,事前学習したユニバーサル依存パーサを用いて,クロススタンダードな評価を行った。
この分析により、アノテーションの系統的な47.9%のばらつきが明らかとなり、ウイグル語固有の構造を扱う普遍的なスキームの不十分さが指摘された。
タイポロジーの精度とセマンティックな透明性を保証する9つのアノテーション原則に基づいて、Modern Uyghur Dependency Treebank (MUDT)はより正確でセマンティックな透過的な表現を提供する。
関連論文リスト
- Pushing the boundary on Natural Language Inference [49.15148871877941]
自然言語推論(NLI)は、ファクトチェック、質問応答、情報検索における自然言語理解の中心的なタスクである。
その重要性にもかかわらず、現在のNLIシステムは、アーティファクトやバイアス、推論、実世界の適用性を制限した学習に大きく依存している。
この作業は、品質や実世界の適用性を犠牲にすることなく、堅牢なNLIシステムを構築するためのフレームワークを提供する。
論文 参考訳(メタデータ) (2025-04-25T14:20:57Z) - Dependency Parsing with the Structuralized Prompt Template [14.547116901025506]
依存解析は自然言語処理(NLP)の基本課題である
本稿では,テキスト・テキスト・トレーニング・アプローチを用いたエンコーダ・モデルのみに依存する新しい依存性解析手法を提案する。
実験の結果,提案手法は従来のモデルと比較して優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2025-02-24T07:25:10Z) - Specifying Genericity through Inclusiveness and Abstractness Continuous Scales [1.024113475677323]
本稿では,自然言語における名詞句(NP)の詳細なモデリングのための新しいアノテーションフレームワークを提案する。
このフレームワークはシンプルで直感的に設計されており、専門家でないアノテータにもアクセスでき、クラウドソースのタスクに適している。
論文 参考訳(メタデータ) (2024-03-22T15:21:07Z) - Semantic Role Labeling Meets Definition Modeling: Using Natural Language
to Describe Predicate-Argument Structures [104.32063681736349]
本稿では,離散ラベルの代わりに自然言語定義を用いて述語-代名詞構造を記述する手法を提案する。
PropBankスタイルおよびFrameNetスタイル、依存性ベースおよびスパンベースSRLに関する実験と分析は、解釈可能な出力を持つフレキシブルモデルが必ずしも性能を犠牲にしないことを示す。
論文 参考訳(メタデータ) (2022-12-02T11:19:16Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - Learning compositional structures for semantic graph parsing [81.41592892863979]
本稿では、AM依存性解析をニューラル潜在変数モデルで直接トレーニングする方法を示す。
本モデルでは,いくつかの言語現象を独自に把握し,教師あり学習に匹敵する精度を達成している。
論文 参考訳(メタデータ) (2021-06-08T14:20:07Z) - Coordinate Constructions in English Enhanced Universal Dependencies:
Analysis and Computational Modeling [1.9950682531209154]
拡張ユニバーサル依存(UD)における座標構成の表現に対処する。
手動で編集した構文グラフの大規模なデータセットを作成する。
元のデータにおけるいくつかの系統的誤りを識別し、結合の伝播も提案する。
論文 参考訳(メタデータ) (2021-03-16T10:24:27Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。