Fugu-MT 論文翻訳(概要): Urdu Dependency Parsing and Treebank Development: A Syntactic and Morphological Perspective

論文の概要: Urdu Dependency Parsing and Treebank Development: A Syntactic and Morphological Perspective

arxiv url: http://arxiv.org/abs/2406.09549v2
Date: Wed, 02 Oct 2024 11:44:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-02 13:39:13.201315
Title: Urdu Dependency Parsing and Treebank Development: A Syntactic and Morphological Perspective
Title（参考訳）: Urdu Dependency ParsingとTreebank開発 : 統語的・形態論的視点
Authors: Nudrat Habib,
Abstract要約: 依存関係解析を用いて、ウルドゥー語でニュース記事を分析する。最良ラベル付き精度(LA)は70%,未ラベル付きアタッチメントスコア(UAS)は84%であった。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Parsing is the process of analyzing a sentence's syntactic structure by breaking it down into its grammatical components. and is critical for various linguistic applications. Urdu is a low-resource, free word-order language and exhibits complex morphology. Literature suggests that dependency parsing is well-suited for such languages. Our approach begins with a basic feature model encompassing word location, head word identification, and dependency relations, followed by a more advanced model integrating part-of-speech (POS) tags and morphological attributes (e.g., suffixes, gender). We manually annotated a corpus of news articles of varying complexity. Using Maltparser and the NivreEager algorithm, we achieved a best-labeled accuracy (LA) of 70% and an unlabeled attachment score (UAS) of 84%, demonstrating the feasibility of dependency parsing for Urdu.
Abstract（参考訳）: パーシング(英: Parsing)とは、文を文法的な構成要素に分解することで、文の構文構造を分析する過程である。様々な言語応用に欠かせないものですウルドゥー語は低リソースで自由な語順言語であり、複雑な形態を示す。文献によると、依存関係解析はそのような言語に適している。提案手法は, 単語の位置, 単語の識別, 依存関係を含む基本的特徴モデルから始まり, 音声(POS) タグと形態的属性(例えば, 接尾辞, 性別)を組み込んだ, より高度なモデルである。我々は様々な複雑さのニュース記事のコーパスを手動で注釈付けした。 Maltparser と NivreEager アルゴリズムを用いて,最高のラベル付き精度 (LA) を70%,未ラベル付きアタッチメントスコア (UAS) を84%達成し,Urdu の依存性解析の可能性を示した。

関連論文リスト

Tokens with Meaning: A Hybrid Tokenization Approach for NLP [0.2826977330147589]
自然言語処理(NLP)におけるトークン化の役割規則に基づく形態素解析と統計的サブワードセグメンテーションを組み合わせたハイブリッドトークン化フレームワークを提案する。本手法は, 音韻正規化, ルートアフィックス, および形態素保存と語彙効率のバランスをとる新しいアルゴリズムを用いる。
論文参考訳（メタデータ） (2025-08-19T22:17:42Z)
Integrating Supertag Features into Neural Discontinuous Constituent Parsing [0.0]
伝統的な選挙区の見解では、構成要素は隣接した単語で構成されており、ドイツ語のような言語で一般的である。トランジションベースの構文解析は、大きな注釈付きコーパス上で教師あり学習を用いて生のテキストを入力した木を生成する。
論文参考訳（メタデータ） (2024-10-11T12:28:26Z)
CSSL: Contrastive Self-Supervised Learning for Dependency Parsing on Relatively Free Word Ordered and Morphologically Rich Low Resource Languages [10.441585970299547]
本稿では,単語順の変動に頑健なモデルを実現するための,対照的な自己教師型学習手法を提案する。提案手法は、7つの比較的自由な単語順序言語における3.03/2.95点の平均的な増加を示す。
論文参考訳（メタデータ） (2024-10-09T14:38:49Z)
Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.47832275431858]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文参考訳（メタデータ） (2024-02-18T11:46:16Z)
Multilingual Extraction and Categorization of Lexical Collocations with Graph-aware Transformers [86.64972552583941]
我々は,グラフ対応トランスフォーマアーキテクチャにより拡張されたBERTに基づくシーケンスタグ付けモデルを提案し,コンテキストにおけるコロケーション認識の課題について評価した。以上の結果から, モデルアーキテクチャにおける構文的依存関係を明示的に符号化することは有用であり, 英語, スペイン語, フランス語におけるコロケーションのタイプ化の差異について考察する。
論文参考訳（メタデータ） (2022-05-23T16:47:37Z)
On The Ingredients of an Effective Zero-shot Semantic Parser [95.01623036661468]
我々は、標準発話とプログラムの訓練例を文法から言い換えて、ゼロショット学習を分析する。改良された文法,より強力なパラフレーズ,効率的な学習手法を用いて,これらのギャップを埋めることを提案する。我々のモデルはラベル付きデータゼロの2つの意味解析ベンチマーク(Scholar, Geo)で高い性能を達成する。
論文参考訳（メタデータ） (2021-10-15T21:41:16Z)
Constrained Language Models Yield Few-Shot Semantic Parsers [73.50960967598654]
我々は,事前学習された大規模言語モデルの利用を,少ない意味論として検討する。意味構文解析の目標は、自然言語入力によって構造化された意味表現を生成することである。言語モデルを用いて、入力を英語に似た制御されたサブ言語にパラフレーズし、対象の意味表現に自動的にマッピングする。
論文参考訳（メタデータ） (2021-04-18T08:13:06Z)
Grounded Compositional Outputs for Adaptive Language Modeling [59.02706635250856]
言語モデルの語彙$-$典型的にはトレーニング前に選択され、後で永久に固定される$-$は、そのサイズに影響します。言語モデルのための完全合成出力埋め込み層を提案する。我々の知る限り、この結果はトレーニング語彙に依存しないサイズを持つ最初の単語レベル言語モデルである。
論文参考訳（メタデータ） (2020-09-24T07:21:14Z)
A Survey of Syntactic-Semantic Parsing Based on Constituent and Dependency Structures [14.714725860010724]
我々は、構文解析の最も一般的な2つの形式、すなわち構成解析と依存性解析に焦点を当てている。本稿では、構成解析と依存性解析の代表モデルと、リッチセマンティクスによる依存性解析について概説する。
論文参考訳（メタデータ） (2020-06-19T10:21:17Z)
Is POS Tagging Necessary or Even Helpful for Neural Dependency Parsing? [22.93722845643562]
Stackのジョイントフレームワークを使用する場合,POSタグ付けによって解析性能が大幅に向上することを示す。解析木よりもPOSタグをアノテートする方がずっと安いことを考えると,大規模な異種POSタグデータの利用も検討する。
論文参考訳（メタデータ） (2020-03-06T13:47:30Z)
A Hybrid Approach to Dependency Parsing: Combining Rules and Morphology with Deep Learning [0.0]
本稿では,特に訓練データ量に制限のある言語に対して,依存関係解析の2つのアプローチを提案する。第1のアプローチは、最先端のディープラーニングとルールベースのアプローチを組み合わせ、第2のアプローチは、形態情報をネットワークに組み込む。提案手法はトルコ語向けに開発されたが、他の言語にも適用可能である。
論文参考訳（メタデータ） (2020-02-24T08:34:33Z)
A Simple Joint Model for Improved Contextual Neural Lemmatization [60.802451210656805]
本稿では,20言語で最先端の成果を得られる,単純結合型ニューラルモデルを提案する。本論文では,トレーニングと復号化に加えて,本モデルについて述べる。
論文参考訳（メタデータ） (2019-04-04T02:03:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。