論文の概要: The Persian Dependency Treebank Made Universal
- arxiv url: http://arxiv.org/abs/2009.10205v2
- Date: Wed, 23 Sep 2020 02:44:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 05:01:03.583088
- Title: The Persian Dependency Treebank Made Universal
- Title(参考訳): ペルシアの依存ツリーバンクがユニバーサルに
- Authors: Mohammad Sadegh Rasooli, Pegah Safari, Amirsaeid Moloodi, Alireza
Nourian
- Abstract要約: このツリーバンクには29107の文がある。
我々のデータは、ペルシアのユニバーサル依存ツリーバンク(Seraji et al., 2016)よりもユニバーサル依存と互換性がある。
我々のデレシカル化されたペルシア語から英語への移動実験は、データに基づいてトレーニングされた解析モデルは、Serajiらより2%精度が高いことを示している。
- 参考スコア(独自算出の注目度): 3.4410212782758047
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We describe an automatic method for converting the Persian Dependency
Treebank (Rasooli et al, 2013) to Universal Dependencies. This treebank
contains 29107 sentences. Our experiments along with manual linguistic analysis
show that our data is more compatible with Universal Dependencies than the
Uppsala Persian Universal Dependency Treebank (Seraji et al., 2016), and is
larger in size and more diverse in vocabulary. Our data brings in a labeled
attachment F-score of 85.2 in supervised parsing. Our delexicalized
Persian-to-English parser transfer experiments show that a parsing model
trained on our data is ~2% absolutely more accurate than that of Seraji et al.
(2016) in terms of labeled attachment score.
- Abstract(参考訳): 本稿では,ペルシャ依存ツリーバンク(Rasooli et al, 2013)をユニバーサル依存に変換する自動手法について述べる。
このツリーバンクには29107の文がある。
我々の実験と手作業による言語分析により,我々のデータはウプサラ・ペルシャ・ユニバーサル・依存性・ツリーバンク(seraji et al., 2016)よりも普遍的な依存関係と互換性があり,語彙がより大きく多様であることが示された。
我々のデータは教師付き解析において85.2のラベル付きアタッチメントf-scoreをもたらす。
ペルシャから英語へのパーサー転送実験では,ラベル付きアタッチメントスコアの点で,私たちのデータでトレーニングされた解析モデルは,セラジなど(2016年)のものよりも絶対的に2%精度が高いことが示された。
関連論文リスト
- MaiBaam: A Multi-Dialectal Bavarian Universal Dependency Treebank [56.810282574817414]
We present the first multi-dialect Bavarian treebank (MaiBaam) based with part-of-speech and syntactic dependency information in Universal Dependencies (UD)。
我々は、近縁なバイエルン語とドイツ語のモルフォシンタクティックな相違を強調し、話者の正書法の豊富な多様性を示す。
私たちのコーパスには15kのトークンが含まれており、3つの国にまたがるバイエルン語を話すすべての地域の方言をカバーしています。
論文 参考訳(メタデータ) (2024-03-15T13:33:10Z) - Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.47832275431858]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-18T11:46:16Z) - Universal Dependency Treebank for Odia Language [0.24466725954625887]
本稿では,形態学的に豊かな低資源のインド語であるオディア(Odia)の公用ツリーバンクについて紹介する。
ツリーバンクには、インド語で最大の並列コーパスコレクションである「サマンタル」から選ばれたオディアに約1082のトークン(100文)が含まれている。
オディア・ツリーバンクの形態解析は機械学習を用いて行った。
論文 参考訳(メタデータ) (2022-05-24T11:19:26Z) - LyS_ACoru\~na at SemEval-2022 Task 10: Repurposing Off-the-Shelf Tools
for Sentiment Analysis as Semantic Dependency Parsing [10.355938901584567]
本稿では,バイファイン・セマンティック・依存性を用いた構造化感情分析の課題に対処する。
i)1つのツリーバンクでのトレーニング、(ii)異なる言語から来るツリーバンクのトレーニングによってセットアップを緩和する。
i) 他の言語で利用可能なツリーバンクを単語レベルで翻訳して、騒々しく、文法的にも、注釈付きのデータを得る。
評価後の段階では、英語のすべてのツリーを単純にマージする言語間モデルも訓練した。
論文 参考訳(メタデータ) (2022-04-27T10:21:28Z) - Informal Persian Universal Dependency Treebank [19.359203472636835]
本稿では,フォーマルペルシャとフォーマルペルシャの音韻学的・形態学的・統語的区別について述べる。
我々は,Universal Dependencyスキームにアノテートされた新しいツリーバンクであるInformal Persian Universal Dependency Treebankを開発した。
論文 参考訳(メタデータ) (2022-01-10T22:33:07Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - Constructing Taxonomies from Pretrained Language Models [52.53846972667636]
本稿では,事前学習した言語モデルを用いて分類木(WordNetなど)を構築する手法を提案する。
我々のアプローチは2つのモジュールから構成されており、1つは親関係を予測し、もう1つはそれらの予測を木に調整する。
我々は、WordNetからサンプリングされたサブツリーでモデルをトレーニングし、重複しないWordNetサブツリーでテストする。
論文 参考訳(メタデータ) (2020-10-24T07:16:21Z) - GATE: Graph Attention Transformer Encoder for Cross-lingual Relation and
Event Extraction [107.8262586956778]
言語に依存しない文表現を学習するために、普遍的な依存解析を伴うグラフ畳み込みネットワーク(GCN)を導入する。
GCNは、長い範囲の依存関係を持つ単語をモデル化するのに苦労する。
そこで本研究では,構文的距離の異なる単語間の依存関係を学習するための自己認識機構を提案する。
論文 参考訳(メタデータ) (2020-10-06T20:30:35Z) - I3rab: A New Arabic Dependency Treebank Based on Arabic Grammatical
Theory [0.0]
本稿では,従来のアラビア語文法理論とアラビア語の特徴に基づいて,新たなアラビア語依存ツリーバンクを構築することを目的とする。
提案されたアラビア語依存ツリーバンクはI3rabと呼ばれ、2つの主要な概念で既存のアラビア語依存ツリーバンクとは対照的である。
論文 参考訳(メタデータ) (2020-07-11T13:34:44Z) - Towards Instance-Level Parser Selection for Cross-Lingual Transfer of
Dependency Parsers [59.345145623931636]
我々は、インスタンスレベルの選択(ILPS)という、新しい言語間移動パラダイムを論じる。
本稿では,デレキシライズドトランスファーの枠組みにおけるインスタンスレベルの選択に着目した概念実証研究を提案する。
論文 参考訳(メタデータ) (2020-04-16T13:18:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。