論文の概要: Substructure Distribution Projection for Zero-Shot Cross-Lingual
Dependency Parsing
- arxiv url: http://arxiv.org/abs/2110.08538v1
- Date: Sat, 16 Oct 2021 10:12:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-21 14:16:24.140189
- Title: Substructure Distribution Projection for Zero-Shot Cross-Lingual
Dependency Parsing
- Title(参考訳): ゼロショット相互依存解析のための部分構造分布予測
- Authors: Haoyue Shi, Kevin Gimpel, Karen Livescu
- Abstract要約: SubDPは、サブ構造分布を別々に投影することで、あるドメインの構造を別のドメインに分割する手法である。
我々は,0ショットの言語間依存関係解析におけるSubDPの評価を行い,依存関係弧をサブストラクチャとする。
- 参考スコア(独自算出の注目度): 55.69800855705232
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present substructure distribution projection (SubDP), a technique that
projects a distribution over structures in one domain to another, by projecting
substructure distributions separately. Models for the target domains can be
then trained, using the projected distributions as soft silver labels. We
evaluate SubDP on zero-shot cross-lingual dependency parsing, taking dependency
arcs as substructures: we project the predicted dependency arc distributions in
the source language(s) to target language(s), and train a target language
parser to fit the resulting distributions. When an English treebank is the only
annotation that involves human effort, SubDP achieves better unlabeled
attachment score than all prior work on the Universal Dependencies v2.2 (Nivre
et al., 2020) test set across eight diverse target languages, as well as the
best labeled attachment score on six out of eight languages. In addition, SubDP
improves zero-shot cross-lingual dependency parsing with very few (e.g., 50)
supervised bitext pairs, across a broader range of target languages.
- Abstract(参考訳): 本稿では,サブ構造分布を別々に投影することで,サブ構造分布を別の領域に投影する手法であるサブ構造分布予測(SubDP)を提案する。
ターゲットドメインのモデルは、投影された分布をソフトシルバーラベルとしてトレーニングすることができる。
我々は,SubDPをゼロショットの言語間依存関係解析,依存関係弧をサブ構造として評価し,ソース言語(s)の依存性弧分布をターゲット言語(s)に投影し,対象言語パーサをトレーニングして結果の分布に適合させる。
人間の努力を伴う唯一のアノテーションであるイングリッシュ・ツリーバンクの場合、subdpは8つの異なるターゲット言語にまたがるユニバーサル・依存関係 v2.2 (nivre et al., 2020) テストのすべての以前の作業よりもラベル付きアタッチメントスコアが向上し、また8言語中6言語で最高のラベル付きアタッチメントスコアが達成される。
さらに、SubDPはゼロショットの言語間の依存関係解析を、より広範囲のターゲット言語にまたがるほとんど(例:50)の教師付きビットクストペアで改善している。
関連論文リスト
- Cross-lingual Back-Parsing: Utterance Synthesis from Meaning Representation for Zero-Resource Semantic Parsing [6.074150063191985]
Cross-Lingual Back-Parsing(クロスリンガル・バック・パーシング)は、セマンティック・パーシングのためのクロスリンガル・トランスファーを強化するために設計された新しいデータ拡張手法である。
提案手法は,ゼロリソース設定に挑戦する上で,言語間データ拡張を効果的に行う。
論文 参考訳(メタデータ) (2024-10-01T08:53:38Z) - Multilingual Word Embeddings for Low-Resource Languages using Anchors
and a Chain of Related Languages [54.832599498774464]
我々は,言語連鎖に基づく新しいアプローチにより,多言語単語埋め込み(MWE)を構築することを提案する。
リソースの豊富なソースから始めて、ターゲットに到達するまで各言語をチェーンに順次追加することで、MWEを一度に1つの言語で構築します。
本手法は,4つの低リソース(5Mトークン)と4つの中程度の低リソース(50M)ターゲット言語を含む4つの言語ファミリーを対象としたバイリンガルレキシコン誘導法について検討した。
論文 参考訳(メタデータ) (2023-11-21T09:59:29Z) - CROP: Zero-shot Cross-lingual Named Entity Recognition with Multilingual
Labeled Sequence Translation [113.99145386490639]
言語間NERは、整列した言語間表現や機械翻訳結果を通じて、言語間で知識を伝達することができる。
ゼロショット言語間NERを実現するために,クロスランガル・エンティティ・プロジェクション・フレームワーク(CROP)を提案する。
多言語ラベル付きシーケンス翻訳モデルを用いて、タグ付けされたシーケンスをターゲット言語に投影し、ターゲットの原文にラベル付けする。
論文 参考訳(メタデータ) (2022-10-13T13:32:36Z) - DT-grams: Structured Dependency Grammar Stylometry for Cross-Language
Authorship Attribution [0.20305676256390934]
本稿では,依存性グラフと音声タグの普遍的部分に基づく著者分析のための新しい言語非依存機能DT-gramを提案する。
我々は、バイリンガル著者の翻訳されていないデータセットに対して、クロスランゲージなオーサリング属性を実行することでDT-gramを評価する。
論文 参考訳(メタデータ) (2021-06-10T11:50:07Z) - X2Parser: Cross-Lingual and Cross-Domain Framework for Task-Oriented
Compositional Semantic Parsing [51.81533991497547]
タスク指向コンポジションセマンティックパーシング(TCSP)は複雑なネストされたユーザクエリを処理する。
本報告では,TCSPの変換可能なクロスランガルとクロスドメインを比較した。
本稿では,フラット化意図とスロット表現を別々に予測し,両方の予測タスクをシーケンスラベリング問題にキャストすることを提案する。
論文 参考訳(メタデータ) (2021-06-07T16:40:05Z) - A Practical Chinese Dependency Parser Based on A Large-scale Dataset [21.359679124869402]
依存性解析は長年にわたる自然言語処理タスクであり、アウトプットはさまざまな下流タスクに不可欠である。
近年、ニューラルネットワークベースの(NNベースの)依存性は大きな進歩を遂げ、最先端の結果を得た。
NNベースのアプローチには大量のラベル付きトレーニングデータが必要です。
論文 参考訳(メタデータ) (2020-09-02T08:41:46Z) - Inducing Language-Agnostic Multilingual Representations [61.97381112847459]
言語間の表現は、世界中のほとんどの言語でNLP技術が利用可能になる可能性がある。
i) 対象言語のベクトル空間をピボットソース言語に再配置すること、(ii) 言語固有の手段と分散を取り除くこと、(ii) 副産物としての埋め込みの識別性を向上すること、(iii) 形態的制約や文の並べ替えを除去することによって言語間の入力類似性を高めること、の3つのアプローチを検討する。
論文 参考訳(メタデータ) (2020-08-20T17:58:56Z) - Towards Instance-Level Parser Selection for Cross-Lingual Transfer of
Dependency Parsers [59.345145623931636]
我々は、インスタンスレベルの選択(ILPS)という、新しい言語間移動パラダイムを論じる。
本稿では,デレキシライズドトランスファーの枠組みにおけるインスタンスレベルの選択に着目した概念実証研究を提案する。
論文 参考訳(メタデータ) (2020-04-16T13:18:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。