論文の概要: The DCU-EPFL Enhanced Dependency Parser at the IWPT 2021 Shared Task
- arxiv url: http://arxiv.org/abs/2107.01982v1
- Date: Mon, 5 Jul 2021 12:42:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-06 18:37:15.183463
- Title: The DCU-EPFL Enhanced Dependency Parser at the IWPT 2021 Shared Task
- Title(参考訳): IWPT 2021共有タスクにおけるDCU-EPFL拡張依存性パーザ
- Authors: James Barry, Alireza Mohammadshahi, Joachim Wagner, Jennifer Foster,
James Henderson
- Abstract要約: We describe the multitask-EPFL submit to the IWPT 2021 Shared Task on Parsing into Enhanced Universal Dependencies。
このタスクは、セマンティック構造を表現するためにより円滑に設計された基本依存性ツリーの拡張である拡張グラフのパースを含む。
評価は17言語29のツリーバンクで行われ、参加者は生文字列から始まる各言語からデータを解析する必要がある。
- 参考スコア(独自算出の注目度): 19.98425994656106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We describe the DCU-EPFL submission to the IWPT 2021 Shared Task on Parsing
into Enhanced Universal Dependencies. The task involves parsing Enhanced UD
graphs, which are an extension of the basic dependency trees designed to be
more facilitative towards representing semantic structure. Evaluation is
carried out on 29 treebanks in 17 languages and participants are required to
parse the data from each language starting from raw strings. Our approach uses
the Stanza pipeline to preprocess the text files, XLMRoBERTa to obtain
contextualized token representations, and an edge-scoring and labeling model to
predict the enhanced graph. Finally, we run a post-processing script to ensure
all of our outputs are valid Enhanced UD graphs. Our system places 6th out of 9
participants with a coarse Enhanced Labeled Attachment Score (ELAS) of 83.57.
We carry out additional post-deadline experiments which include using Trankit
for pre-processing, XLM-RoBERTa-LARGE, treebank concatenation, and multitask
learning between a basic and an enhanced dependency parser. All of these
modifications improve our initial score and our final system has a coarse ELAS
of 88.04.
- Abstract(参考訳): 本稿では,DCU-EPFL による IWPT 2021 Shared Task on Parsing into Enhanced Universal Dependencies について述べる。
このタスクは、セマンティック構造を表現するためにより円滑に設計された基本依存性ツリーの拡張である強化UDグラフのパースを含む。
評価は17言語29のツリーバンクで行われ、参加者は生文字列から始まる各言語からデータを解析する必要がある。
提案手法では,テキストファイルの事前処理にStanzaパイプライン,コンテキスト化トークン表現にXLMRoBERTa,拡張グラフの予測にエッジスコアとラベルモデルを用いる。
最後に、処理後スクリプトを実行して、すべての出力が有効な拡張udグラフであることを保証します。
本システムでは,参加者9名中6名にラベル付添付スコア(elas)83.57。
予備処理にTrankit, XLM-RoBERTa-LARGE, treebank concatenation, 基本と拡張された依存性パーサ間のマルチタスク学習など,追加の処理後実験を行う。
これらの修正によって最初のスコアが向上し、最終システムは88.04の粗いELASを持つ。
関連論文リスト
- A Tale of Two Languages: Large-Vocabulary Continuous Sign Language Recognition from Spoken Language Supervision [74.972172804514]
我々は,署名された言語と音声のテキスト間の共同埋め込み空間において,署名シーケンスと出力を抽出できるマルチタスクトランスフォーマーモデルCSLR2を導入する。
新しいデータセットアノテーションは、6時間のテストビデオに対して、連続的なサインレベルアノテーションを提供する。
私たちのモデルは、両方のタスクにおいて、過去の技術状況よりも大幅に優れています。
論文 参考訳(メタデータ) (2024-05-16T17:19:06Z) - Leveraging Linguistically Enhanced Embeddings for Open Information Extraction [0.0]
オープン情報抽出(OIE)は自然言語処理における構造化予測タスクである
私たちは、OIE用のSeq2Seq PLMで言語機能を利用する最初の人です。
私たちの作業は、任意のニューラルなOIEアーキテクチャに対して、PLMと言語機能の両方から重要なパフォーマンス向上を提供することができます。
論文 参考訳(メタデータ) (2024-03-20T18:18:48Z) - Substructure Distribution Projection for Zero-Shot Cross-Lingual
Dependency Parsing [55.69800855705232]
SubDPは、サブ構造分布を別々に投影することで、あるドメインの構造を別のドメインに分割する手法である。
我々は,0ショットの言語間依存関係解析におけるSubDPの評価を行い,依存関係弧をサブストラクチャとする。
論文 参考訳(メタデータ) (2021-10-16T10:12:28Z) - TGIF: Tree-Graph Integrated-Format Parser for Enhanced UD with Two-Stage
Generic- to Individual-Language Finetuning [18.71574180551552]
IWPT 2021共有タスクへのコントリビューションについて述べる。
我々のメインシステムコンポーネントはハイブリッドツリーグラフであり、スプレッドツリーに存在しないグラフエッジを付加した拡張グラフに対して、スプレッドツリーの予測を統合する。
論文 参考訳(メタデータ) (2021-07-14T18:00:08Z) - Coordinate Constructions in English Enhanced Universal Dependencies:
Analysis and Computational Modeling [1.9950682531209154]
拡張ユニバーサル依存(UD)における座標構成の表現に対処する。
手動で編集した構文グラフの大規模なデータセットを作成する。
元のデータにおけるいくつかの系統的誤りを識別し、結合の伝播も提案する。
論文 参考訳(メタデータ) (2021-03-16T10:24:27Z) - Constructing Taxonomies from Pretrained Language Models [52.53846972667636]
本稿では,事前学習した言語モデルを用いて分類木(WordNetなど)を構築する手法を提案する。
我々のアプローチは2つのモジュールから構成されており、1つは親関係を予測し、もう1つはそれらの予測を木に調整する。
我々は、WordNetからサンプリングされたサブツリーでモデルをトレーニングし、重複しないWordNetサブツリーでテストする。
論文 参考訳(メタデータ) (2020-10-24T07:16:21Z) - Automatic Extraction of Rules Governing Morphological Agreement [103.78033184221373]
原文から第一パス文法仕様を抽出する自動フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
我々のフレームワークはUniversal Dependenciesプロジェクトに含まれるすべての言語に適用され、有望な結果が得られます。
論文 参考訳(メタデータ) (2020-10-02T18:31:45Z) - The ADAPT Enhanced Dependency Parser at the IWPT 2020 Shared Task [12.226699055857182]
本稿では,2020 IWPT共有タスクのためのADAPTシステムについて述べる。
UDPipe と UDPipe-Future を用いたパイプラインアプローチを実装し,初期アノテーションのレベルを提供する。
ほとんどの言語では、強化された依存関係を解析するタスクにセマンティックな依存関係をうまく適用することができる。
論文 参考訳(メタデータ) (2020-09-03T14:43:04Z) - K{\o}psala: Transition-Based Graph Parsing via Efficient Training and
Effective Encoding [13.490365811869719]
We present Kopsala, the Copenhagen-Uppsala system for the Enhanced Universal Dependencies Shared Task at IWPT 2020。
当社のシステムは,拡張解析以外のすべてを対象として,既製のモデルで構成されたパイプラインであり,後者はCheなどから適応した遷移グラフである。
平均的なELASによると、統一パイプラインはRepresentation ParsingとEnhanced Universal Dependenciesの両方に有効であることを示す。
論文 参考訳(メタデータ) (2020-05-25T13:17:09Z) - pyBART: Evidence-based Syntactic Transformations for IE [52.93947844555369]
pyBARTは、英語のUD木を拡張UDグラフに変換するためのオープンソースのPythonライブラリである。
パターンに基づく関係抽出のシナリオで評価すると、より少ないパターンを必要としながら、より高精細なUDよりも高い抽出スコアが得られる。
論文 参考訳(メタデータ) (2020-05-04T07:38:34Z) - Towards Instance-Level Parser Selection for Cross-Lingual Transfer of
Dependency Parsers [59.345145623931636]
我々は、インスタンスレベルの選択(ILPS)という、新しい言語間移動パラダイムを論じる。
本稿では,デレキシライズドトランスファーの枠組みにおけるインスタンスレベルの選択に着目した概念実証研究を提案する。
論文 参考訳(メタデータ) (2020-04-16T13:18:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。