論文の概要: Coordinate Constructions in English Enhanced Universal Dependencies:
Analysis and Computational Modeling
- arxiv url: http://arxiv.org/abs/2103.08955v1
- Date: Tue, 16 Mar 2021 10:24:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 13:31:47.266948
- Title: Coordinate Constructions in English Enhanced Universal Dependencies:
Analysis and Computational Modeling
- Title(参考訳): 英語拡張ユニバーサル依存におけるコーディネート構成:分析と計算モデル
- Authors: Stefan Gr\"unewald, Prisca Piccirilli, Annemarie Friedrich
- Abstract要約: 拡張ユニバーサル依存(UD)における座標構成の表現に対処する。
手動で編集した構文グラフの大規模なデータセットを作成する。
元のデータにおけるいくつかの系統的誤りを識別し、結合の伝播も提案する。
- 参考スコア(独自算出の注目度): 1.9950682531209154
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we address the representation of coordinate constructions in
Enhanced Universal Dependencies (UD), where relevant dependency links are
propagated from conjunction heads to other conjuncts. English treebanks for
enhanced UD have been created from gold basic dependencies using a heuristic
rule-based converter, which propagates only core arguments. With the aim of
determining which set of links should be propagated from a semantic
perspective, we create a large-scale dataset of manually edited syntax graphs.
We identify several systematic errors in the original data, and propose to also
propagate adjuncts. We observe high inter-annotator agreement for this semantic
annotation task. Using our new manually verified dataset, we perform the first
principled comparison of rule-based and (partially novel) machine-learning
based methods for conjunction propagation for English. We show that learning
propagation rules is more effective than hand-designing heuristic rules. When
using automatic parses, our neural graph-parser based edge predictor
outperforms the currently predominant pipelinesusing a basic-layer tree parser
plus converters.
- Abstract(参考訳): 本稿では,接続ヘッドから他の接続部への依存リンクが伝播する拡張ユニバーサル依存(UD)における座標構成の表現について述べる。
拡張UDのための英語ツリーバンクは、コア引数のみを伝播するヒューリスティックなルールベースのコンバータを使用して、金の基本依存関係から作成されている。
セマンティックの観点からどのリンクを伝播すべきかを決定することを目的として,手作業で編集した構文グラフの大規模データセットを作成する。
そこで本研究では,元のデータから系統的誤りを同定し,随伴関係を広めることを提案する。
我々は,この意味的アノテーションタスクに対して,高いアノテータ間合意を観察する。
新たに手作業で検証したデータセットを用いて、ルールベースと(部分的には新規な)機械学習による英語の共用伝搬の第一原理的比較を行う。
学習伝播ルールは,ハンドデザインのヒューリスティックルールよりも効果的であることを示す。
自動解析を使用する場合、ニューラルネットワークパーザベースのエッジ予測器は、基本層ツリーパーサプラスコンバータを使用して、現在主流となっているパイプラインを上回っています。
関連論文リスト
- Unleashing the Potential of Text-attributed Graphs: Automatic Relation Decomposition via Large Language Models [31.443478448031886]
RoSE (Relation-oriented Semantic Edge-Decomposition) は、生のテキスト属性を分析してグラフ構造を分解する新しいフレームワークである。
我々のフレームワークは、さまざまなデータセットのノード分類性能を大幅に向上させ、ウィスコンシンデータセットでは最大16%の改善を実現した。
論文 参考訳(メタデータ) (2024-05-28T20:54:47Z) - Data Augmentation for Machine Translation via Dependency Subtree
Swapping [0.0]
依存関係のサブツリースワップによるデータ拡張のための汎用フレームワークを提案する。
我々は、ソースとターゲット文の依存関係解析木から対応するサブツリーを抽出し、ビセントスに置換して拡張サンプルを作成する。
我々は,IWSLTテキスト翻訳データセットとHunglish2コーパスを用いて,両方向の4つの言語対に関する資源制約実験を行った。
論文 参考訳(メタデータ) (2023-07-13T19:00:26Z) - Scalable Learning of Latent Language Structure With Logical Offline
Cycle Consistency [71.42261918225773]
概念的には、LOCCOは、トレーニング対象のセマンティクスを使用してラベルなしテキストのアノテーションを生成する、自己学習の一形態と見なすことができる。
追加ボーナスとして、LOCCOによって生成されたアノテーションは、神経テキスト生成モデルをトレーニングするために自明に再利用することができる。
論文 参考訳(メタデータ) (2023-05-31T16:47:20Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - GN-Transformer: Fusing Sequence and Graph Representation for Improved
Code Summarization [0.0]
融合シーケンスとグラフのモダリティに基づいてエンドツーエンドの学習を行う新しい手法であるGN-Transformerを提案する。
提案手法は,2つのコード要約データセットと3つの自動コード要約メトリクスにおいて,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-11-17T02:51:37Z) - A Syntax-Guided Grammatical Error Correction Model with Dependency Tree
Correction [83.14159143179269]
文法的誤り訂正(英: Grammatical Error Correction, GEC)は、文中の文法的誤りを検出し、訂正するタスクである。
本稿では,依存木の構文知識を利用するためのグラフアテンション機構を採用した構文誘導型GECモデル(SG-GEC)を提案する。
我々は、GECタスクの公開ベンチマークでモデルを評価し、競争結果を得る。
論文 参考訳(メタデータ) (2021-11-05T07:07:48Z) - Learning compositional structures for semantic graph parsing [81.41592892863979]
本稿では、AM依存性解析をニューラル潜在変数モデルで直接トレーニングする方法を示す。
本モデルでは,いくつかの言語現象を独自に把握し,教師あり学習に匹敵する精度を達成している。
論文 参考訳(メタデータ) (2021-06-08T14:20:07Z) - GATE: Graph Attention Transformer Encoder for Cross-lingual Relation and
Event Extraction [107.8262586956778]
言語に依存しない文表現を学習するために、普遍的な依存解析を伴うグラフ畳み込みネットワーク(GCN)を導入する。
GCNは、長い範囲の依存関係を持つ単語をモデル化するのに苦労する。
そこで本研究では,構文的距離の異なる単語間の依存関係を学習するための自己認識機構を提案する。
論文 参考訳(メタデータ) (2020-10-06T20:30:35Z) - Transition-based Semantic Dependency Parsing with Pointer Networks [0.34376560669160383]
本稿では,ラベル付き非巡回グラフを容易に生成し,セマンティック依存解析を行う遷移システムを提案する。
BERTから抽出した深層文脈化単語埋め込みによるアプローチを強化する。
結果として得られたシステムは、既存のトランジションベースモデルをすべて上回るだけでなく、SemEval 2015 18の英語データセットでこれまでで最高の完全教師付き精度を達成している。
論文 参考訳(メタデータ) (2020-05-27T13:18:27Z) - Transition-Based Dependency Parsing using Perceptron Learner [34.59241394911966]
Perceptron Learner を用いたトランジッションベースの依存性解析に取り組む。
提案モデルでは,Perceptron Learnerにより関連性の高い機能を付加し,ベースラインのアーク標準よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-01-22T20:58:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。