論文の概要: Hexatagging: Projective Dependency Parsing as Tagging
- arxiv url: http://arxiv.org/abs/2306.05477v1
- Date: Thu, 8 Jun 2023 18:02:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-12 15:54:51.987303
- Title: Hexatagging: Projective Dependency Parsing as Tagging
- Title(参考訳): Hexatagging: タグとして計画的な依存性解析
- Authors: Afra Amini, Tianyu Liu, Ryan Cotterell
- Abstract要約: 文中の単語を有限個の可能なタグの要素でタグ付けすることで、依存関係木を構成する新しい依存性であるヘキサトガーを導入する。
私たちのアプローチは、トレーニング時に完全に並列化可能です。すなわち、依存関係のパースを構築するのに必要な構造構築アクションは、互いに並列に予測できます。
我々はPenn Treebankテストセット上で96.4 LASと97.4 UASの最先端性能を実現する。
- 参考スコア(独自算出の注目度): 63.5392760743851
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a novel dependency parser, the hexatagger, that constructs
dependency trees by tagging the words in a sentence with elements from a finite
set of possible tags. In contrast to many approaches to dependency parsing, our
approach is fully parallelizable at training time, i.e., the structure-building
actions needed to build a dependency parse can be predicted in parallel to each
other. Additionally, exact decoding is linear in time and space complexity.
Furthermore, we derive a probabilistic dependency parser that predicts hexatags
using no more than a linear model with features from a pretrained language
model, i.e., we forsake a bespoke architecture explicitly designed for the
task. Despite the generality and simplicity of our approach, we achieve
state-of-the-art performance of 96.4 LAS and 97.4 UAS on the Penn Treebank test
set. Additionally, our parser's linear time complexity and parallelism
significantly improve computational efficiency, with a roughly 10-times
speed-up over previous state-of-the-art models during decoding.
- Abstract(参考訳): 文中の単語を有限個の可能なタグの要素でタグ付けすることで、依存関係木を構成する新しい依存性解析器であるヘキサットガーを導入する。
依存性解析に対する多くのアプローチとは対照的に、このアプローチはトレーニング時に完全に並列化可能であり、依存関係パースを構築するのに必要な構造構築アクションは互いに並列に予測できる。
さらに、正確な復号化は時間と空間の複雑さにおいて線形である。
さらに,事前訓練された言語モデルの特徴を持つ線形モデル,すなわちタスク用に明示的に設計されたベスポークアーキテクチャを用いて,ヘキサタグの予測を行う確率的依存性解析器を導出する。
アプローチの汎用性と単純さにもかかわらず、Penn Treebankテストセット上で96.4 LASと97.4 UASの最先端性能を実現する。
さらに、線形時間複雑性と並列性により計算効率が大幅に向上し、復号時の従来の最先端モデルよりも約10倍高速になった。
関連論文リスト
- Linear-Time Modeling of Linguistic Structure: An Order-Theoretic
Perspective [97.57162770792182]
文字列内のトークンのペア間の関係をモデル化するタスクは、自然言語を理解する上で不可欠な部分である。
これらの徹底的な比較は避けられ、さらに、トークン間の関係を文字列上の部分順序としてキャストすることで、複雑さを線形に減らすことができる。
提案手法は,文字列中の各トークンの実際の数を並列に予測し,それに従ってトークンをソートすることで,文字列内のトークンの総順序を決定する。
論文 参考訳(メタデータ) (2023-05-24T11:47:35Z) - Integrating Dependency Tree Into Self-attention for Sentence
Representation [9.676884071651205]
本稿では,自己認識機構と協調して機能するリレーショナルアテンション機構を適用したDependency-Transformerを提案する。
スコアベースの手法により、Transformerの並列化に影響を与えずに構文情報をインジェクトすることに成功した。
文表現のための4つのタスクにおいて、我々のモデルは最先端の手法よりも優れているか、あるいは同等である。
論文 参考訳(メタデータ) (2022-03-11T13:44:41Z) - Learning compositional structures for semantic graph parsing [81.41592892863979]
本稿では、AM依存性解析をニューラル潜在変数モデルで直接トレーニングする方法を示す。
本モデルでは,いくつかの言語現象を独自に把握し,教師あり学習に匹敵する精度を達成している。
論文 参考訳(メタデータ) (2021-06-08T14:20:07Z) - Rethinking Learnable Tree Filter for Generic Feature Transform [71.77463476808585]
Learnable Tree Filterはセマンティックセグメンテーションのためのモデル構造保存関係に対する顕著なアプローチを示す。
幾何学的制約を緩和するために,マルコフ確率場として再構成して解析を行い,学習可能な不定項を導入する。
セマンティックセグメンテーションでは、ベルとホイッスルなしでCityscapesベンチマークでトップパフォーマンス(82.1% mIoU)を達成しています。
論文 参考訳(メタデータ) (2020-12-07T07:16:47Z) - Bracketing Encodings for 2-Planar Dependency Parsing [14.653008985229617]
長さ n の文上の任意の 2-平面依存木を n 個のラベルの列として表現できるブラケットベースの符号化法を提案する。
木バンクの依存構文構造の大部分に存在する2-プランナリティのよく知られた性質を考慮に入れた。
論文 参考訳(メタデータ) (2020-11-01T18:53:32Z) - Please Mind the Root: Decoding Arborescences for Dependency Parsing [67.71280539312536]
我々はUniversal Dependency Treebankから多くの言語における最先端の出力を分析する。
最悪の制約違反率は24%です。
論文 参考訳(メタデータ) (2020-10-06T08:31:14Z) - Multitask Pointer Network for Multi-Representational Parsing [0.34376560669160383]
本稿では,1つのモデルをトレーニングすることにより,任意の入力文を構成木と依存木の両方で効率的に解析できる遷移ベースアプローチを提案する。
我々は2つのタスク固有のデコーダと共通エンコーダを備えたポインタネットワークアーキテクチャを開発し、それらを共同で訓練するための学習戦略に従う。
論文 参考訳(メタデータ) (2020-09-21T10:04:07Z) - Span-based Semantic Parsing for Compositional Generalization [53.24255235340056]
SpanBasedSPは入力発話上のスパンツリーを予測し、部分的なプログラムが入力内のスパンをどのように構成するかを明示的に符号化する。
GeoQuery、SCAN、CLOSUREでは、SpanBasedSPはランダムスプリットの強いseq2seqベースラインと似ているが、構成一般化を必要とするスプリットのベースラインに比べて劇的に性能が向上する。
論文 参考訳(メタデータ) (2020-09-13T16:42:18Z) - Parsing as Pretraining [13.03764728768944]
まず、コンストラクタと依存性解析をシーケンスタグとしてキャストする。
次に、単一のフィードフォワード層を使用して、ワードベクトルを線形化された木をエンコードするラベルに直接マッピングする。
論文 参考訳(メタデータ) (2020-02-05T08:43:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。