論文の概要: Bracketing Encodings for 2-Planar Dependency Parsing
- arxiv url: http://arxiv.org/abs/2011.00596v2
- Date: Mon, 22 Mar 2021 20:53:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 23:31:02.617095
- Title: Bracketing Encodings for 2-Planar Dependency Parsing
- Title(参考訳): 2-Planar Dependency Parsingのためのブラケット符号化
- Authors: Michalina Strzyz, David Vilares and Carlos G\'omez-Rodr\'iguez
- Abstract要約: 長さ n の文上の任意の 2-平面依存木を n 個のラベルの列として表現できるブラケットベースの符号化法を提案する。
木バンクの依存構文構造の大部分に存在する2-プランナリティのよく知られた性質を考慮に入れた。
- 参考スコア(独自算出の注目度): 14.653008985229617
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a bracketing-based encoding that can be used to represent any
2-planar dependency tree over a sentence of length n as a sequence of n labels,
hence providing almost total coverage of crossing arcs in sequence labeling
parsing. First, we show that existing bracketing encodings for parsing as
labeling can only handle a very mild extension of projective trees. Second, we
overcome this limitation by taking into account the well-known property of
2-planarity, which is present in the vast majority of dependency syntactic
structures in treebanks, i.e., the arcs of a dependency tree can be split into
two planes such that arcs in a given plane do not cross. We take advantage of
this property to design a method that balances the brackets and that encodes
the arcs belonging to each of those planes, allowing for almost unrestricted
non-projectivity (round 99.9% coverage) in sequence labeling parsing. The
experiments show that our linearizations improve over the accuracy of the
original bracketing encoding in highly non-projective treebanks (on average by
0.4 LAS), while achieving a similar speed. Also, they are especially suitable
when PoS tags are not used as input parameters to the models.
- Abstract(参考訳): 長さnの文の任意の2平面依存木をn個のラベルの列として表現できるブラケットベースの符号化法を提案する。
まず,既存のブラケット符号化をラベルとして解析することは,射影木の非常に軽度な拡張しか処理できないことを示す。
第二に、木々バンクの依存構文構造の大部分に存在する2-平面性のよく知られた性質、すなわち、依存木の弧を与えられた平面の弧が交差しないような2つの平面に分割することで、この制限を克服する。
この特性を利用してブラケットのバランスを保ち、それぞれの平面に属する弧を符号化し、シーケンスラベリング解析におけるほとんど制限のない非射影性(約99.9%のカバレッジ)を可能にする。
実験により,本手法の線形化は,非常に非射影的な木々バンク(平均0.4las)におけるブラケットエンコーディングの精度を向上し,同様の速度が得られることを示した。
また、PoSタグをモデルへの入力パラメータとして使用しない場合には特に適している。
関連論文リスト
- Dependency Graph Parsing as Sequence Labeling [18.079016557290338]
我々は、グラフ解析をタグ付けタスクとしてキャストするのに使用できる、非有界および有界な線形化の範囲を定義する。
セマンティック依存関係とUD解析の強化に関する実験結果から, シーケンスラベル依存グラフは, 符号化の優れた選択により, 高い効率性と, 最先端の精度を両立させることがわかった。
論文 参考訳(メタデータ) (2024-10-23T15:37:02Z) - PosFormer: Recognizing Complex Handwritten Mathematical Expression with Position Forest Transformer [51.260384040953326]
手書き数学的表現認識(HMER)は、人間と機械の相互作用シナリオに広く応用されている。
本稿では,HMERのための位置フォレスト変換器(PosFormer)を提案する。
PosFormerは、最先端のメソッドである2.03%/1.22%/2、1.83%、および4.62%を一貫して上回っている。
論文 参考訳(メタデータ) (2024-07-10T15:42:58Z) - 4 and 7-bit Labeling for Projective and Non-Projective Dependency Trees [7.466159270333272]
我々は,任意の射影依存木を4ビットラベルの列として表現できるシーケンスラベリングとして解析用エンコーディングを導入する。
木バンクの多種多様化の結果から,従来で最も性能のよいシーケンスラベリング符号化よりも精度の高い7ビット符号化が得られた。
論文 参考訳(メタデータ) (2023-10-22T14:43:53Z) - Structured Dialogue Discourse Parsing [79.37200787463917]
談話解析は、多人数会話の内部構造を明らかにすることを目的としている。
本稿では,符号化と復号化という2つの観点から,従来の作業を改善する原理的手法を提案する。
実験の結果,本手法は,STACでは2.3,Mollweniでは1.5,先行モデルでは2.3を上回った。
論文 参考訳(メタデータ) (2023-06-26T22:51:01Z) - Hexatagging: Projective Dependency Parsing as Tagging [63.5392760743851]
文中の単語を有限個の可能なタグの要素でタグ付けすることで、依存関係木を構成する新しい依存性であるヘキサトガーを導入する。
私たちのアプローチは、トレーニング時に完全に並列化可能です。すなわち、依存関係のパースを構築するのに必要な構造構築アクションは、互いに並列に予測できます。
我々はPenn Treebankテストセット上で96.4 LASと97.4 UASの最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-08T18:02:07Z) - Linear-Time Modeling of Linguistic Structure: An Order-Theoretic
Perspective [97.57162770792182]
文字列内のトークンのペア間の関係をモデル化するタスクは、自然言語を理解する上で不可欠な部分である。
これらの徹底的な比較は避けられ、さらに、トークン間の関係を文字列上の部分順序としてキャストすることで、複雑さを線形に減らすことができる。
提案手法は,文字列中の各トークンの実際の数を並列に予測し,それに従ってトークンをソートすることで,文字列内のトークンの総順序を決定する。
論文 参考訳(メタデータ) (2023-05-24T11:47:35Z) - Integrating Dependency Tree Into Self-attention for Sentence
Representation [9.676884071651205]
本稿では,自己認識機構と協調して機能するリレーショナルアテンション機構を適用したDependency-Transformerを提案する。
スコアベースの手法により、Transformerの並列化に影響を与えずに構文情報をインジェクトすることに成功した。
文表現のための4つのタスクにおいて、我々のモデルは最先端の手法よりも優れているか、あるいは同等である。
論文 参考訳(メタデータ) (2022-03-11T13:44:41Z) - Please Mind the Root: Decoding Arborescences for Dependency Parsing [67.71280539312536]
我々はUniversal Dependency Treebankから多くの言語における最先端の出力を分析する。
最悪の制約違反率は24%です。
論文 参考訳(メタデータ) (2020-10-06T08:31:14Z) - Span-based Semantic Parsing for Compositional Generalization [53.24255235340056]
SpanBasedSPは入力発話上のスパンツリーを予測し、部分的なプログラムが入力内のスパンをどのように構成するかを明示的に符号化する。
GeoQuery、SCAN、CLOSUREでは、SpanBasedSPはランダムスプリットの強いseq2seqベースラインと似ているが、構成一般化を必要とするスプリットのベースラインに比べて劇的に性能が向上する。
論文 参考訳(メタデータ) (2020-09-13T16:42:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。