論文の概要: Hierarchical Bracketing Encodings for Dependency Parsing as Tagging
- arxiv url: http://arxiv.org/abs/2505.11693v1
- Date: Fri, 16 May 2025 21:01:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:10.785548
- Title: Hierarchical Bracketing Encodings for Dependency Parsing as Tagging
- Title(参考訳): タグ付けによる依存関係解析のための階層的ブラケット符号化
- Authors: Ana Ezquerro, David Vilares, Anssi Yli-Jyrä, Carlos Gómez-Rodríguez,
- Abstract要約: シーケンスラベリング依存解析のための符号化のファミリを提示する。
最適な階層的ブラケットを導出し,12個の異なるラベルのみを用いて射影木を符号化する記号数を最小化する。
- 参考スコア(独自算出の注目度): 16.54938714613888
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a family of encodings for sequence labeling dependency parsing, based on the concept of hierarchical bracketing. We prove that the existing 4-bit projective encoding belongs to this family, but it is suboptimal in the number of labels used to encode a tree. We derive an optimal hierarchical bracketing, which minimizes the number of symbols used and encodes projective trees using only 12 distinct labels (vs. 16 for the 4-bit encoding). We also extend optimal hierarchical bracketing to support arbitrary non-projectivity in a more compact way than previous encodings. Our new encodings yield competitive accuracy on a diverse set of treebanks.
- Abstract(参考訳): 本稿では,階層的ブラケットの概念に基づくシーケンスラベリング依存解析のための符号化のファミリについて述べる。
既存の4ビット射影符号化はこのファミリーに属することを証明しているが、木を符号化するのに使われるラベルの数には最適ではない。
我々は,12個の異なるラベル (vs.16 for the 4-bit encoding) のみを用いて,使用するシンボルの数を最小限に抑え,投影木を符号化する最適階層ブラケットを導出する。
また、任意の非射影性をサポートするための最適階層ブラケットを、従来の符号化よりもコンパクトに拡張する。
我々の新しいエンコーディングは、様々なツリーバンクの競争精度をもたらす。
関連論文リスト
- High-Rate Extended Binomial Codes for Multi-Qubit Encoding [0.5439020425819]
量子誤り訂正符号(QECC)からボソニックQECCへのマッピングを提案する。
我々の研究は ([N_K,K,D]) キュービット符号を ([N_K,K,D]) キュービット符号の単一使用に変換するボソニックな類似体と見なすことができる。
論文 参考訳(メタデータ) (2025-01-13T07:04:05Z) - 4 and 7-bit Labeling for Projective and Non-Projective Dependency Trees [7.466159270333272]
我々は,任意の射影依存木を4ビットラベルの列として表現できるシーケンスラベリングとして解析用エンコーディングを導入する。
木バンクの多種多様化の結果から,従来で最も性能のよいシーケンスラベリング符号化よりも精度の高い7ビット符号化が得られた。
論文 参考訳(メタデータ) (2023-10-22T14:43:53Z) - Outline, Then Details: Syntactically Guided Coarse-To-Fine Code
Generation [61.50286000143233]
ChainCoderは、Pythonコードを段階的に生成するプログラム合成言語モデルである。
自然言語記述と構文的に整合したI/Oデータサンプルを共同で符号化するために、カスタマイズされたトランスフォーマーアーキテクチャを利用する。
論文 参考訳(メタデータ) (2023-04-28T01:47:09Z) - Label Semantics for Few Shot Named Entity Recognition [68.01364012546402]
名前付きエンティティ認識におけるショットラーニングの問題について検討する。
我々は,ラベル名中の意味情報を,モデルに付加的な信号を与え,よりリッチな事前情報を与える手段として活用する。
本モデルは,第1エンコーダによって計算された名前付きエンティティの表現と,第2エンコーダによって計算されたラベル表現とを一致させることを学習する。
論文 参考訳(メタデータ) (2022-03-16T23:21:05Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - Bracketing Encodings for 2-Planar Dependency Parsing [14.653008985229617]
長さ n の文上の任意の 2-平面依存木を n 個のラベルの列として表現できるブラケットベースの符号化法を提案する。
木バンクの依存構文構造の大部分に存在する2-プランナリティのよく知られた性質を考慮に入れた。
論文 参考訳(メタデータ) (2020-11-01T18:53:32Z) - A Unifying Theory of Transition-based and Sequence Labeling Parsing [14.653008985229617]
文を左から右へ読み取る遷移に基づく構文解析アルゴリズムを,構文木をエンコードするシーケンスラベリングアルゴリズムにマップする。
これにより、トランジションベースの構文解析とシーケンスラベル解析の理論的関係が確立される。
4つのアルゴリズムのシーケンスラベリングバージョンを実装し、学習可能であり、既存のエンコーディングに匹敵する性能が得られることを示す。
論文 参考訳(メタデータ) (2020-11-01T18:25:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。