論文の概要: 4 and 7-bit Labeling for Projective and Non-Projective Dependency Trees
- arxiv url: http://arxiv.org/abs/2310.14319v1
- Date: Sun, 22 Oct 2023 14:43:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 00:29:55.428145
- Title: 4 and 7-bit Labeling for Projective and Non-Projective Dependency Trees
- Title(参考訳): 射影および非射影依存性木に対する4および7ビットラベリング
- Authors: Carlos G\'omez-Rodr\'iguez, Diego Roca, David Vilares
- Abstract要約: 我々は,任意の射影依存木を4ビットラベルの列として表現できるシーケンスラベリングとして解析用エンコーディングを導入する。
木バンクの多種多様化の結果から,従来で最も性能のよいシーケンスラベリング符号化よりも精度の高い7ビット符号化が得られた。
- 参考スコア(独自算出の注目度): 7.466159270333272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce an encoding for parsing as sequence labeling that can represent
any projective dependency tree as a sequence of 4-bit labels, one per word. The
bits in each word's label represent (1) whether it is a right or left
dependent, (2) whether it is the outermost (left/right) dependent of its
parent, (3) whether it has any left children and (4) whether it has any right
children. We show that this provides an injective mapping from trees to labels
that can be encoded and decoded in linear time. We then define a 7-bit
extension that represents an extra plane of arcs, extending the coverage to
almost full non-projectivity (over 99.9% empirical arc coverage). Results on a
set of diverse treebanks show that our 7-bit encoding obtains substantial
accuracy gains over the previously best-performing sequence labeling encodings.
- Abstract(参考訳): 我々は,任意の射影依存木を4ビットラベルの列として表現できるシーケンスラベリングとして解析用エンコーディングを導入する。
各単語のラベルのビットは、(1)が右依存か左依存か、(2)それが親の最も外側(左/右)に依存しているか、(3)左の子供がいるか、(4)適切な子供がいるかを表す。
これは木からラベルへのインジェクションマッピングを提供し、線形時間内にエンコードおよびデコードできることを示す。
次に、余剰の弧面を表す7ビット拡張を定義し、その被覆をほぼ完全な非射影性(99.9%以上の経験的弧被覆)に拡張する。
その結果、7ビットエンコーディングの精度は,従来最良であったシーケンスラベリングエンコーディングよりも大幅に向上することがわかった。
関連論文リスト
- HetTree: Heterogeneous Tree Graph Neural Network [12.403166161903378]
HetTreeは、グラフ構造とヘテロジニアスの両方をモデル化する、新しいヘテロジニアスツリーグラフニューラルネットワークである。
HetTreeは、メタパス間の階層をキャプチャするために、セマンティックツリーデータ構造を構築する。
さまざまな実世界のデータセット上でのHetTreeの評価は、既存のすべてのベースラインをオープンベンチマークで上回っていることを示す。
論文 参考訳(メタデータ) (2024-02-21T03:14:45Z) - Label2Label: A Language Modeling Framework for Multi-Attribute Learning [93.68058298766739]
Label2Labelは、言語モデリングの観点からのマルチ属性予測の最初の試みである。
NLPにおける事前学習言語モデルの成功に触発されたLabel2Labelは、イメージ条件付きマスキング言語モデルを導入した。
我々の直感は、ニューラルネットワークがコンテキストと残りの属性ヒントに基づいて欠落した属性を推測できる場合、インスタンスの属性関係がよく把握されるということである。
論文 参考訳(メタデータ) (2022-07-18T15:12:33Z) - Label Semantics for Few Shot Named Entity Recognition [68.01364012546402]
名前付きエンティティ認識におけるショットラーニングの問題について検討する。
我々は,ラベル名中の意味情報を,モデルに付加的な信号を与え,よりリッチな事前情報を与える手段として活用する。
本モデルは,第1エンコーダによって計算された名前付きエンティティの表現と,第2エンコーダによって計算されたラベル表現とを一致させることを学習する。
論文 参考訳(メタデータ) (2022-03-16T23:21:05Z) - Integrating Dependency Tree Into Self-attention for Sentence
Representation [9.676884071651205]
本稿では,自己認識機構と協調して機能するリレーショナルアテンション機構を適用したDependency-Transformerを提案する。
スコアベースの手法により、Transformerの並列化に影響を与えずに構文情報をインジェクトすることに成功した。
文表現のための4つのタスクにおいて、我々のモデルは最先端の手法よりも優れているか、あるいは同等である。
論文 参考訳(メタデータ) (2022-03-11T13:44:41Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - Image-to-image Translation via Hierarchical Style Disentanglement [115.81148219591387]
この問題に対処するために,HiSD(Hierarchical Style Disentanglement)を提案する。
具体的には,ラベルを階層的な木構造に整理し,独立タグ,排他属性,不規則なスタイルを上下に割り当てる。
CelebA-HQデータセットの定性的および定量的結果の両方が提案されたHiSDの能力を検証する。
論文 参考訳(メタデータ) (2021-03-02T03:43:18Z) - Bracketing Encodings for 2-Planar Dependency Parsing [14.653008985229617]
長さ n の文上の任意の 2-平面依存木を n 個のラベルの列として表現できるブラケットベースの符号化法を提案する。
木バンクの依存構文構造の大部分に存在する2-プランナリティのよく知られた性質を考慮に入れた。
論文 参考訳(メタデータ) (2020-11-01T18:53:32Z) - A Unifying Theory of Transition-based and Sequence Labeling Parsing [14.653008985229617]
文を左から右へ読み取る遷移に基づく構文解析アルゴリズムを,構文木をエンコードするシーケンスラベリングアルゴリズムにマップする。
これにより、トランジションベースの構文解析とシーケンスラベル解析の理論的関係が確立される。
4つのアルゴリズムのシーケンスラベリングバージョンを実装し、学習可能であり、既存のエンコーディングに匹敵する性能が得られることを示す。
論文 参考訳(メタデータ) (2020-11-01T18:25:15Z) - Please Mind the Root: Decoding Arborescences for Dependency Parsing [67.71280539312536]
我々はUniversal Dependency Treebankから多くの言語における最先端の出力を分析する。
最悪の制約違反率は24%です。
論文 参考訳(メタデータ) (2020-10-06T08:31:14Z) - More Embeddings, Better Sequence Labelers? [75.44925576268052]
最近の研究は、文脈埋め込みのファミリを提案し、非文脈埋め込みよりもシーケンスラベルの精度を大幅に向上させる。
我々は18のデータセットと8の言語にまたがる3つのタスクについて広範囲にわたる実験を行い、様々な埋め込み結合を用いたシーケンスラベリングの精度について検討した。
論文 参考訳(メタデータ) (2020-09-17T14:28:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。