論文の概要: Is POS Tagging Necessary or Even Helpful for Neural Dependency Parsing?
- arxiv url: http://arxiv.org/abs/2003.03204v2
- Date: Fri, 14 Aug 2020 06:41:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 00:35:29.779502
- Title: Is POS Tagging Necessary or Even Helpful for Neural Dependency Parsing?
- Title(参考訳): POSタグ付けは、ニューラルネットワークのパースに必要か、あるいは役に立つか?
- Authors: Houquan Zhou, Yu Zhang, Zhenghua Li, Min Zhang
- Abstract要約: Stackのジョイントフレームワークを使用する場合,POSタグ付けによって解析性能が大幅に向上することを示す。
解析木よりもPOSタグをアノテートする方がずっと安いことを考えると,大規模な異種POSタグデータの利用も検討する。
- 参考スコア(独自算出の注目度): 22.93722845643562
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the pre deep learning era, part-of-speech tags have been considered as
indispensable ingredients for feature engineering in dependency parsing. But
quite a few works focus on joint tagging and parsing models to avoid error
propagation. In contrast, recent studies suggest that POS tagging becomes much
less important or even useless for neural parsing, especially when using
character-based word representations. Yet there are not enough investigations
focusing on this issue, both empirically and linguistically. To answer this, we
design and compare three typical multi-task learning framework, i.e.,
Share-Loose, Share-Tight, and Stack, for joint tagging and parsing based on the
state-of-the-art biaffine parser. Considering that it is much cheaper to
annotate POS tags than parse trees, we also investigate the utilization of
large-scale heterogeneous POS tag data. We conduct experiments on both English
and Chinese datasets, and the results clearly show that POS tagging (both
homogeneous and heterogeneous) can still significantly improve parsing
performance when using the Stack joint framework. We conduct detailed analysis
and gain more insights from the linguistic aspect.
- Abstract(参考訳): 深層学習時代には,音声タグは係り受け解析における特徴工学に欠かせない要素であると考えられてきた。
しかし、エラーの伝播を避けるために、ジョイントタグ付けとパースモデルにフォーカスする作業はほとんどない。
対照的に、最近の研究では、POSタグ付けは、特に文字ベースの単語表現を使用する場合、神経解析において、はるかに重要あるいは役に立たないものになっていることが示唆されている。
しかし、この問題を実証的にも言語的にも、十分に調査されていない。
この質問に答えるために我々は,最先端のbiaffineパーサに基づくジョイントタグ付けと解析のために,share-loose,share-tight,stackという3つの典型的なマルチタスク学習フレームワークを設計し,比較する。
解析木よりもPOSタグをアノテートする方がずっと安いことを考えると,大規模な異種POSタグデータの利用も検討する。
英語と中国語のデータセットを実験した結果,posタグ(均質と異質の両方)がスタックジョイントフレームワークを使用する場合,解析性能が著しく向上することが明らかとなった。
我々は詳細な分析を行い、言語学的側面からさらなる洞察を得る。
関連論文リスト
- Urdu Dependency Parsing and Treebank Development: A Syntactic and Morphological Perspective [0.0]
依存関係解析を用いて、ウルドゥー語でニュース記事を分析する。
最良ラベル付き精度(LA)は70%,未ラベル付きアタッチメントスコア(UAS)は84%であった。
論文 参考訳(メタデータ) (2024-06-13T19:30:32Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - Parsing linearizations appreciate PoS tags - but some are fussy about
errors [12.024457689086008]
PoSタグは、かつては構文解析の有用な情報源として扱われていたが、深層学習の普及に伴い、より状況的になってきている。
グラフおよび遷移に基づくラベル付けに対するPoSタグの影響に関する最近の研究は、タグ付け精度が高い場合や低リソースシナリオでのみ有用であることを示している。
我々は研究を行い、いくつかの傾向を明らかにする。その中で、PoSタグは一般に他のパラダイムよりもシーケンスラベリングに有用であるが、その精度はエンコードに依存している。
論文 参考訳(メタデータ) (2022-10-27T07:15:36Z) - Masked Part-Of-Speech Model: Does Modeling Long Context Help
Unsupervised POS-tagging? [94.68962249604749]
フレキシブルな依存性モデリングを容易にするために,MPoSM(Masked Part-of-Speech Model)を提案する。
MPoSMは任意のタグ依存をモデル化し、マスクされたPOS再構成の目的を通じてPOS誘導を行うことができる。
英語のPenn WSJデータセットと10の多様な言語を含むユニバーサルツリーバンクの競合的な結果を得た。
論文 参考訳(メタデータ) (2022-06-30T01:43:05Z) - On The Ingredients of an Effective Zero-shot Semantic Parser [95.01623036661468]
我々は、標準発話とプログラムの訓練例を文法から言い換えて、ゼロショット学習を分析する。
改良された文法,より強力なパラフレーズ,効率的な学習手法を用いて,これらのギャップを埋めることを提案する。
我々のモデルはラベル付きデータゼロの2つの意味解析ベンチマーク(Scholar, Geo)で高い性能を達成する。
論文 参考訳(メタデータ) (2021-10-15T21:41:16Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Pareto Probing: Trading Off Accuracy for Complexity [87.09294772742737]
我々は,プローブの複雑性と性能の基本的なトレードオフを反映したプローブ計量について論じる。
係り受け解析による実験により,文脈表現と非文脈表現の統語的知識の幅広いギャップが明らかとなった。
論文 参考訳(メタデータ) (2020-10-05T17:27:31Z) - A Survey of Unsupervised Dependency Parsing [62.16714720135358]
教師なしの依存関係解析は、正しいパースツリーのアノテーションを持たない文から依存関係を学ぶことを目的としている。
その困難さにもかかわらず、教師なしの構文解析は、ほとんど無制限に注釈のないテキストデータを利用することができるため、興味深い研究方向である。
論文 参考訳(メタデータ) (2020-10-04T10:51:22Z) - Reliable Part-of-Speech Tagging of Historical Corpora through Set-Valued Prediction [21.67895423776014]
設定値予測の枠組みにおけるPOSタグ付けについて検討する。
最先端のPOSタグをセット値の予測に拡張すると、より正確で堅牢なタグ付けが得られます。
論文 参考訳(メタデータ) (2020-08-04T07:21:36Z) - A Cross-Genre Ensemble Approach to Robust Reddit Part of Speech Tagging [10.609715843964263]
本研究では,異なるジャンルでトレーニングされた最先端のタグ付けモデルが,未フィルタリングRedditフォーラムの議論からWebコンテンツ上でどのように機能するかを検討する。
この結果から,少数のドメイン内データであっても,他のWebドメインからのデータのコントリビューションよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-04-29T16:36:38Z) - Machine Learning Approaches for Amharic Parts-of-speech Tagging [0.0]
アムハラ語における現在のPOSタグのパフォーマンスは、英語や他のヨーロッパの言語で利用可能な現代のPOSタグほど良くない。
この作業の目的は、91%を超えなかったAmharic言語のPOSタグ性能を改善することである。
論文 参考訳(メタデータ) (2020-01-10T06:40:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。