論文の概要: What Taggers Fail to Learn, Parsers Need the Most
- arxiv url: http://arxiv.org/abs/2104.01083v1
- Date: Fri, 2 Apr 2021 15:04:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 14:05:22.819262
- Title: What Taggers Fail to Learn, Parsers Need the Most
- Title(参考訳): Taggersが学べないものは、パーサーが一番必要
- Authors: Mark Anderson and Carlos G\'omez-Rodr\'iguez
- Abstract要約: 本報告では,ゴールド標準タグの使用が解析性能に大きく寄与する理由を評価するために,ニューラルUPOSタグの誤り解析を行う。
我々は、単語の種類について暗黙的に学習する神経依存度と、タグが予測されたタグを用いて最小の影響を説明するためのエラーとの関連性を評価する。
- 参考スコア(独自算出の注目度): 0.38073142980733
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present an error analysis of neural UPOS taggers to evaluate why using
gold standard tags has such a large positive contribution to parsing
performance while using predicted UPOS tags either harms performance or offers
a negligible improvement. We evaluate what neural dependency parsers implicitly
learn about word types and how this relates to the errors taggers make to
explain the minimal impact using predicted tags has on parsers. We also present
a short analysis on what contexts result in reductions in tagging performance.
We then mask UPOS tags based on errors made by taggers to tease away the
contribution of UPOS tags which taggers succeed and fail to classify correctly
and the impact of tagging errors.
- Abstract(参考訳): そこで本研究では,ゴールド標準タグを用いた場合,予測されたUPPタグが性能に悪影響を及ぼすか,あるいは無視できる改善をもたらすかを評価するために,ニューラルネットワークによるUPPタグの誤り解析を行った。
我々は、単語タイプについて暗黙的に学習するニューラル依存構文解析器と、予測タグがパーサーに与える影響を最小化するエラータガーとの関係について評価する。
また,タギング性能の低下の原因となる文脈について,簡単な分析を行う。
次に,タガーによるエラーに基づいてuposタグをマスクし,タガーが成功し,正しく分類できないuposタグの寄与とタグエラーの影響をからかう。
関連論文リスト
- Understanding and Mitigating Classification Errors Through Interpretable
Token Patterns [58.91023283103762]
容易に解釈可能な用語でエラーを特徴付けることは、分類器が体系的なエラーを起こす傾向にあるかどうかを洞察する。
正しい予測と誤予測を区別するトークンのパターンを発見することを提案する。
提案手法であるPremiseが実際によく動作することを示す。
論文 参考訳(メタデータ) (2023-11-18T00:24:26Z) - Alternative Pseudo-Labeling for Semi-Supervised Automatic Speech
Recognition [49.42732949233184]
ラベル付きデータが不十分な場合、擬似ラベル技術による半教師付き学習は自動音声認識の性能を大幅に向上させることができる。
損失関数のグラウンドトルースとしてノイズラベルを取ると、最適以下の性能が得られる。
そこで我々は,ノイズの多い擬似ラベル問題に対処するために,代替擬似ラベル方式という新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-08-12T12:13:52Z) - Another Dead End for Morphological Tags? Perturbed Inputs and Parsing [12.234169944475537]
形態的タグは、誤りを犯す単語のみのニューラルを補正する役割を担っていることを示す。
また, 形態的タグが語彙的摂動に対して有意に頑健であれば, 誤りを訂正できることが示唆された。
論文 参考訳(メタデータ) (2023-05-24T13:11:04Z) - Parsing linearizations appreciate PoS tags - but some are fussy about
errors [12.024457689086008]
PoSタグは、かつては構文解析の有用な情報源として扱われていたが、深層学習の普及に伴い、より状況的になってきている。
グラフおよび遷移に基づくラベル付けに対するPoSタグの影響に関する最近の研究は、タグ付け精度が高い場合や低リソースシナリオでのみ有用であることを示している。
我々は研究を行い、いくつかの傾向を明らかにする。その中で、PoSタグは一般に他のパラダイムよりもシーケンスラベリングに有用であるが、その精度はエンコードに依存している。
論文 参考訳(メタデータ) (2022-10-27T07:15:36Z) - Influence Functions for Sequence Tagging Models [49.81774968547377]
影響関数を拡張して、予測を学習ポイントまで追跡し、それらに通知します。
本手法を用いて,系統的アノテーションの誤りを同定し,セグメント効果の実用性を示す。
論文 参考訳(メタデータ) (2022-10-25T17:13:11Z) - Rethink about the Word-level Quality Estimation for Machine Translation
from Human Judgement [57.72846454929923]
ベンチマークデータセットであるemphHJQEを作成し、専門家翻訳者が不適切な翻訳語を直接アノテートする。
本稿では,タグリファインメント戦略と木ベースのアノテーション戦略という2つのタグ補正戦略を提案し,TERベースの人工QEコーパスをemphHJQEに近づける。
その結果,提案したデータセットは人間の判断と一致しており,また,提案したタグ補正戦略の有効性も確認できた。
論文 参考訳(メタデータ) (2022-09-13T02:37:12Z) - On the Frailty of Universal POS Tags for Neural UD Parsers [3.7311680121118345]
UPOSタグをニューラルネットワークの機能として活用するには,タグ付けの精度が極めて高く,金タグの使用は非直線的な性能向上をもたらすことを示す。
また,予測された UPOS タグのどの側面が精度にどのような影響を及ぼすかについても検討し,問題の潜在的な言語的側面を浮き彫りにしている。
論文 参考訳(メタデータ) (2020-10-05T07:40:35Z) - Reliable Part-of-Speech Tagging of Historical Corpora through Set-Valued Prediction [21.67895423776014]
設定値予測の枠組みにおけるPOSタグ付けについて検討する。
最先端のPOSタグをセット値の予測に拡張すると、より正確で堅牢なタグ付けが得られます。
論文 参考訳(メタデータ) (2020-08-04T07:21:36Z) - On the Robustness of Language Encoders against Grammatical Errors [66.05648604987479]
我々は、非ネイティブ話者から実際の文法的誤りを収集し、これらの誤りをクリーンテキストデータ上でシミュレートするために敵攻撃を行う。
結果,全ての試験モデルの性能は影響するが,影響の程度は異なることがわかった。
論文 参考訳(メタデータ) (2020-05-12T11:01:44Z) - Adversarial Transfer Learning for Punctuation Restoration [58.2201356693101]
句読点予測のためのタスク不変知識を学習するために,逆多タスク学習を導入する。
IWSLT2011データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2020-04-01T06:19:56Z) - Is POS Tagging Necessary or Even Helpful for Neural Dependency Parsing? [22.93722845643562]
Stackのジョイントフレームワークを使用する場合,POSタグ付けによって解析性能が大幅に向上することを示す。
解析木よりもPOSタグをアノテートする方がずっと安いことを考えると,大規模な異種POSタグデータの利用も検討する。
論文 参考訳(メタデータ) (2020-03-06T13:47:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。