論文の概要: A Falta de Pan, Buenas Son Tortas: The Efficacy of Predicted UPOS Tags
for Low Resource UD Parsing
- arxiv url: http://arxiv.org/abs/2106.04222v1
- Date: Tue, 8 Jun 2021 10:04:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-09 16:02:35.349383
- Title: A Falta de Pan, Buenas Son Tortas: The Efficacy of Predicted UPOS Tags
for Low Resource UD Parsing
- Title(参考訳): A Falta de Pan, Buenas Son Tortas: 低リソースUD解析における予測POSタグの有効性
- Authors: Mark Anderson and Mathieu Dehouck and Carlos G\'omez Rodr\'iguez
- Abstract要約: 我々は、実際の低リソースのユニバーサルなツリーバンク、様々なツリーバンクサイズを持つ人工的な低リソースデータ、そして様々な量の拡張データを持つ非常に小さなツリーバンクに対してこれを行う。
予測された UPOS タグは低リソースツリーバンク,特に完全に注釈付けされたツリーが少ない場合に有効であることがわかった。
- 参考スコア(独自算出の注目度): 3.351714665243138
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We evaluate the efficacy of predicted UPOS tags as input features for
dependency parsers in lower resource settings to evaluate how treebank size
affects the impact tagging accuracy has on parsing performance. We do this for
real low resource universal dependency treebanks, artificially low resource
data with varying treebank sizes, and for very small treebanks with varying
amounts of augmented data. We find that predicted UPOS tags are somewhat
helpful for low resource treebanks, especially when fewer fully-annotated trees
are available. We also find that this positive impact diminishes as the amount
of data increases.
- Abstract(参考訳): 我々は,低リソース環境における依存パーサの入力機能として,予測されたuposタグの有効性を評価し,treebankのサイズがパース性能に与える影響を評価する。
我々は、実際の低リソースのユニバーサルなツリーバンク、様々なツリーバンクサイズを持つ人工的な低リソースデータ、そして様々な量の拡張データを持つ非常に小さなツリーバンクに対してこれを行う。
予測された UPOS タグは低リソースツリーバンク,特に完全に注釈付けされたツリーが少ない場合に有効であることがわかった。
また、データ量が増加すると、このポジティブな影響は減少します。
関連論文リスト
- BranchPoseNet: Characterizing tree branching with a deep learning-based pose estimation approach [0.0]
本稿では、ポーズ推定深層学習モデルを用いて、近位レーザー走査データ中の木の輪郭を自動的に検出するパイプラインを提案する。
正確な輪郭検出は、木の成長パターン、木質に関する貴重な洞察を与え、林業価値連鎖全体にわたって木を追跡するバイオメトリックマーカーとして使われる可能性がある。
論文 参考訳(メタデータ) (2024-09-23T07:10:11Z) - Why do Random Forests Work? Understanding Tree Ensembles as
Self-Regularizing Adaptive Smoothers [68.76846801719095]
統計学で広く普及している偏りと分散還元に対する現在の高次二分法は、木のアンサンブルを理解するには不十分である、と我々は主張する。
森林は、通常暗黙的に絡み合っている3つの異なるメカニズムによって、樹木を改良できることを示す。
論文 参考訳(メタデータ) (2024-02-02T15:36:43Z) - EAT: Towards Long-Tailed Out-of-Distribution Detection [55.380390767978554]
本稿では,長い尾を持つOOD検出の課題に対処する。
主な困難は、尾クラスに属するサンプルとOODデータを区別することである。
本稿では,(1)複数の禁制クラスを導入して分布内クラス空間を拡大すること,(2)コンテキストリッチなOODデータに画像をオーバーレイすることでコンテキスト限定のテールクラスを拡大すること,の2つの簡単な考え方を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:47:13Z) - Mind the Backbone: Minimizing Backbone Distortion for Robust Object
Detection [52.355018626115346]
ドメインシフトに対して堅牢なオブジェクト検出器を構築することは、現実世界のアプリケーションにとって重要なことです。
我々は,ゆがみを特徴付けるバックボーンの脆弱性を測定する手段として,相対勾配ノルム(Relative Gradient Norm)を提案する。
両バックボーンのOOD堅牢性を高めるためのレシピを提案する。
論文 参考訳(メタデータ) (2023-03-26T14:50:43Z) - Holistic Sentence Embeddings for Better Out-of-Distribution Detection [12.640837452980332]
Avg-Avg という単純な埋め込み手法を提案し,各中間層からのトークン表現を文埋め込みとして平均化する。
本分析は, 微調整PLMにおける言語知識の保存に有効であり, 背景変化の検出にも有効であることを示す。
論文 参考訳(メタデータ) (2022-10-14T03:22:58Z) - The Fragility of Multi-Treebank Parsing Evaluation [10.355938901584567]
本稿では,木バンクの1つのサブセットを評価することで,弱い結論を導き出す方法について検討する。
優れた木バンク選択のためのガイドラインを確立することは難しいが、潜在的に有害な戦略を検出することは可能である。
論文 参考訳(メタデータ) (2022-09-14T15:07:29Z) - Positive Feature Values Prioritized Hierarchical Redundancy Eliminated
Tree Augmented Naive Bayes Classifier for Hierarchical Feature Spaces [0.0]
階層的冗長性を優先した2種類の正の特徴値を提案する。
提案手法は,従来のHRE-TAN分類器よりも優れた予測性能を示す28の実世界のバイオインフォマティクスデータセットに適用した。
論文 参考訳(メタデータ) (2022-04-12T09:53:16Z) - Visualizing hierarchies in scRNA-seq data using a density tree-biased
autoencoder [50.591267188664666]
本研究では,高次元scRNA-seqデータから意味のある木構造を同定する手法を提案する。
次に、低次元空間におけるデータのツリー構造を強調する木バイアスオートエンコーダDTAEを紹介する。
論文 参考訳(メタデータ) (2021-02-11T08:48:48Z) - Please Mind the Root: Decoding Arborescences for Dependency Parsing [67.71280539312536]
我々はUniversal Dependency Treebankから多くの言語における最先端の出力を分析する。
最悪の制約違反率は24%です。
論文 参考訳(メタデータ) (2020-10-06T08:31:14Z) - On the Frailty of Universal POS Tags for Neural UD Parsers [3.7311680121118345]
UPOSタグをニューラルネットワークの機能として活用するには,タグ付けの精度が極めて高く,金タグの使用は非直線的な性能向上をもたらすことを示す。
また,予測された UPOS タグのどの側面が精度にどのような影響を及ぼすかについても検討し,問題の潜在的な言語的側面を浮き彫りにしている。
論文 参考訳(メタデータ) (2020-10-05T07:40:35Z) - Forest R-CNN: Large-Vocabulary Long-Tailed Object Detection and Instance
Segmentation [75.93960390191262]
我々は、オブジェクトカテゴリ間の関係に関する事前知識を利用して、きめ細かいクラスを粗い親クラスにクラスタリングする。
そこで本研究では,NMS再サンプリング法を提案する。
提案手法はフォレストR-CNNと呼ばれ,ほとんどのオブジェクト認識モデルに適用可能なプラグイン・アンド・プレイモジュールとして機能する。
論文 参考訳(メタデータ) (2020-08-13T03:52:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。