論文の概要: SIGTYP 2020 Shared Task: Prediction of Typological Features
- arxiv url: http://arxiv.org/abs/2010.08246v2
- Date: Mon, 26 Oct 2020 07:29:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 20:55:28.726705
- Title: SIGTYP 2020 Shared Task: Prediction of Typological Features
- Title(参考訳): SIGTYP 2020共有課題:類型的特徴の予測
- Authors: Johannes Bjerva and Elizabeth Salesky and Sabrina J. Mielke and Aditi
Chaudhary and Giuseppe G. A. Celano and Edoardo M. Ponti and Ekaterina
Vylomova and Ryan Cotterell and Isabelle Augenstein
- Abstract要約: タイポロジーKBが広く採用されるのを妨げる大きな欠点は、人口が少ないことである。
類型的特徴は相互に相関することが多いため、それらを予測し、自動的に類型的KBを投入することができる。
全体として、このタスクは5つのチームから8つの応募を惹きつけた。
- 参考スコア(独自算出の注目度): 78.95376120154083
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Typological knowledge bases (KBs) such as WALS (Dryer and Haspelmath, 2013)
contain information about linguistic properties of the world's languages. They
have been shown to be useful for downstream applications, including
cross-lingual transfer learning and linguistic probing. A major drawback
hampering broader adoption of typological KBs is that they are sparsely
populated, in the sense that most languages only have annotations for some
features, and skewed, in that few features have wide coverage. As typological
features often correlate with one another, it is possible to predict them and
thus automatically populate typological KBs, which is also the focus of this
shared task. Overall, the task attracted 8 submissions from 5 teams, out of
which the most successful methods make use of such feature correlations.
However, our error analysis reveals that even the strongest submitted systems
struggle with predicting feature values for languages where few features are
known.
- Abstract(参考訳): WALS (Dryer and Haspelmath, 2013) のような分類学的知識ベース (KB) には、世界の言語の言語的特性に関する情報が含まれている。
これらは、言語間移動学習や言語探索など、下流の応用に有用であることが示されている。
タイポジカルkbsの広範な採用を妨げる大きな欠点は、ほとんどの言語がいくつかの機能に対するアノテーションしか持たず、歪んでいるという意味で、人口がほとんどないという点である。
類型的特徴はしばしば相互に関連しているため、それらを予測することができ、したがって、この共有タスクの焦点でもある類型的KBを自動で投入することができる。
全体として、このタスクには5つのチームから8つの応募が寄せられ、その中で最も成功した方法が、このような機能相関を利用しています。
しかし, 誤り解析の結果, 最強のシステムでさえ, 特徴がほとんど知られていない言語の特徴値の予測に苦慮していることが明らかとなった。
関連論文リスト
- data2lang2vec: Data Driven Typological Features Completion [8.28573483085828]
我々は1,749言語で70%以上の精度を達成し,多言語対応のPOSタグを導入した。
また、タイポロジーに欠ける可能性のある機能に焦点を当てた、より現実的な評価設定も導入しています。
論文 参考訳(メタデータ) (2024-09-25T21:32:57Z) - Language Embeddings Sometimes Contain Typological Generalizations [0.0]
我々は、1295の言語における聖書翻訳の膨大な多言語データセットに基づいて、自然言語処理タスクのニューラルネットワークを訓練する。
学習された言語表現は、既存の類型データベースや、新しい量的構文的・形態的特徴セットと比較される。
いくつかの一般化は言語型学の伝統的な特徴に驚くほど近いが、ほとんどのモデルは以前の研究と同様に言語学的に意味のある一般化をしていないと結論付けている。
論文 参考訳(メタデータ) (2023-01-19T15:09:59Z) - Towards Zero-shot Language Modeling [90.80124496312274]
人間の言語学習に誘導的に偏りを持つニューラルモデルを構築した。
類型的に多様な訓練言語のサンプルからこの分布を推測する。
我々は、保留言語に対する遠隔監視として、追加の言語固有の側情報を利用する。
論文 参考訳(メタデータ) (2021-08-06T23:49:18Z) - Does Typological Blinding Impede Cross-Lingual Sharing? [31.20201199491578]
入力データから、言語間設定で訓練されたモデルが、タイプ的手がかりを拾い上げることを示す。
言語間の共有とパフォーマンスへの影響について検討する。
論文 参考訳(メタデータ) (2021-01-28T09:32:08Z) - NEMO: Frequentist Inference Approach to Constrained Linguistic Typology
Feature Prediction in SIGTYP 2020 Shared Task [83.43738174234053]
タイプ的特徴間の相関関係を表現するために頻繁な推論を用い、この表現を用いて、個々の特徴を予測する単純なマルチクラス推定器を訓練する。
テスト言語149言語に対して,マイクロ平均精度0.66を達成できた。
論文 参考訳(メタデータ) (2020-10-12T19:25:43Z) - Linguistic Typology Features from Text: Inferring the Sparse Features of
World Atlas of Language Structures [73.06435180872293]
我々は、バイト埋め込みと畳み込み層に基づく繰り返しニューラルネットワーク予測器を構築する。
様々な言語型の特徴を確実に予測できることを示す。
論文 参考訳(メタデータ) (2020-04-30T21:00:53Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z) - Cross-lingual, Character-Level Neural Morphological Tagging [57.0020906265213]
文字レベルのリカレントなニューラルタグをトレーニングし、高リソース言語と低リソース言語を併用して形態的タグ付けを予測する。
複数の関連言語間の共同文字表現の学習は、高リソース言語から低リソース言語への知識伝達を成功させ、モノリンガルモデルの精度を最大30%向上させる。
論文 参考訳(メタデータ) (2017-08-30T08:14:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。