論文の概要: The SIGMORPHON 2020 Shared Task on Unsupervised Morphological Paradigm
Completion
- arxiv url: http://arxiv.org/abs/2005.13756v1
- Date: Thu, 28 May 2020 03:09:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-27 05:12:34.766941
- Title: The SIGMORPHON 2020 Shared Task on Unsupervised Morphological Paradigm
Completion
- Title(参考訳): sigmorphon 2020 の非教師なし形態的パラダイム完成に関するタスク
- Authors: Katharina Kann, Arya McCarthy, Garrett Nicolai, Mans Hulden
- Abstract要約: 本稿では, SIGMORPHON 2020共有課題における非教師なし形態素パラダイムの完成に関する知見について述べる。
参加者は、原文とレムマのリストを入力とし、すべての入力フォームを出力するシステムを提出するよう求められた。
ここでは、この共有タスクがトピックに関するさらなる研究の基礎となるよう分析を行う。
- 参考スコア(独自算出の注目度): 28.728844366333185
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we describe the findings of the SIGMORPHON 2020 shared task on
unsupervised morphological paradigm completion (SIGMORPHON 2020 Task 2), a
novel task in the field of inflectional morphology. Participants were asked to
submit systems which take raw text and a list of lemmas as input, and output
all inflected forms, i.e., the entire morphological paradigm, of each lemma. In
order to simulate a realistic use case, we first released data for 5
development languages. However, systems were officially evaluated on 9 surprise
languages, which were only revealed a few days before the submission deadline.
We provided a modular baseline system, which is a pipeline of 4 components. 3
teams submitted a total of 7 systems, but, surprisingly, none of the submitted
systems was able to improve over the baseline on average over all 9 test
languages. Only on 3 languages did a submitted system obtain the best results.
This shows that unsupervised morphological paradigm completion is still largely
unsolved. We present an analysis here, so that this shared task will ground
further research on the topic.
- Abstract(参考訳): 本稿では, インフレクション形態学の新しい課題である非教師なし形態学パラダイム完了タスク(SIGMORPHON 2020 Task 2)について, SIGMORPHON 2020共有タスクの発見について述べる。
参加者は生のテキストと補題のリストを入力として入力し、各補題の形態的パラダイム全体を含む全ての帰納形式を出力するシステムを提出した。
現実的なユースケースをシミュレートするために、5つの開発言語のためのデータをリリースした。
しかし、システムは9つのサプライズ言語で公式に評価され、提出期限の数日前に公表された。
4つのコンポーネントからなるパイプラインであるモジュラーベースラインシステムを提供した。
3つのチームが合計7つのシステムを提出したが、驚いたことに、どのシステムもベースラインよりも平均して9つのテスト言語を改善できなかった。
3つの言語でのみ、提出されたシステムが最高の結果を得た。
これは、教師なし形態素パラダイムの完備化は、まだほとんど未解決であることを示している。
ここでは、この共有タスクがトピックに関するさらなる研究の基礎となるよう分析を行う。
関連論文リスト
- SADAS: A Dialogue Assistant System Towards Remediating Norm Violations
in Bilingual Socio-Cultural Conversations [56.31816995795216]
SADAS(Socially-Aware Dialogue Assistant System)は、会話が敬意と理解で広がることを保証するためのシステムである。
本システムの新しいアーキテクチャは,(1)対話に存在する規範のカテゴリを特定すること,(2)潜在的な規範違反を検出すること,(3)違反の深刻さを評価すること,(4)違反の是正を目的とした対策を実施すること,を含む。
論文 参考訳(メタデータ) (2024-01-29T08:54:21Z) - Look Before You Leap: A Universal Emergent Decomposition of Retrieval
Tasks in Language Models [58.57279229066477]
本研究では,言語モデル(LM)が様々な状況下での検索タスクをどのように解決するかを検討する。
ORIONは6つのドメインにまたがる構造化された検索タスクの集合である。
LMは内部的にモジュール方式で検索タスクを分解する。
論文 参考訳(メタデータ) (2023-12-13T18:36:43Z) - DOMINO: A Dual-System for Multi-step Visual Language Reasoning [76.69157235928594]
視覚情報抽出のための「System-1」ステップと、意図的な推論のための「System-2」ステップからなる多段階マルチモーダル推論のためのデュアルシステムを提案する。
事前学習した System-2 モジュールを用いた本手法は, 配当データと配当データの先行処理と比較して, 競合的に動作する。
論文 参考訳(メタデータ) (2023-10-04T13:29:47Z) - The SIGMORPHON 2022 Shared Task on Morpheme Segmentation [39.44280269663147]
SIGMORPHON 2022は、形態素分割システムのタスクを共有し、単語を一連の形態素に分解する。
最も優れたシステムは、最先端の3つのサブワードトークン法(BPE、ULM、Morfessor2)を30.71%の絶対値で上回った。
エラー解析を容易にし,今後の研究をサポートするため,システム予測,評価スクリプト,ゴールド標準データセットをすべてリリースした。
論文 参考訳(メタデータ) (2022-06-15T15:57:22Z) - UniMorph 4.0: Universal Morphology [104.69846084893298]
本稿は,過去2年間のいくつかの前線における展開と改善について述べる。
多くの言語学者による共同作業により、30の絶滅危惧言語を含む67の新しい言語が追加された。
前回のUniMorphリリースに合わせて,16言語で形態素セグメンテーションを施したデータベースも拡張した。
論文 参考訳(メタデータ) (2022-05-07T09:19:02Z) - Morphology Without Borders: Clause-Level Morphological Annotation [8.559428282730021]
形態学を単語レベルではなく節レベルの現象と考えることを提案する。
我々は,英語,ドイツ語,トルコ語,ヘブライ語という4つの類型的に異なる言語を対象として,節レベルの形態に関する新しいデータセットを提供する。
実験の結果,節レベルタスクは各単語レベルタスクよりも格段に難しいが,言語間では同等に複雑であることがわかった。
論文 参考訳(メタデータ) (2022-02-25T17:20:28Z) - The NYU-CUBoulder Systems for SIGMORPHON 2020 Task 0 and Task 2 [25.234256237085336]
SIGMORPHON 2020 Task 0におけるNYU-CUBoulderシステムについて述べる。
前者は、レムマから形態的屈折を発生させ、対象形態を記述する形態的特徴の集合からなる。
後者は、原文のみから与えられた補題の集合に対するパラダイム全体を生成する必要がある。
論文 参考訳(メタデータ) (2020-06-21T15:41:58Z) - SIGMORPHON 2020 Shared Task 0: Typologically Diverse Morphological
Inflection [81.85463892070085]
形態的回帰に関するSIGMORPHON 2020の課題は、型的に異なる言語にまたがるシステムの一般化能力を調査することを目的としている。
システムは45言語と5つの言語ファミリーのデータを使用して開発され、追加の45言語と10の言語ファミリー(合計13言語)のデータで微調整され、90言語すべてで評価された。
論文 参考訳(メタデータ) (2020-06-20T13:24:14Z) - The IMS-CUBoulder System for the SIGMORPHON 2020 Shared Task on
Unsupervised Morphological Paradigm Completion [27.37360427124081]
我々は、Stuttgart IMS大学とコロラド大学ボルダー校のSIGMORPHON 2020 Task 2における、教師なし形態素パラダイムの完成に関するシステムについて紹介する。
このタスクは、レムマ自体とラベルなしのテキストのみを与えられた一連のレムマのモルフォロジーパラダイムを生成することで構成されている。
我々のポインタジェネレータシステムは、全ての言語で平均して7つの提案されたシステムの中で最高のスコアを取得し、ブルガリア語とカンナダ語において、総合的に最も優れた公式ベースラインを上回ります。
論文 参考訳(メタデータ) (2020-05-25T21:23:52Z) - The Paradigm Discovery Problem [121.79963594279893]
我々は、パラダイム発見問題を定式化し、システム判定のためのメトリクスを開発する。
5つの多言語に対する経験的結果について報告する。
私たちのコードとデータは公開されています。
論文 参考訳(メタデータ) (2020-05-04T16:38:54Z) - Unsupervised Morphological Paradigm Completion [26.318483685612765]
原文と補題リストのみを与えられたタスクは、全ての屈折形の形態的パラダイム、すなわち、補題を生成することで構成される。
i) EDIT TREE検索, (ii) 補題検索, (iii) パラダイムサイズ発見, (iv) インフレクション生成。
我々のシステムは自明なベースラインを軽快に上回り、一部の言語では最小限の教師付きシステムよりも高い精度が得られる。
論文 参考訳(メタデータ) (2020-05-03T02:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。