論文の概要: Automatic Extraction of Rules Governing Morphological Agreement
- arxiv url: http://arxiv.org/abs/2010.01160v2
- Date: Tue, 6 Oct 2020 03:30:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 01:32:19.099482
- Title: Automatic Extraction of Rules Governing Morphological Agreement
- Title(参考訳): 形態的合意に基づくルールの自動抽出
- Authors: Aditi Chaudhary, Antonios Anastasopoulos, Adithya Pratapa, David R.
Mortensen, Zaid Sheikh, Yulia Tsvetkov, Graham Neubig
- Abstract要約: 原文から第一パス文法仕様を抽出する自動フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
我々のフレームワークはUniversal Dependenciesプロジェクトに含まれるすべての言語に適用され、有望な結果が得られます。
- 参考スコア(独自算出の注目度): 103.78033184221373
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Creating a descriptive grammar of a language is an indispensable step for
language documentation and preservation. However, at the same time it is a
tedious, time-consuming task. In this paper, we take steps towards automating
this process by devising an automated framework for extracting a first-pass
grammatical specification from raw text in a concise, human- and
machine-readable format. We focus on extracting rules describing agreement, a
morphosyntactic phenomenon at the core of the grammars of many of the world's
languages. We apply our framework to all languages included in the Universal
Dependencies project, with promising results. Using cross-lingual transfer,
even with no expert annotations in the language of interest, our framework
extracts a grammatical specification which is nearly equivalent to those
created with large amounts of gold-standard annotated data. We confirm this
finding with human expert evaluations of the rules that our framework produces,
which have an average accuracy of 78%. We release an interface demonstrating
the extracted rules at https://neulab.github.io/lase/.
- Abstract(参考訳): 言語の記述文法を作成することは、言語の文書化と保存に必須のステップである。
しかし同時に、退屈で時間のかかる作業である。
本稿では,このプロセスの自動化に向けて,簡潔かつ人間的,機械可読な形式で原文から第一パス文法仕様を抽出する自動化フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
このフレームワークをUniversal Dependenciesプロジェクトに含まれるすべての言語に適用し、有望な結果を得る。
本フレームワークは,言語間移動を用いた言語間変換を用いて,ゴールド標準アノテートされた大量のデータとほぼ同等の文法的仕様を抽出する。
我々は、この発見を、我々のフレームワークが生成する規則の人間的専門家による評価で確認し、平均精度は78%である。
抽出されたルールを示すインターフェースを https://neulab.github.io/lase/ でリリースします。
関連論文リスト
- Sparse Logistic Regression with High-order Features for Automatic Grammar Rule Extraction from Treebanks [6.390468088226495]
本研究では,木バンクから重要な粒度の文法パターンを抽出し,探索する手法を提案する。
我々は,異なる言語にまたがる記述や規則を抽出し,合意と語順の2つの言語現象について考察する。
我々の手法は、スペイン語、フランス語、ウーロフにおける有名な文法規則とあまり知られていない重要な文法規則の両方を捉えている。
論文 参考訳(メタデータ) (2024-03-26T09:39:53Z) - Wav2Gloss: Generating Interlinear Glossed Text from Speech [78.64412090339044]
音声から4つの言語アノテーションを自動抽出するタスクであるWav2Glossを提案する。
音声からのインターリニア・グロッシド・テキスト・ジェネレーションの今後の研究の基盤となる基盤となるものについて述べる。
論文 参考訳(メタデータ) (2024-03-19T21:45:29Z) - nl2spec: Interactively Translating Unstructured Natural Language to
Temporal Logics with Large Language Models [3.1143846686797314]
大規模言語モデル(LLM)を適用するためのフレームワークであるnl2specは、構造化されていない自然言語から正式な仕様を導出する。
本稿では,自然言語におけるシステム要求のあいまいさを検知し,解決する新たな手法を提案する。
ユーザは、これらのサブ翻訳を反復的に追加、削除、編集して、不正なフォーマル化を修正する。
論文 参考訳(メタデータ) (2023-03-08T20:08:53Z) - AUTOLEX: An Automatic Framework for Linguistic Exploration [93.89709486642666]
本稿では言語学者による言語現象の簡潔な記述の発見と抽出を容易にするための自動フレームワークを提案する。
具体的には、この枠組みを用いて、形態的一致、ケースマーキング、単語順序の3つの現象について記述を抽出する。
本研究では,言語専門家の助けを借りて記述を評価し,人間の評価が不可能な場合に自動評価を行う手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T20:37:30Z) - Evaluating the Morphosyntactic Well-formedness of Generated Texts [88.20502652494521]
L'AMBRE – テキストのモルフォシンタク的整形性を評価する指標を提案する。
形態的に豊かな言語に翻訳するシステムのダイアクロニックスタディを通じて,機械翻訳作業におけるメトリックの有効性を示す。
論文 参考訳(メタデータ) (2021-03-30T18:02:58Z) - Lexically-constrained Text Generation through Commonsense Knowledge
Extraction and Injection [62.071938098215085]
我々は、ある入力概念のセットに対して妥当な文を生成することを目的としているcommongenベンチマークに焦点を当てる。
生成したテキストの意味的正しさを高めるための戦略を提案する。
論文 参考訳(メタデータ) (2020-12-19T23:23:40Z) - FILTER: An Enhanced Fusion Method for Cross-lingual Language
Understanding [85.29270319872597]
我々は,XLMファインタニングの入力として言語間データを利用する拡張融合法を提案する。
推論中は、ターゲット言語で入力されたテキストとソース言語の翻訳に基づいて予測を行う。
この問題に対処するため,対象言語における翻訳テキストのための自動生成ソフト擬似ラベルに基づくモデル学習のためのKL分割自己学習損失を提案する。
論文 参考訳(メタデータ) (2020-09-10T22:42:15Z) - Machine learning approach of Japanese composition scoring and writing
aided system's design [0.0]
合成スコアシステムは、言語学習者を支援することができる。
何かを出力するプロセスにおいて、言語をリーン化するのです。
特に外国語学習者にとって、語彙内容と構文内容は、通常、彼らがより関心を持っているものである。
論文 参考訳(メタデータ) (2020-08-26T11:01:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。