論文の概要: Personalizing Grammatical Error Correction: Adaptation to Proficiency
Level and L1
- arxiv url: http://arxiv.org/abs/2006.02964v1
- Date: Thu, 4 Jun 2020 15:47:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 10:01:38.802104
- Title: Personalizing Grammatical Error Correction: Adaptation to Proficiency
Level and L1
- Title(参考訳): 文法的誤り訂正のパーソナライズ:習熟度とL1への適応
- Authors: Maria Nadejde and Joel Tetreault
- Abstract要約: 文法誤り訂正(GEC)システムは、様々なソフトウェアアプリケーションで広く使われている。
本稿では,汎用型ニューラルGECシステムに習熟度と書き手の第一言語の両方を適応させるための最初の結果を示す。
- 参考スコア(独自算出の注目度): 0.01269104766024433
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Grammar error correction (GEC) systems have become ubiquitous in a variety of
software applications, and have started to approach human-level performance for
some datasets. However, very little is known about how to efficiently
personalize these systems to the user's characteristics, such as their
proficiency level and first language, or to emerging domains of text. We
present the first results on adapting a general-purpose neural GEC system to
both the proficiency level and the first language of a writer, using only a few
thousand annotated sentences. Our study is the broadest of its kind, covering
five proficiency levels and twelve different languages, and comparing three
different adaptation scenarios: adapting to the proficiency level only, to the
first language only, or to both aspects simultaneously. We show that tailoring
to both scenarios achieves the largest performance improvement (3.6 F0.5)
relative to a strong baseline.
- Abstract(参考訳): 文法エラー訂正(GEC)システムは、様々なソフトウェアアプリケーションで広く普及し、いくつかのデータセットに対して人間レベルのパフォーマンスにアプローチし始めた。
しかし、これらのシステムを、習熟度や第一言語、新しいテキスト領域など、ユーザの特性に効率よくパーソナライズする方法については、ほとんど分かっていない。
本稿では,数千文の注釈文を用いて,汎用神経gecシステムを文の習熟度レベルと第1言語の両方に適応させる最初の結果を示す。
本研究は,5つの習熟レベルと12の異なる言語を網羅し,習熟レベルのみへの適応,第一言語のみへの適応,両言語同時適応という3つの異なる適応シナリオを比較した。
両シナリオの調整により,強いベースラインに対して最大の性能向上(3.6F0.5)が得られることを示す。
関連論文リスト
- A Weakly Supervised Data Labeling Framework for Machine Lexical Normalization in Vietnamese Social Media [1.053698976085779]
本研究では,ソーシャルメディアテキストにおける語彙正規化の課題に対処する,革新的な自動ラベリングフレームワークを提案する。
本稿では,半教師付き学習と弱監督技術を統合するフレームワークを提案する。
我々のフレームワークは、非標準語彙を標準化形式に変換することによって、生データを自動的にラベル付けする。
論文 参考訳(メタデータ) (2024-09-30T16:26:40Z) - Homogeneous Speaker Features for On-the-Fly Dysarthric and Elderly Speaker Adaptation [71.31331402404662]
本稿では, 変形性関節症と高齢者の話者レベルの特徴を学習するための2つの新しいデータ効率手法を提案する。
話者規則化スペクトルベース埋め込み-SBE特徴は、特別な正規化項を利用して適応における話者特徴の均一性を強制する。
テスト時間適応において、話者レベルのデータ量に敏感であることが示されるVR-LH機能に規定されている特徴ベースの学習隠れユニットコントリビューション(f-LHUC)。
論文 参考訳(メタデータ) (2024-07-08T18:20:24Z) - An Initial Investigation of Language Adaptation for TTS Systems under Low-resource Scenarios [76.11409260727459]
本稿では,最近のSSLベースの多言語TSシステムであるZMM-TTSの言語適応性について検討する。
本研究では,事前学習言語と対象言語との音声学的な類似性が,対象言語の適応性能に影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2024-06-13T08:16:52Z) - Analyzing and Adapting Large Language Models for Few-Shot Multilingual
NLU: Are We There Yet? [82.02076369811402]
教師付きファインチューニング(SFT)、教師付きインストラクションチューニング(SIT)、インコンテキストラーニング(ICL)は、3つの代替であり、事実上の標準的アプローチである。
提案手法は,6つの高・低リソース言語,3つの異なるNLUタスク,多種多様な言語とドメインのセットアップを用いて,3つのアプローチを網羅的かつ体系的に比較する。
そこで本研究では,教師あり指導のチューニングが,性能とリソース要件の最良のトレードオフであることを示す。
論文 参考訳(メタデータ) (2024-03-04T10:48:13Z) - Bag of Tricks for Effective Language Model Pretraining and Downstream
Adaptation: A Case Study on GLUE [93.98660272309974]
このレポートでは、ジェネラル言語理解評価のリーダーボードに関するVega v1を簡潔に紹介します。
GLUEは、質問応答、言語受容性、感情分析、テキスト類似性、パラフレーズ検出、自然言語推論を含む9つの自然言語理解タスクのコレクションである。
最適化された事前学習と微調整の戦略により、13億のモデルは4/9タスクに新しい最先端のタスクを設定し、91.3の平均スコアを達成しました。
論文 参考訳(メタデータ) (2023-02-18T09:26:35Z) - Detecting Text Formality: A Study of Text Classification Approaches [78.11745751651708]
本研究は,統計的,ニューラルベース,トランスフォーマーベースの機械学習手法に基づく形式性検出手法の体系的研究を初めて行う。
単言語,多言語,言語横断の3種類の実験を行った。
本研究は,モノリンガルおよび多言語形式分類タスクのためのトランスフォーマーベースモデルに対するChar BiLSTMモデルの克服を示す。
論文 参考訳(メタデータ) (2022-04-19T16:23:07Z) - Adapt-and-Adjust: Overcoming the Long-Tail Problem of Multilingual
Speech Recognition [58.849768879796905]
エンドツーエンドの多言語音声認識のためのトランスフォーマーベースマルチタスク学習フレームワークであるAdapt-and-Adjust (A2)を提案する。
A2フレームワークは,(1) 訓練済み多言語言語モデル (mBERT) を利用して低リソース言語の性能を向上させる,(2) 言語固有の適応と言語に依存しない2つのアダプタを最小限の追加パラメータで提案する,(3) クラス不均衡を克服する,という3つの手法で解決する。
論文 参考訳(メタデータ) (2020-12-03T03:46:16Z) - A Comprehensive Survey of Grammar Error Correction [10.251356177014756]
文法誤り訂正(GEC)は自然言語処理技術の重要な応用分野である。
過去10年間、機械学習とディープラーニングの普及のために、ECCで大きな進歩を遂げてきた。
本研究は,本分野の文献を総合的に考察するための第1回調査である。
論文 参考訳(メタデータ) (2020-05-02T04:46:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。