論文の概要: A Language Model for Grammatical Error Correction in L2 Russian
- arxiv url: http://arxiv.org/abs/2307.01609v1
- Date: Tue, 4 Jul 2023 09:50:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 17:39:41.551775
- Title: A Language Model for Grammatical Error Correction in L2 Russian
- Title(参考訳): L2ロシア語における文法的誤り訂正のための言語モデル
- Authors: Nikita Remnev, Sergei Obiedkov, Ekaterina Rakhilina, Ivan Smirnov,
Anastasia Vyrenkova
- Abstract要約: 文法的誤り訂正は自然言語処理の基本課題の1つである。
ロシア語では、ほとんどのスペルチェッカーは正確なタイポスや他の単純なエラーを高い精度で利用できるが、非ネイティブ(L2)文字に直面すると失敗することが多い。
本稿では,L2ロシア文字の誤り訂正を目的とした言語モデルを含むパイプラインを提案する。
- 参考スコア(独自算出の注目度): 0.3149883354098941
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Grammatical error correction is one of the fundamental tasks in Natural
Language Processing. For the Russian language, most of the spellcheckers
available correct typos and other simple errors with high accuracy, but often
fail when faced with non-native (L2) writing, since the latter contains errors
that are not typical for native speakers. In this paper, we propose a pipeline
involving a language model intended for correcting errors in L2 Russian
writing. The language model proposed is trained on untagged texts of the
Newspaper subcorpus of the Russian National Corpus, and the quality of the
model is validated against the RULEC-GEC corpus.
- Abstract(参考訳): 文法的誤り訂正は自然言語処理の基本課題の1つである。
ロシア語では、ほとんどのスペルチェッカーは正確なタイポスやその他の単純なエラーを高精度で利用できるが、非ネイティブ(L2)文字に直面すると失敗することが多い。
本稿では,L2ロシア文字の誤り訂正を目的とした言語モデルを含むパイプラインを提案する。
提案する言語モデルは,ロシア国立コーパスの新聞サブコーパスの未タグテキストに基づいて学習し,その品質をRULEC-GECコーパスに対して検証する。
関連論文リスト
- A Coin Has Two Sides: A Novel Detector-Corrector Framework for Chinese Spelling Correction [79.52464132360618]
中国語のSpelling Correction(CSC)は、自然言語処理(NLP)の基本課題である。
本稿では,エラー検出・相関器の枠組みに基づく新しい手法を提案する。
我々の検出器は2つのエラー検出結果を得るように設計されており、それぞれ高精度とリコールが特徴である。
論文 参考訳(メタデータ) (2024-09-06T09:26:45Z) - Rectifier: Code Translation with Corrector via LLMs [11.38401806203093]
本稿では,翻訳誤りを修復するマイクロ・ユニバーサルモデルであるRectifierを提案する。
C++,Java,Python間の翻訳タスクの実験結果から,本モデルが有効な修復能力を有することが示された。
論文 参考訳(メタデータ) (2024-07-10T08:58:41Z) - Chinese Spelling Correction as Rephrasing Language Model [63.65217759957206]
文中のスペル誤りを検知し,訂正することを目的とした中国語スペル補正(CSC)について検討する。
現在の最先端の手法は、CSCをシーケンスタギングタスクと文対上の細いBERTベースのモデルとみなしている。
本稿では,文字から文字へのタグ付けではなく,追加のスロットを埋め込むことで文全体を言い換える言語モデル(ReLM)を提案する。
論文 参考訳(メタデータ) (2023-08-17T06:04:28Z) - Does Correction Remain A Problem For Large Language Models? [63.24433996856764]
本稿では,2つの実験を行ない,大規模言語モデルの文脈における補正の役割について検討する。
最初の実験では、誤り訂正のためのGPTのようなモデルを用いた数発の学習技術を用いて、単独のタスクとしての修正に焦点を当てた。
第2の実験では、あるレベルのノイズや誤りを含むテキストに対して、大きな言語モデルが許容し、適切に実行可能であるかどうかを検証し、他のNLPタスクの予備タスクとしての補正の概念について検討した。
論文 参考訳(メタデータ) (2023-08-03T14:09:31Z) - Byte-Level Grammatical Error Correction Using Synthetic and Curated
Corpora [0.0]
文法的誤り訂正(英: Grammatical error correction, GEC)とは、文字のタイプミス、スペル、句読点、文法的問題を訂正する作業である。
バイトレベルのモデルにより、サブワードアプローチよりも高い補正品質が得られることを示す。
論文 参考訳(メタデータ) (2023-05-29T06:35:40Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - Towards Lithuanian grammatical error correction [0.0]
我々は古風な特徴に富んだリトアニア語に対する文法的誤り訂正モデルを構築した。
サブワードとバイトレベルのアプローチを比較し、最高のトレーニングモデルを共有し、F$_0.5$=0.92を達成し、関連するコードをオンラインオープンソースリポジトリで共有します。
論文 参考訳(メタデータ) (2022-03-18T13:59:02Z) - Understanding by Understanding Not: Modeling Negation in Language Models [81.21351681735973]
否定は自然言語の中核構造である。
本稿では,否定された総称文に基づく不一致目的を用いて,言語モデリング目標の強化を提案する。
否定されたLAMAデータセットの平均top1エラー率を4%に削減します。
論文 参考訳(メタデータ) (2021-05-07T21:58:35Z) - Correcting Automated and Manual Speech Transcription Errors using Warped
Language Models [2.8614709576106874]
そこで本稿では,音声の書き起こしを訂正するために,ワープ言語モデルの頑健性を活かした新しい手法を提案する。
提案手法は,音声言語の自動書き起こしと手話書き起こしの両方の単語誤り率を最大10%削減できることを示す。
論文 参考訳(メタデータ) (2021-03-26T16:43:23Z) - On the Robustness of Language Encoders against Grammatical Errors [66.05648604987479]
我々は、非ネイティブ話者から実際の文法的誤りを収集し、これらの誤りをクリーンテキストデータ上でシミュレートするために敵攻撃を行う。
結果,全ての試験モデルの性能は影響するが,影響の程度は異なることがわかった。
論文 参考訳(メタデータ) (2020-05-12T11:01:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。