論文の概要: Some Grammatical Errors are Frequent, Others are Important
- arxiv url: http://arxiv.org/abs/2205.05730v1
- Date: Wed, 11 May 2022 18:59:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-14 04:54:51.078868
- Title: Some Grammatical Errors are Frequent, Others are Important
- Title(参考訳): 文法エラーは頻度が高いもの、重要なもの
- Authors: Leshem Choshen, Ofir Shifman, Omri Abend
- Abstract要約: いくつかの稀なエラーは混乱していると見なされるが、他の一般的なエラーはそうではない。
これは、システムと評価の両方を改善するための可能な方向に影響する。
- 参考スコア(独自算出の注目度): 32.922128367314194
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In Grammatical Error Correction, systems are evaluated by the number of
errors they correct. However, no one has assessed whether all error types are
equally important. We provide and apply a method to quantify the importance of
different grammatical error types to humans. We show that some rare errors are
considered disturbing while other common ones are not. This affects possible
directions to improve both systems and their evaluation.
- Abstract(参考訳): 文法的誤り訂正では、システムは正しい誤りの数によって評価される。
しかし、すべてのエラータイプが等しく重要であるかどうかを誰も評価していない。
ヒトに対する異なる文法的誤り型の重要性を定量化する手法を提案および適用する。
いくつかの稀なエラーは混乱していると見なされるが、他の一般的なエラーはそうではない。
これはシステムと評価の両方を改善するための可能な方向に影響する。
関連論文リスト
- An Annotated Dataset of Errors in Premodern Greek and Baselines for Detecting Them [25.238651933622773]
我々は、前近代ギリシア語で実際の誤りの最初のデータセットを紹介した。
このデータセットを作成するために、BERT条件から派生したメトリクスを使用して、エラーを含む可能性が高い単語1000語をサンプリングする。
論文 参考訳(メタデータ) (2024-10-14T20:30:54Z) - A Coin Has Two Sides: A Novel Detector-Corrector Framework for Chinese Spelling Correction [79.52464132360618]
中国語のSpelling Correction(CSC)は、自然言語処理(NLP)の基本課題である。
本稿では,エラー検出・相関器の枠組みに基づく新しい手法を提案する。
我々の検出器は2つのエラー検出結果を得るように設計されており、それぞれ高精度とリコールが特徴である。
論文 参考訳(メタデータ) (2024-09-06T09:26:45Z) - GEE! Grammar Error Explanation with Large Language Models [64.16199533560017]
本稿では,文法的誤りを1対の誤り文と訂正文に1文で説明する必要がある文法的誤り説明の課題を提案する。
文法的誤り説明における GPT-4 の能力を解析し, ワンショットプロンプトを用いた60.2% の誤り説明しか生成しないことを確認した。
我々は、構造化されたアトミックトークンの編集を行うために、微調整された大規模言語モデルを活用する2段階のパイプラインを開発した。
論文 参考訳(メタデータ) (2023-11-16T02:45:47Z) - Rule-Based Error Classification for Analyzing Differences in Frequent
Errors [0.0]
我々は、95,631の符号対の誤りを分類し、オンラインの判定システムにおいて、様々なレベルのプログラマが提出した平均3.47の誤りを識別する。
解析結果から, 初心者による誤りは, プログラミングの知識不足によるものであることがわかった。
一方、専門家が犯した誤りは、問題を読むことの不注意や、通常とは異なる問題解決の課題に起因する誤解によるものである。
論文 参考訳(メタデータ) (2023-11-01T13:36:20Z) - Enhancing Grammatical Error Correction Systems with Explanations [45.69642286275681]
文法的誤り訂正システムは、言語誤りを検出し、修正することで、文字によるコミュニケーションを改善する。
本稿では,エビデンスワードと文法的誤り型を付加したデータセットEXPECTを紹介する。
人間の評価により,GECシステムの説明は,訂正提案を受理するか否かを判断する第2言語学習者を支援することができる。
論文 参考訳(メタデータ) (2023-05-25T03:00:49Z) - A Syntax-Guided Grammatical Error Correction Model with Dependency Tree
Correction [83.14159143179269]
文法的誤り訂正(英: Grammatical Error Correction, GEC)は、文中の文法的誤りを検出し、訂正するタスクである。
本稿では,依存木の構文知識を利用するためのグラフアテンション機構を採用した構文誘導型GECモデル(SG-GEC)を提案する。
我々は、GECタスクの公開ベンチマークでモデルを評価し、競争結果を得る。
論文 参考訳(メタデータ) (2021-11-05T07:07:48Z) - A Simple and Practical Approach to Improve Misspellings in OCR Text [0.0]
本稿では,OCRテキストにおける非単語誤りの同定と訂正に焦点を当てる。
従来のN-gram補正法は、1ワード誤りを効果的に処理できる。
本稿では,分割およびマージエラーを処理可能な教師なし手法を開発する。
論文 参考訳(メタデータ) (2021-06-22T19:38:17Z) - Classifying Syntactic Errors in Learner Language [32.93997096837712]
本稿では,文の形態的構造が変化した誤りを学習者の言語で分類する手法を提案する。
この手法は確立されたUniversal Dependencies構文表現スキームに基づいて構築され、他のエラー分類システムに補完情報を提供する。
論文 参考訳(メタデータ) (2020-10-21T14:28:22Z) - On the Robustness of Language Encoders against Grammatical Errors [66.05648604987479]
我々は、非ネイティブ話者から実際の文法的誤りを収集し、これらの誤りをクリーンテキストデータ上でシミュレートするために敵攻撃を行う。
結果,全ての試験モデルの性能は影響するが,影響の程度は異なることがわかった。
論文 参考訳(メタデータ) (2020-05-12T11:01:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。