Fugu-MT 論文翻訳(概要): Improving the Efficiency of Grammatical Error Correction with Erroneous Span Detection and Correction

論文の概要: Improving the Efficiency of Grammatical Error Correction with Erroneous Span Detection and Correction

arxiv url: http://arxiv.org/abs/2010.03260v1
Date: Wed, 7 Oct 2020 08:29:11 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-09 23:11:30.566416
Title: Improving the Efficiency of Grammatical Error Correction with Erroneous Span Detection and Correction
Title（参考訳）: 誤スパン検出と補正による文法的誤り訂正の効率向上
Authors: Mengyun Chen, Tao Ge, Xingxing Zhang, Furu Wei, Ming Zhou
Abstract要約: ESD(Eroneous Span Detection)とESC(Eroneous Span Correction)の2つのサブタスクに分割することで、文法的誤り訂正(GEC)の効率を改善するための言語に依存しない新しいアプローチを提案する。 ESDは、効率的なシーケンスタグ付けモデルを用いて文法的に誤りテキストスパンを識別する。ESCは、Seq2seqモデルを利用して、注釈付き誤字スパンの文を入力として取り、これらのスパンの修正テキストのみを出力する。実験の結果,提案手法は英語と中国語のGECベンチマークにおいて従来のセク2seq手法と同等に動作し,推論に要するコストは50%以下であった。
参考スコア（独自算出の注目度）: 106.63733511672721
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We propose a novel language-independent approach to improve the efficiency for Grammatical Error Correction (GEC) by dividing the task into two subtasks: Erroneous Span Detection (ESD) and Erroneous Span Correction (ESC). ESD identifies grammatically incorrect text spans with an efficient sequence tagging model. Then, ESC leverages a seq2seq model to take the sentence with annotated erroneous spans as input and only outputs the corrected text for these spans. Experiments show our approach performs comparably to conventional seq2seq approaches in both English and Chinese GEC benchmarks with less than 50% time cost for inference.
Abstract（参考訳）: 本稿では, 文法的誤り訂正(GEC)の効率性を改善するために, タスクを2つのサブタスクに分割し, 誤り検出(ESD)と誤訂正(ESC)の2つに分割する手法を提案する。 ESDは、効率の良いシーケンスタグ付けモデルで文法的に誤りなテキストを識別する。次に、ESCはSeq2seqモデルを利用して、注釈付き誤字の文を入力として取り、修正されたテキストのみを出力する。実験により,提案手法は従来のseq2seq法と英語と中国語のgecベンチマークで比較可能であり,推論に50%以下の時間コストがかかることを示した。

関連論文リスト

COLA-GEC: A Bidirectional Framework for Enhancing Grammatical Acceptability and Error Correction [2.631955426232593]
本稿では,相互知識伝達により両タスクを増強する新しい双方向フレームワークであるCOLA-GECを紹介する。まず、GECデータセットを用いて文法的受容性モデルを拡張し、複数の言語間での性能を大幅に改善する。第2に、動的損失関数を用いてGECモデルトレーニングに文法的受容性信号を統合することにより、文法的に許容できる出力に対する補正を効果的に導く。
論文参考訳（メタデータ） (2025-07-16T03:29:05Z)
EdaCSC: Two Easy Data Augmentation Methods for Chinese Spelling Correction [0.0]
Chinese Spelling Correction (CSC) は、音韻的・視覚的類似性に起因する中国語文の綴り誤りを検出し、訂正することを目的としている。これらの制約に対処する2つのデータ拡張手法を提案する。まず,長文を短い文に分割するか,複数文字の文の型を減らしてデータセットを増強する。
論文参考訳（メタデータ） (2024-09-08T14:29:10Z)
A Coin Has Two Sides: A Novel Detector-Corrector Framework for Chinese Spelling Correction [79.52464132360618]
中国語のSpelling Correction(CSC)は、自然言語処理(NLP)の基本課題である。本稿では,エラー検出・相関器の枠組みに基づく新しい手法を提案する。我々の検出器は2つのエラー検出結果を得るように設計されており、それぞれ高精度とリコールが特徴である。
論文参考訳（メタデータ） (2024-09-06T09:26:45Z)
LM-Combiner: A Contextual Rewriting Model for Chinese Grammatical Error Correction [49.0746090186582]
過剰補正は中国の文法的誤り訂正(CGEC)タスクにおいて重要な問題である。モデルアンサンブル法による最近の研究は、過剰補正を効果的に軽減し、ECCシステムの精度を向上させることができる。本稿では,GECシステム出力の過度補正をモデルアンサンブルなしで直接修正できる書き換えモデルLM-Combinerを提案する。
論文参考訳（メタデータ） (2024-03-26T06:12:21Z)
Improving Seq2Seq Grammatical Error Correction via Decoding Interventions [40.52259641181596]
本稿では,外部批判を駆使して生成するトークンの妥当性を段階的に評価する統合デコード介入フレームワークを提案する。我々は、事前訓練された言語モデル評論家と、段階的なターゲット側の文法的誤り検出批評家の2つのタイプの批判を発見し、調査する。我々のフレームワークは一貫して強いベースラインを上回り、最先端の手法と競合する結果を得る。
論文参考訳（メタデータ） (2023-10-23T03:36:37Z)
Chinese Spelling Correction as Rephrasing Language Model [63.65217759957206]
文中のスペル誤りを検知し,訂正することを目的とした中国語スペル補正(CSC)について検討する。現在の最先端の手法は、CSCをシーケンスタギングタスクと文対上の細いBERTベースのモデルとみなしている。本稿では,文字から文字へのタグ付けではなく,追加のスロットを埋め込むことで文全体を言い換える言語モデル(ReLM)を提案する。
論文参考訳（メタデータ） (2023-08-17T06:04:28Z)
From Spelling to Grammar: A New Framework for Chinese Grammatical Error Correction [12.170714706174314]
中国語の文法的誤り訂正(CGEC)は、誤ったシーケンスから正しい文を生成することを目的としている。本稿では,CGECタスクをスペル誤り訂正と文法的誤り訂正という2つのステップに分割する。本稿では,スペル誤り訂正のためのゼロショット手法を提案する。文法的誤り訂正に対処するため、ニューラルネットワークモデルを強化するために、部分音声特徴と意味クラス特徴を設計する。
論文参考訳（メタデータ） (2022-11-03T07:30:09Z)
A Syntax-Guided Grammatical Error Correction Model with Dependency Tree Correction [83.14159143179269]
文法的誤り訂正(英: Grammatical Error Correction, GEC)は、文中の文法的誤りを検出し、訂正するタスクである。本稿では,依存木の構文知識を利用するためのグラフアテンション機構を採用した構文誘導型GECモデル(SG-GEC)を提案する。我々は、GECタスクの公開ベンチマークでモデルを評価し、競争結果を得る。
論文参考訳（メタデータ） (2021-11-05T07:07:48Z)
FastCorrect 2: Fast Error Correction on Multiple Candidates for Automatic Speech Recognition [92.12910821300034]
本稿では,複数のASR候補を入力として取り込んだ誤り訂正モデルFastCorrect 2を提案する。 FastCorrect 2は、カスケードされた再描画と修正パイプラインよりも優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (2021-09-29T13:48:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。