論文の概要: ChineseErrorCorrector3-4B: State-of-the-Art Chinese Spelling and Grammar Corrector
- arxiv url: http://arxiv.org/abs/2511.17562v1
- Date: Thu, 13 Nov 2025 09:18:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.278858
- Title: ChineseErrorCorrector3-4B: State-of-the-Art Chinese Spelling and Grammar Corrector
- Title(参考訳): ChineseErrorCorrector3-4B:-the-the-Art Chinese Spelling and Grammar Corrector
- Authors: Wei Tian, YuhaoZhou,
- Abstract要約: 本稿では,Qwen3-4Bに基づく中国語スペルと文法的誤り訂正のための統一モデルである ChineseErrorCorrector3-4B を紹介する。
このモデルは、一般的なテキスト修正作業において優れた性能を示し、スペル訂正(CSC)と文法補正(CGC)の両方において最先端の結果を達成する。
SIGHAN-2015、EC-LAW、MCSC、NACGECなど、いくつかの権威あるベンチマークデータセットでは、モデルのF1とF0.5スコアが既存の公開モデルを大幅に上回っている。
- 参考スコア(独自算出の注目度): 14.794644086163458
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces ChineseErrorCorrector3-4B, a unified model for Chinese spelling and grammatical error correction based on Qwen3-4B. The model demonstrates outstanding performance in general text correction tasks and achieves state-of-the-art results in both spelling correction (CSC) and grammatical correction (CGC). On several authoritative benchmark datasets -- including SIGHAN-2015, EC-LAW, MCSC, and NaCGEC -- the model's F1 and F0.5 scores significantly surpass existing publicly available models, ranking first in both spelling and grammatical error correction tasks.
- Abstract(参考訳): 本稿では,Qwen3-4Bに基づく中国語スペルと文法的誤り訂正のための統一モデルである ChineseErrorCorrector3-4B を紹介する。
このモデルは、一般的なテキスト修正タスクにおいて優れた性能を示し、スペル訂正(CSC)と文法補正(CGC)の両方において最先端の結果を達成する。
SIGHAN-2015、EC-LAW、MCSC、NACGECなど、いくつかの権威あるベンチマークデータセットでは、モデルのF1とF0.5スコアが既存の公開モデルを大幅に上回り、スペルと文法上の誤り訂正タスクの両方でランクインしている。
関連論文リスト
- EdaCSC: Two Easy Data Augmentation Methods for Chinese Spelling Correction [0.0]
Chinese Spelling Correction (CSC) は、音韻的・視覚的類似性に起因する中国語文の綴り誤りを検出し、訂正することを目的としている。
これらの制約に対処する2つのデータ拡張手法を提案する。
まず,長文を短い文に分割するか,複数文字の文の型を減らしてデータセットを増強する。
論文 参考訳(メタデータ) (2024-09-08T14:29:10Z) - Chinese Spelling Correction as Rephrasing Language Model [63.65217759957206]
文中のスペル誤りを検知し,訂正することを目的とした中国語スペル補正(CSC)について検討する。
現在の最先端の手法は、CSCをシーケンスタギングタスクと文対上の細いBERTベースのモデルとみなしている。
本稿では,文字から文字へのタグ付けではなく,追加のスロットを埋め込むことで文全体を言い換える言語モデル(ReLM)を提案する。
論文 参考訳(メタデータ) (2023-08-17T06:04:28Z) - Rethinking Masked Language Modeling for Chinese Spelling Correction [70.85829000570203]
言語モデルと誤りモデルという2つの異なるモデルによる共同決定として,中国語のスペル補正(CSC)について検討する。
細調整されたBERTは、言語モデルに不適合なままエラーモデルに過度に適合する傾向にあり、その結果、分布外エラーパターンへの一般化が不十分であることがわかった。
微調整中に入力シーケンスから20%の非エラートークンをランダムにマスキングする非常に単純な戦略は、エラーモデルを犠牲にすることなく、はるかに優れた言語モデルを学ぶのに十分であることを示す。
論文 参考訳(メタデータ) (2023-05-28T13:19:12Z) - FCGEC: Fine-Grained Corpus for Chinese Grammatical Error Correction [6.116341682577877]
近年,文法的誤り訂正 (GEC) が自動修正・校正システムに広く応用されている。
文法的誤りを検出し,特定し,修正するための微粒なコーパスである FCGEC を提案する。
論文 参考訳(メタデータ) (2022-10-22T06:29:05Z) - Improving Chinese Spelling Check by Character Pronunciation Prediction:
The Effects of Adaptivity and Granularity [76.20568599642799]
中国語のスペルチェック(英語: Chinese spelling check, CSC)は、中国語のテキスト中のスペルエラーを検出し修正する基本的なNLPタスクである。
本稿では,CSCを改善するために中国語発音予測(CPP)の補助的タスクを導入することを検討する。
本稿では,共有エンコーダの2つの並列デコーダ上に構築したSCOPEを提案する。
論文 参考訳(メタデータ) (2022-10-20T03:42:35Z) - LM-Critic: Language Models for Unsupervised Grammatical Error Correction [128.9174409251852]
文を文法的に判断する LM-Critic の定義において,事前訓練された言語モデル (LM) の活用法を示す。
このLM-Critic と BIFI と、ラベルなし文の集合を併用して、現実的な非文法的/文法的ペアをブートストラップし、修正子を訓練する。
論文 参考訳(メタデータ) (2021-09-14T17:06:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。