論文の概要: Edit-level Majority Voting Mitigates Over-Correction in LLM-based Grammatical Error Correction
- arxiv url: http://arxiv.org/abs/2605.13624v1
- Date: Wed, 13 May 2026 14:52:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:28.117412
- Title: Edit-level Majority Voting Mitigates Over-Correction in LLM-based Grammatical Error Correction
- Title(参考訳): 編集レベル多数投票による文法的誤り訂正における過剰補正の軽減
- Authors: Takumi Goto, Yusuke Sakai, Taro Watanabe,
- Abstract要約: 大規模な言語モデルを用いた文法的誤り訂正は、しばしば過度な補正問題に悩まされる。
本研究では,1つのモデルから生成される複数の候補に対して,編集レベルの多数決を行う学習自由推論手法を提案する。
- 参考スコア(独自算出の注目度): 34.071151696990384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Grammatical error correction using large language models often suffers from the over-correction issue. To mitigate this, we propose a training-free inference method that performs edit-level majority voting over multiple candidates generated by a single model, without requiring model modifications or additional training. Across nine benchmarks covering English, Czech, German, Ukrainian, Korean, Hindi, and Romanian, the proposed method outperforms both greedy and MBR decoding in most cases. Moreover, it yields stable correction quality regardless of the instruction prompts used. We release two repository supporting GEC datasets loading and LLM inference.
- Abstract(参考訳): 大規模な言語モデルを用いた文法的誤り訂正は、しばしば過度な補正問題に悩まされる。
そこで本研究では,モデル修正や追加トレーニングを必要とせず,単一のモデルで生成した複数の候補に対して,編集レベルの多数決を行う学習自由推論手法を提案する。
英語、チェコ語、ドイツ語、ウクライナ語、韓国語、ヒンディー語、ルーマニア語を含む9つのベンチマークにおいて、提案手法はグリーディ法とMBR復号法の両方に優れる。
さらに、使用する命令プロンプトに関係なく、安定した補正品質が得られる。
GECデータセットのロードとLLM推論をサポートする2つのリポジトリをリリースする。
関連論文リスト
- Adapting LLMs for Minimal-edit Grammatical Error Correction [0.0]
本稿では,誤り率適応のトピックについて検討し,新しいトレーニングスケジュール法を提案する。
我々の実験は、BEA-testセット上の単一モデルシステムに対して、新しい最先端の結果を設定しました。
我々は、デトークン化されたデータセットのトレーニングが結果に影響を与えるかどうかを分析し、修正された誤例を用いてデータセットの使用の影響を計測する。
論文 参考訳(メタデータ) (2025-06-16T07:00:48Z) - Loss-Aware Curriculum Learning for Chinese Grammatical Error Correction [21.82403446634522]
中国語の文法的誤り訂正(CGEC)は、入力された中国語文の誤りを検出し、訂正することを目的としている。
現在のアプローチでは、修正の難しさはインスタンスによって異なり、これらのサンプルを等しく扱うことは無視されている。
この問題に対処する多粒度カリキュラム学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-31T08:11:49Z) - Prompting open-source and commercial language models for grammatical error correction of English learner text [18.496628725996406]
大規模言語モデル(LLM)は、流動的で文法的なテキストを生成するよう促すことができる。
確立したベンチマークデータセット上で, 文法的誤り訂正(GEC)におけるLLMの性能評価を行った。
いくつかのオープンソースモデルは、最小限の編集ベンチマークで商用モデルよりも優れており、いくつかの設定ではゼロショットプロンプトは、少数ショットプロンプトと同じくらい競争力がある。
論文 参考訳(メタデータ) (2024-01-15T14:19:47Z) - On the Calibration of Multilingual Question Answering LLMs [57.296161186129545]
複数の多言語大言語モデル(MLLM)のキャリブレーションを様々な質問応答タスクでベンチマークする。
本研究では,分布内,分布外,言語間移動設定におけるキャリブレーションの異なる次元について検討する。
LlaMa2のようなデコーダのみのLLMでは、コンテキスト内学習は多言語データの信頼性校正を改善する。
論文 参考訳(メタデータ) (2023-11-15T03:29:02Z) - TIM: Teaching Large Language Models to Translate with Comparison [78.66926087162672]
本稿では,LLMに翻訳学習を教えるために,サンプルを用いた新しいフレームワークを提案する。
我々のアプローチは、正しい翻訳例と間違った翻訳例をモデルに提示し、好みの損失を使ってモデルの学習をガイドすることである。
本研究は,翻訳タスクのための微調整LDMの新しい視点を提供し,高品質な翻訳を実現するための有望なソリューションを提供する。
論文 参考訳(メタデータ) (2023-07-10T08:15:40Z) - Rethinking Masked Language Modeling for Chinese Spelling Correction [70.85829000570203]
言語モデルと誤りモデルという2つの異なるモデルによる共同決定として,中国語のスペル補正(CSC)について検討する。
細調整されたBERTは、言語モデルに不適合なままエラーモデルに過度に適合する傾向にあり、その結果、分布外エラーパターンへの一般化が不十分であることがわかった。
微調整中に入力シーケンスから20%の非エラートークンをランダムにマスキングする非常に単純な戦略は、エラーモデルを犠牲にすることなく、はるかに優れた言語モデルを学ぶのに十分であることを示す。
論文 参考訳(メタデータ) (2023-05-28T13:19:12Z) - GRACE: Discriminator-Guided Chain-of-Thought Reasoning [75.35436025709049]
本稿では, 正しい推論手順を導出するために, GRACE (CorrectnEss Discriminator) を用いたチェーン・オブ・シークレット・リAsoningを提案する。
GRACEは、正しいステップと間違ったステップに対して対照的な損失で訓練された判別器を採用しており、復号時に次のステップ候補を採点するために使用される。
論文 参考訳(メタデータ) (2023-05-24T09:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。