論文の概要: COLA-GEC: A Bidirectional Framework for Enhancing Grammatical Acceptability and Error Correction
- arxiv url: http://arxiv.org/abs/2507.11867v1
- Date: Wed, 16 Jul 2025 03:29:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.212258
- Title: COLA-GEC: A Bidirectional Framework for Enhancing Grammatical Acceptability and Error Correction
- Title(参考訳): COLA-GEC: 文法的受容性と誤り訂正を強化する双方向フレームワーク
- Authors: Xiangyu Yang, Xinying Qiu,
- Abstract要約: 本稿では,相互知識伝達により両タスクを増強する新しい双方向フレームワークであるCOLA-GECを紹介する。
まず、GECデータセットを用いて文法的受容性モデルを拡張し、複数の言語間での性能を大幅に改善する。
第2に、動的損失関数を用いてGECモデルトレーニングに文法的受容性信号を統合することにより、文法的に許容できる出力に対する補正を効果的に導く。
- 参考スコア(独自算出の注目度): 2.631955426232593
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Grammatical Error Correction (GEC) and grammatical acceptability judgment (COLA) are core tasks in natural language processing, sharing foundational grammatical knowledge yet typically evolving independently. This paper introduces COLA-GEC, a novel bidirectional framework that enhances both tasks through mutual knowledge transfer. First, we augment grammatical acceptability models using GEC datasets, significantly improving their performance across multiple languages. Second, we integrate grammatical acceptability signals into GEC model training via a dynamic loss function, effectively guiding corrections toward grammatically acceptable outputs. Our approach achieves state-of-the-art results on several multilingual benchmarks. Comprehensive error analysis highlights remaining challenges, particularly in punctuation error correction, providing insights for future improvements in grammatical modeling.
- Abstract(参考訳): 文法的誤り訂正(英: Grammatical Error Correction、GEC)と文法的受容性判定(英: grammatical acceptability judgment、COLA)は、自然言語処理における中核的なタスクであり、基礎的な文法的知識を共有しながら、通常は独立に進化している。
本稿では,相互知識伝達により両タスクを増強する新しい双方向フレームワークであるCOLA-GECを紹介する。
まず、GECデータセットを用いて文法的受容性モデルを拡張し、複数の言語間での性能を大幅に改善する。
第2に、動的損失関数を用いてGECモデルトレーニングに文法的受容性信号を統合することにより、文法的に許容できる出力に対する補正を効果的に導く。
提案手法は,複数の多言語ベンチマークにおける最先端結果を実現する。
包括的誤り解析は、特に句読点誤り訂正における残りの課題を強調し、文法モデリングにおける将来の改善についての洞察を提供する。
関連論文リスト
- Corrections Meet Explanations: A Unified Framework for Explainable Grammatical Error Correction [29.583603444317855]
本稿では,説明・修正タスクを生成的に統合した統一的な説明可能なGECフレームワークであるEXGECを紹介する。
様々なNLPモデル(BART、T5、Llama3)の結果、EXGECモデルは両方のタスクにおいてシングルタスクベースラインを超えている。
論文 参考訳(メタデータ) (2025-02-21T07:42:33Z) - Detection-Correction Structure via General Language Model for Grammatical Error Correction [22.609760120265587]
本稿では,汎用言語モデル(GLM)に基づく,DeCoGLMという統合された検出補正構造を提案する。
検出フェーズはフォールトトレラント検出テンプレートを使用し、補正フェーズは自己回帰マスクの埋め込みを利用して局所的な誤り訂正を行う。
我々のモデルは、英語と中国語のECデータセットの最先端モデルと競合する性能を示す。
論文 参考訳(メタデータ) (2024-05-28T04:04:40Z) - Grammatical Error Correction via Mixed-Grained Weighted Training [68.94921674855621]
文法的誤り訂正(英: Grammatical Error Correction, GEC)は、自然文における文法的誤りを自動的に補正することを目的としている。
MainGECは、データアノテーションの正確性と潜在的な多様性の固有の相違に基づいて、トークンレベルおよび文レベルトレーニングウェイトを設計する。
論文 参考訳(メタデータ) (2023-11-23T08:34:37Z) - Generative error correction for code-switching speech recognition using
large language models [49.06203730433107]
コードスイッチング(英: Code-switching, CS)とは、2つ以上の言語が同じ文内に混在する現象である。
本稿では,大規模言語モデル (LLM) と ASR が生成する仮説のリストを利用して,CS 問題に対処することを提案する。
論文 参考訳(メタデータ) (2023-10-17T14:49:48Z) - Enhancing Grammatical Error Correction Systems with Explanations [45.69642286275681]
文法的誤り訂正システムは、言語誤りを検出し、修正することで、文字によるコミュニケーションを改善する。
本稿では,エビデンスワードと文法的誤り型を付加したデータセットEXPECTを紹介する。
人間の評価により,GECシステムの説明は,訂正提案を受理するか否かを判断する第2言語学習者を支援することができる。
論文 参考訳(メタデータ) (2023-05-25T03:00:49Z) - A Unified Strategy for Multilingual Grammatical Error Correction with
Pre-trained Cross-Lingual Language Model [100.67378875773495]
本稿では,多言語文法的誤り訂正のための汎用的かつ言語に依存しない戦略を提案する。
我々の手法は言語固有の操作を使わずに多様な並列GECデータを生成する。
NLPCC 2018 Task 2のデータセット(中国語)で最先端の結果を達成し、Falko-Merlin(ドイツ語)とRULEC-GEC(ロシア語)の競合性能を得る。
論文 参考訳(メタデータ) (2022-01-26T02:10:32Z) - A Syntax-Guided Grammatical Error Correction Model with Dependency Tree
Correction [83.14159143179269]
文法的誤り訂正(英: Grammatical Error Correction, GEC)は、文中の文法的誤りを検出し、訂正するタスクである。
本稿では,依存木の構文知識を利用するためのグラフアテンション機構を採用した構文誘導型GECモデル(SG-GEC)を提案する。
我々は、GECタスクの公開ベンチマークでモデルを評価し、競争結果を得る。
論文 参考訳(メタデータ) (2021-11-05T07:07:48Z) - Improving the Efficiency of Grammatical Error Correction with Erroneous
Span Detection and Correction [106.63733511672721]
ESD(Eroneous Span Detection)とESC(Eroneous Span Correction)の2つのサブタスクに分割することで、文法的誤り訂正(GEC)の効率を改善するための言語に依存しない新しいアプローチを提案する。
ESDは、効率的なシーケンスタグ付けモデルを用いて文法的に誤りテキストスパンを識別する。ESCは、Seq2seqモデルを利用して、注釈付き誤字スパンの文を入力として取り、これらのスパンの修正テキストのみを出力する。
実験の結果,提案手法は英語と中国語のGECベンチマークにおいて従来のセク2seq手法と同等に動作し,推論に要するコストは50%以下であった。
論文 参考訳(メタデータ) (2020-10-07T08:29:11Z) - Towards Minimal Supervision BERT-based Grammar Error Correction [81.90356787324481]
我々は、事前訓練された言語モデルからコンテキスト情報を取り入れて、アノテーションを活用し、多言語シナリオの恩恵を得ようとしている。
その結果、文法的誤り訂正タスクにおいて、変換器(BERT)からの双方向表現の強い可能性を示す。
論文 参考訳(メタデータ) (2020-01-10T15:45:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。