論文の概要: Scoring Edit Impact in Grammatical Error Correction via Embedded Association Graphs
- arxiv url: http://arxiv.org/abs/2604.06573v1
- Date: Wed, 08 Apr 2026 01:37:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.292247
- Title: Scoring Edit Impact in Grammatical Error Correction via Embedded Association Graphs
- Title(参考訳): 埋め込みアソシエーショングラフを用いた文法的誤り訂正におけるスコーリング編集の影響
- Authors: Qiyuan Xiao, Xiaoman Wang, Yunshi Lan,
- Abstract要約: 文法的誤り訂正(英: Grammatical Error Correction, GEC)は、誤り文を修正するための一連の編集を生成するシステムである。
これらの編集の質は、典型的には人間のアノテーションに対して評価される。
最近のメタ評価アプローチは、複数の参照にまたがって人間の判断に依存するが、大規模なデータセットにスケールすることは困難である。
本稿では,GECシステムによる編集の重要性を自動的に見積もる新しいタスク,Scoring Edit Impact in GECを提案する。
- 参考スコア(独自算出の注目度): 12.608012136037997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A Grammatical Error Correction (GEC) system produces a sequence of edits to correct an erroneous sentence. The quality of these edits is typically evaluated against human annotations. However, a sentence may admit multiple valid corrections, and existing evaluation settings do not fully accommodate diverse application scenarios. Recent meta-evaluation approaches rely on human judgments across multiple references, but they are difficult to scale to large datasets. In this paper, we propose a new task, Scoring Edit Impact in GEC, which aims to automatically estimate the importance of edits produced by a GEC system. To address this task, we introduce a scoring framework based on an embedded association graph. The graph captures latent dependencies among edits and syntactically related edits, grouping them into coherent groups. We then perform perplexity-based scoring to estimate each edit's contribution to sentence fluency. Experiments across 4 GEC datasets, 4 languages, and 4 GEC systems demonstrate that our method consistently outperforms a range of baselines. Further analysis shows that the embedded association graph effectively captures cross-linguistic structural dependencies among edits.
- Abstract(参考訳): 文法的誤り訂正(GEC)システムは、誤文を修正するための一連の編集を生成する。
これらの編集の質は、典型的には人間のアノテーションに対して評価される。
しかし、文は複数の有効な修正を許容でき、既存の評価設定は多様なアプリケーションシナリオに完全に適合しない。
最近のメタ評価アプローチは、複数の参照にまたがって人間の判断に依存するが、大規模なデータセットにスケールすることは困難である。
本稿では,GECシステムによる編集の重要度を自動的に推定する新しいタスク,Scoring Edit Impact in GECを提案する。
この課題に対処するために,組込みアソシエーショングラフに基づくスコアリングフレームワークを導入する。
このグラフは、編集と構文関連編集の間に潜伏した依存関係をキャプチャし、それらを一貫性のあるグループにグループ化する。
次に、パープレキシティに基づくスコアリングを行い、各編集の文流布に対する寄与を推定する。
4つのGECデータセット、4つの言語、および4つのGECシステムの実験は、我々の手法が一貫してベースラインよりも優れていることを示した。
さらなる分析により、組込みアソシエーショングラフは、編集間の言語間構造的依存関係を効果的にキャプチャすることを示している。
関連論文リスト
- Grammatical Error Correction Evaluation by Optimally Transporting Edit Representation [34.071151696990384]
本研究は,文法的誤り訂正(GEC)に特化して設計された編集に焦点をあてる。
本稿では,編集のための表現である編集ベクトルを提案し,これらの編集ベクトルを仮説から参照へ不均衡な最適輸送を用いて転送する新しい計量 UOT-ERRANT を提案する。
SEEDAメタ評価実験により、UOT-ERRANTは、特に+フルエンシ領域において、評価性能を向上させることが示された。
論文 参考訳(メタデータ) (2026-02-05T08:05:42Z) - ChartE$^{3}$: A Comprehensive Benchmark for End-to-End Chart Editing [64.65742943745866]
ChartE$3$はEnd-to-End Chart Editingベンチマークである。
中間的な自然言語プログラムやコードレベルの監視に頼ることなく、モデルを直接評価する。
1200以上の高品質なサンプルが、十分に設計されたデータパイプラインを通じて構築されている。
論文 参考訳(メタデータ) (2026-01-29T13:29:27Z) - Charts Are Not Images: On the Challenges of Scientific Chart Editing [66.38730113476677]
textitFigEditは、3万以上のサンプルからなる科学的フィギュア編集のベンチマークである。
私たちのベンチマークでは、ピクセルレベルの操作の重大な制限が示されています。
textitFigEdit をリリースすることにより,構造対応図形編集の体系的な進歩の実現を目指す。
論文 参考訳(メタデータ) (2025-11-30T06:13:48Z) - Improving Explainability of Sentence-level Metrics via Edit-level Attribution for Grammatical Error Correction [11.512856112792093]
本稿では,個々の編集に文レベルスコアを寄与させ,特定の修正が全体のパフォーマンスにどのように貢献するかを考察する。
既存の文レベルのメトリクスを用いた実験は、異なる編集粒度間で高い一貫性を示し、人間の評価と約70%の一致を示す。
さらに、帰属結果に基づいてメトリクスのバイアスを分析し、正書法編集を無視する傾向などの傾向を明らかにする。
論文 参考訳(メタデータ) (2024-12-17T17:31:17Z) - Failing Forward: Improving Generative Error Correction for ASR with Synthetic Data and Retrieval Augmentation [73.9145653659403]
生成誤差補正モデルは、トレーニング中に発生する特定の種類のエラーを超えて一般化することが困難であることを示す。
DARAGは、ドメイン内(ID)およびOODシナリオにおけるASRのためのGCCを改善するために設計された新しいアプローチである。
私たちのアプローチはシンプルでスケーラブルで、ドメインと言語に依存しません。
論文 参考訳(メタデータ) (2024-10-17T04:00:29Z) - Revisiting Meta-evaluation for Grammatical Error Correction [14.822205658480813]
SEEDAはGECメタ評価のための新しいデータセットである。
人間の評価を2つの異なる粒度で補正する。
その結果,既存の研究では編集基準が過小評価されていた可能性が示唆された。
論文 参考訳(メタデータ) (2024-03-05T05:53:09Z) - CLEME: Debiasing Multi-reference Evaluation for Grammatical Error
Correction [32.44051877804761]
チャンクレベル多重参照評価(CLEME)は,多参照評価設定において文法誤り訂正(GEC)システムを評価するように設計されている。
我々は、CoNLL-2014共有タスクに基づく6つの英語参照セットの実験を行う。
論文 参考訳(メタデータ) (2023-05-18T08:57:17Z) - A Syntax-Guided Grammatical Error Correction Model with Dependency Tree
Correction [83.14159143179269]
文法的誤り訂正(英: Grammatical Error Correction, GEC)は、文中の文法的誤りを検出し、訂正するタスクである。
本稿では,依存木の構文知識を利用するためのグラフアテンション機構を採用した構文誘導型GECモデル(SG-GEC)を提案する。
我々は、GECタスクの公開ベンチマークでモデルを評価し、競争結果を得る。
論文 参考訳(メタデータ) (2021-11-05T07:07:48Z) - LM-Critic: Language Models for Unsupervised Grammatical Error Correction [128.9174409251852]
文を文法的に判断する LM-Critic の定義において,事前訓練された言語モデル (LM) の活用法を示す。
このLM-Critic と BIFI と、ラベルなし文の集合を併用して、現実的な非文法的/文法的ペアをブートストラップし、修正子を訓練する。
論文 参考訳(メタデータ) (2021-09-14T17:06:43Z) - A Self-Refinement Strategy for Noise Reduction in Grammatical Error
Correction [54.569707226277735]
既存の文法的誤り訂正(GEC)のアプローチは、手動で作成したGECデータセットによる教師あり学習に依存している。
誤りが不適切に編集されたり、修正されなかったりする「ノイズ」は無視できないほどある。
本稿では,既存のモデルの予測整合性を利用して,これらのデータセットをデノマイズする自己補充手法を提案する。
論文 参考訳(メタデータ) (2020-10-07T04:45:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。