論文の概要: Leveraging Denoised Abstract Meaning Representation for Grammatical
Error Correction
- arxiv url: http://arxiv.org/abs/2307.02127v1
- Date: Wed, 5 Jul 2023 09:06:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 14:22:34.968156
- Title: Leveraging Denoised Abstract Meaning Representation for Grammatical
Error Correction
- Title(参考訳): 文法的誤り訂正のための難解な抽象的意味表現の活用
- Authors: Hejing Cao and Dongyan Zhao
- Abstract要約: 文法的誤り訂正(英: Grammatical Error Correction, GEC)とは、誤りのある文を文法的に正しい、意味的に一貫性のある、一貫性のある文に修正する作業である。
本稿では,AMRを付加知識として組み込んだSeq-to-seqモデルであるAMR-GECを提案する。
- 参考スコア(独自算出の注目度): 53.55440811942249
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Grammatical Error Correction (GEC) is the task of correcting errorful
sentences into grammatically correct, semantically consistent, and coherent
sentences. Popular GEC models either use large-scale synthetic corpora or use a
large number of human-designed rules. The former is costly to train, while the
latter requires quite a lot of human expertise. In recent years, AMR, a
semantic representation framework, has been widely used by many natural
language tasks due to its completeness and flexibility. A non-negligible
concern is that AMRs of grammatically incorrect sentences may not be exactly
reliable. In this paper, we propose the AMR-GEC, a seq-to-seq model that
incorporates denoised AMR as additional knowledge. Specifically, We design a
semantic aggregated GEC model and explore denoising methods to get AMRs more
reliable. Experiments on the BEA-2019 shared task and the CoNLL-2014 shared
task have shown that AMR-GEC performs comparably to a set of strong baselines
with a large number of synthetic data. Compared with the T5 model with
synthetic data, AMR-GEC can reduce the training time by 32\% while inference
time is comparable. To the best of our knowledge, we are the first to
incorporate AMR for grammatical error correction.
- Abstract(参考訳): 文法的誤り訂正(英: Grammatical Error Correction, GEC)とは、誤りのある文を文法的に正しい、意味的に一貫性のある、一貫性のある文に修正する作業である。
一般的なGECモデルは、大規模な合成コーパスを使用するか、多数の人間が設計したルールを使用する。
前者は訓練に費用がかかるが、後者は人間の専門知識を必要とする。
近年、意味表現フレームワークであるAMRは、その完全性と柔軟性のため、多くの自然言語タスクで広く使われている。
非無視的な懸念は、文法的に誤りのある文のAMRが正確には信頼できないことである。
本稿では,AMRを付加知識として組み込んだSeq-to-seqモデルであるAMR-GECを提案する。
具体的には,意味的集約型GECモデルを設計し,AMRをより信頼性の高いものにする方法を探究する。
BEA-2019共有タスクとCoNLL-2014共有タスクの実験により、AMR-GECは、多数の合成データを持つ強いベースラインの集合と相容れない性能を示した。
合成データを用いたT5モデルと比較して、AMR-GECは推論時間と同等のトレーニング時間を32\%削減できる。
我々の知る限りでは、AMRを文法的誤り訂正に取り入れたのは初めてである。
関連論文リスト
- Analyzing the Role of Semantic Representations in the Era of Large Language Models [104.18157036880287]
大規模言語モデル(LLM)の時代における意味表現の役割について検討する。
本稿では, AMRCoT と呼ばれる AMR-driven chain-of- Thought prompting 法を提案する。
AMRのどの入力例が役に立つかは予測できないが,複数単語の表現でエラーが発生する傾向にある。
論文 参考訳(メタデータ) (2024-05-02T17:32:59Z) - RobustGEC: Robust Grammatical Error Correction Against Subtle Context
Perturbation [64.2568239429946]
本稿では,GECシステムのコンテキストロバスト性を評価するためのベンチマークであるRobustGECを紹介する。
現状のGECシステムには, 文脈摂動に対する十分な堅牢性がないことが明らかとなった。
論文 参考訳(メタデータ) (2023-10-11T08:33:23Z) - An AMR-based Link Prediction Approach for Document-level Event Argument
Extraction [51.77733454436013]
文書レベルのイベント調停抽出(文書レベルEAE)のための抽象的意味表現(AMR)を導入した最近の研究動向
本研究では,AEをAMRグラフ上のリンク予測問題として再検討する。
本稿では,より少ない情報量のサブグラフやエッジタイプを圧縮し,スパン情報を統合し,同じ文書内の事象をハイライトする新たなグラフ構造であるTalored AMR Graph(TAG)を提案する。
論文 参考訳(メタデータ) (2023-05-30T16:07:48Z) - A Syntax-Guided Grammatical Error Correction Model with Dependency Tree
Correction [83.14159143179269]
文法的誤り訂正(英: Grammatical Error Correction, GEC)は、文中の文法的誤りを検出し、訂正するタスクである。
本稿では,依存木の構文知識を利用するためのグラフアテンション機構を採用した構文誘導型GECモデル(SG-GEC)を提案する。
我々は、GECタスクの公開ベンチマークでモデルを評価し、競争結果を得る。
論文 参考訳(メタデータ) (2021-11-05T07:07:48Z) - LM-Critic: Language Models for Unsupervised Grammatical Error Correction [128.9174409251852]
文を文法的に判断する LM-Critic の定義において,事前訓練された言語モデル (LM) の活用法を示す。
このLM-Critic と BIFI と、ラベルなし文の集合を併用して、現実的な非文法的/文法的ペアをブートストラップし、修正子を訓練する。
論文 参考訳(メタデータ) (2021-09-14T17:06:43Z) - Probabilistic, Structure-Aware Algorithms for Improved Variety,
Accuracy, and Coverage of AMR Alignments [9.74672460306765]
本稿では,抽象的意味表現(AMR)の成分を英文で並べるアルゴリズムを提案する。
教師なし学習をグラフと組み合わせて活用し、前回のAMRから両世界を最大限に活用する。
提案手法は,従来考えられていたより多様なAMRサブ構造を網羅し,ノードとエッジのより高いカバレッジを実現し,精度の高いAMRサブ構造を実現する。
論文 参考訳(メタデータ) (2021-06-10T18:46:32Z) - Synthetic Data Generation for Grammatical Error Correction with Tagged
Corruption Models [15.481446439370343]
ERRANTなどの自動アノテーションツールからのエラー型タグを使用して、合成データ生成をガイドする。
我々は、与えられた開発セットにマッチするエラータグ頻度分布を持つ、新しい大規模合成事前学習データセットを構築した。
本手法は,母国英語と非母国英語を混合したGECシステムをネイティブ英語テストセットに適用する上で,特に有効である。
論文 参考訳(メタデータ) (2021-05-27T17:17:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。