論文の概要: Combining GCN and Transformer for Chinese Grammatical Error Detection
- arxiv url: http://arxiv.org/abs/2105.09085v1
- Date: Wed, 19 May 2021 12:17:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-20 13:51:33.514148
- Title: Combining GCN and Transformer for Chinese Grammatical Error Detection
- Title(参考訳): 中国語文法誤り検出のためのGCNと変換器の組み合わせ
- Authors: Jinhong Zhang
- Abstract要約: NLPTEA-2020 Task: Chinese Grammatical Error Diagnosis (CGED) における本システムについて紹介する。
CGEDは、欠失語(M)、冗長語(R)、不適切な語選択(S)、不規則語(W)の4種類の文法的誤りを診断することを目的としている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces our system at NLPTEA-2020 Task: Chinese Grammatical
Error Diagnosis (CGED). CGED aims to diagnose four types of grammatical errors
which are missing words (M), redundant words (R), bad word selection (S) and
disordered words (W). The automatic CGED system contains two parts including
error detection and error correction and our system is designed to solve the
error detection problem. Our system is built on three models: 1) a BERT-based
model leveraging syntactic information; 2) a BERT-based model leveraging
contextual embeddings; 3) a lexicon-based graph neural network. We also design
an ensemble mechanism to improve the performance of the single model. Finally,
our system obtains the highest F1 scores at detection level and identification
level among all teams participating in the CGED 2020 task.
- Abstract(参考訳): 本稿では,NLPTEA-2020 Task: Chinese Grammatical Error Diagnosis (CGED)で紹介する。
CGEDは,失語(M),冗長語(R),悪語選択(S),不規則語(W)の4種類の文法的誤りを診断することを目的としている。
自動ccdシステムは,誤り検出と誤り訂正の2つの部分を含み,誤り検出問題を解決するために設計されている。
本システムは,1)構文情報を利用したBERTモデル,2)コンテキスト埋め込みを利用したBERTモデル,3)辞書ベースのグラフニューラルネットワークの3つのモデルに基づいて構築されている。
また,単一モデルの性能向上のためのアンサンブル機構も設計した。
最後に, CGED 2020タスクに参加する全チームの中で, 検出レベルと識別レベルが最も高いF1スコアを得た。
関連論文リスト
- Bangla Grammatical Error Detection Leveraging Transformer-based Token Classification [0.0]
世界で7番目に話されている言語であるバングラ語における自動文法チェッカーの開発について検討する。
本手法では,トークン分類問題としてタスクを分割し,最先端のトランスフォーマーモデルを活用する。
本システムは,様々な情報源から得られた25,000以上のテキストからなるデータセットを用いて評価する。
論文 参考訳(メタデータ) (2024-11-13T05:22:45Z) - A Coin Has Two Sides: A Novel Detector-Corrector Framework for Chinese Spelling Correction [79.52464132360618]
中国語のSpelling Correction(CSC)は、自然言語処理(NLP)の基本課題である。
本稿では,エラー検出・相関器の枠組みに基づく新しい手法を提案する。
我々の検出器は2つのエラー検出結果を得るように設計されており、それぞれ高精度とリコールが特徴である。
論文 参考訳(メタデータ) (2024-09-06T09:26:45Z) - A Comprehensive Approach to Misspelling Correction with BERT and Levenshtein Distance [1.7000578646860536]
最も多い書き込みエラーのうち、スペルミスは、様々な要因によって頻繁に発生する。
本研究の目的は,ニューラルネットワークを用いてテキスト中の多様な綴り誤りを特定し,修正することである。
論文 参考訳(メタデータ) (2024-07-24T16:07:11Z) - Interactively Diagnosing Errors in a Semantic Parser [7.136205674624813]
本稿では,CNLUのための対話型エラー診断システムについて述べる。
モデルベース診断問題として,INLDパイプラインの最初の2段階をキャストする方法を示す。
本システムでは, 合成例における意味的誤りを診断する能力を示す。
論文 参考訳(メタデータ) (2024-07-08T21:16:09Z) - CSED: A Chinese Semantic Error Diagnosis Corpus [52.92010408053424]
関連するデータセットが欠如している中国の意味的誤り診断(CSED)の複雑な問題について検討する。
意味的誤りの研究は、それらが非常に一般的であり、統語的不規則や理解の問題に繋がる可能性があるため重要である。
本稿では,CSEDタスクに適応する構文認識モデルを提案する。
論文 参考訳(メタデータ) (2023-05-09T05:33:31Z) - From Spelling to Grammar: A New Framework for Chinese Grammatical Error
Correction [12.170714706174314]
中国語の文法的誤り訂正(CGEC)は、誤ったシーケンスから正しい文を生成することを目的としている。
本稿では,CGECタスクをスペル誤り訂正と文法的誤り訂正という2つのステップに分割する。
本稿では,スペル誤り訂正のためのゼロショット手法を提案する。
文法的誤り訂正に対処するため、ニューラルネットワークモデルを強化するために、部分音声特徴と意味クラス特徴を設計する。
論文 参考訳(メタデータ) (2022-11-03T07:30:09Z) - Improving Pre-trained Language Models with Syntactic Dependency
Prediction Task for Chinese Semantic Error Recognition [52.55136323341319]
既存の中国語のテキスト誤り検出は主にスペルと単純な文法的誤りに焦点を当てている。
中国の意味的誤りは、人間が容易に認識できないほど過小評価され、複雑である。
論文 参考訳(メタデータ) (2022-04-15T13:55:32Z) - A Syntax-Guided Grammatical Error Correction Model with Dependency Tree
Correction [83.14159143179269]
文法的誤り訂正(英: Grammatical Error Correction, GEC)は、文中の文法的誤りを検出し、訂正するタスクである。
本稿では,依存木の構文知識を利用するためのグラフアテンション機構を採用した構文誘導型GECモデル(SG-GEC)を提案する。
我々は、GECタスクの公開ベンチマークでモデルを評価し、競争結果を得る。
論文 参考訳(メタデータ) (2021-11-05T07:07:48Z) - On the Robustness of Language Encoders against Grammatical Errors [66.05648604987479]
我々は、非ネイティブ話者から実際の文法的誤りを収集し、これらの誤りをクリーンテキストデータ上でシミュレートするために敵攻撃を行う。
結果,全ての試験モデルの性能は影響するが,影響の程度は異なることがわかった。
論文 参考訳(メタデータ) (2020-05-12T11:01:44Z) - Joint Contextual Modeling for ASR Correction and Language Understanding [60.230013453699975]
言語理解(LU)と協調してASR出力の文脈的言語補正を行うマルチタスクニューラルアプローチを提案する。
そこで本研究では,市販のASRおよびLUシステムの誤差率を,少量のドメイン内データを用いてトレーニングしたジョイントモデルと比較して14%削減できることを示した。
論文 参考訳(メタデータ) (2020-01-28T22:09:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。