論文の概要: GECTurk WEB: An Explainable Online Platform for Turkish Grammatical Error Detection and Correction
- arxiv url: http://arxiv.org/abs/2410.12350v1
- Date: Wed, 16 Oct 2024 08:13:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-17 13:44:21.868810
- Title: GECTurk WEB: An Explainable Online Platform for Turkish Grammatical Error Detection and Correction
- Title(参考訳): GECTurk WEB:トルコの文法的誤り検出と訂正のための説明可能なオンラインプラットフォーム
- Authors: Ali Gebeşçe, Gözde Gül Şahin,
- Abstract要約: 我々は、最も一般的なトルコ文字の誤りを検出し、修正できるWebベースのシステムであるGECTurk WEBを紹介した。
提案システムは88,3システムのユーザビリティスコアを達成し,文法規則の学習・記憶を支援する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Sophisticated grammatical error detection/correction tools are available for a small set of languages such as English and Chinese. However, it is not straightforward -- if not impossible -- to adapt them to morphologically rich languages with complex writing rules like Turkish which has more than 80 million speakers. Even though several tools exist for Turkish, they primarily focus on spelling errors rather than grammatical errors and lack features such as web interfaces, error explanations and feedback mechanisms. To fill this gap, we introduce GECTurk WEB, a light, open-source, and flexible web-based system that can detect and correct the most common forms of Turkish writing errors, such as the misuse of diacritics, compound and foreign words, pronouns, light verbs along with spelling mistakes. Our system provides native speakers and second language learners an easily accessible tool to detect/correct such mistakes and also to learn from their mistakes by showing the explanation for the violated rule(s). The proposed system achieves 88,3 system usability score, and is shown to help learn/remember a grammatical rule (confirmed by 80% of the participants). The GECTurk WEB is available both as an offline tool at https://github.com/GGLAB-KU/gecturkweb or online at www.gecturk.net.
- Abstract(参考訳): 高度化された文法的誤り検出/訂正ツールは、英語や中国語などの小さな言語で利用可能である。
しかし、8000万人以上の話者を抱えるトルコ語のような複雑な書記規則で、形態的に豊かな言語に適応することは(不可能ではないとしても)簡単ではない。
トルコ語にはいくつかのツールが存在するが、主に文法的エラーよりもスペルエラーに焦点を当てており、Webインターフェース、エラー説明、フィードバックメカニズムなどの機能がない。
このギャップを埋めるために、私たちはGECTurk WEBという軽量でオープンソースで柔軟なWebベースシステムを導入しました。
本システムでは,母国語話者と第二言語学習者に対して,そのような誤りを検出・訂正し,違反した規則の説明を提示することにより,誤りから学習する上で,容易にアクセス可能なツールを提供する。
提案システムは,88,3システムのユーザビリティスコアを達成し,文法規則(80%の参加者で確認)の学習・記憶を支援する。
GECTurk WEBはhttps://github.com/GGLAB-KU/gecturkwebまたはwww.gecturk.netでオフラインツールとして利用可能である。
関連論文リスト
- How Ready Are Generative Pre-trained Large Language Models for Explaining Bengali Grammatical Errors? [0.4857223913212445]
高度な生成人工知能(AI)を利用した文法的誤り訂正(GEC)ツール。
しかし、それらはしばしば、本質的な自然言語の説明の提供に不足する。
このような言語では、文法的誤り説明(GEE)システムは正しい文だけでなく、誤りの説明も提供すべきである。
論文 参考訳(メタデータ) (2024-05-27T15:56:45Z) - GEE! Grammar Error Explanation with Large Language Models [64.16199533560017]
本稿では,文法的誤りを1対の誤り文と訂正文に1文で説明する必要がある文法的誤り説明の課題を提案する。
文法的誤り説明における GPT-4 の能力を解析し, ワンショットプロンプトを用いた60.2% の誤り説明しか生成しないことを確認した。
我々は、構造化されたアトミックトークンの編集を行うために、微調整された大規模言語モデルを活用する2段階のパイプラインを開発した。
論文 参考訳(メタデータ) (2023-11-16T02:45:47Z) - Enhancing Grammatical Error Correction Systems with Explanations [45.69642286275681]
文法的誤り訂正システムは、言語誤りを検出し、修正することで、文字によるコミュニケーションを改善する。
本稿では,エビデンスワードと文法的誤り型を付加したデータセットEXPECTを紹介する。
人間の評価により,GECシステムの説明は,訂正提案を受理するか否かを判断する第2言語学習者を支援することができる。
論文 参考訳(メタデータ) (2023-05-25T03:00:49Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - Towards Lithuanian grammatical error correction [0.0]
我々は古風な特徴に富んだリトアニア語に対する文法的誤り訂正モデルを構築した。
サブワードとバイトレベルのアプローチを比較し、最高のトレーニングモデルを共有し、F$_0.5$=0.92を達成し、関連するコードをオンラインオープンソースリポジトリで共有します。
論文 参考訳(メタデータ) (2022-03-18T13:59:02Z) - A Syntax-Guided Grammatical Error Correction Model with Dependency Tree
Correction [83.14159143179269]
文法的誤り訂正(英: Grammatical Error Correction, GEC)は、文中の文法的誤りを検出し、訂正するタスクである。
本稿では,依存木の構文知識を利用するためのグラフアテンション機構を採用した構文誘導型GECモデル(SG-GEC)を提案する。
我々は、GECタスクの公開ベンチマークでモデルを評価し、競争結果を得る。
論文 参考訳(メタデータ) (2021-11-05T07:07:48Z) - Misspelling Correction with Pre-trained Contextual Language Model [0.0]
BERTと編集距離アルゴリズムに基づく2つの実験を行い、候補補正のランキングと選択を行います。
実験の結果,BERTの文脈単語埋め込みと編集距離を適切に組み合わせることで,スペルエラーを効果的に修正できることが判明した。
論文 参考訳(メタデータ) (2021-01-08T20:11:01Z) - Improving the Efficiency of Grammatical Error Correction with Erroneous
Span Detection and Correction [106.63733511672721]
ESD(Eroneous Span Detection)とESC(Eroneous Span Correction)の2つのサブタスクに分割することで、文法的誤り訂正(GEC)の効率を改善するための言語に依存しない新しいアプローチを提案する。
ESDは、効率的なシーケンスタグ付けモデルを用いて文法的に誤りテキストスパンを識別する。ESCは、Seq2seqモデルを利用して、注釈付き誤字スパンの文を入力として取り、これらのスパンの修正テキストのみを出力する。
実験の結果,提案手法は英語と中国語のGECベンチマークにおいて従来のセク2seq手法と同等に動作し,推論に要するコストは50%以下であった。
論文 参考訳(メタデータ) (2020-10-07T08:29:11Z) - On the Robustness of Language Encoders against Grammatical Errors [66.05648604987479]
我々は、非ネイティブ話者から実際の文法的誤りを収集し、これらの誤りをクリーンテキストデータ上でシミュレートするために敵攻撃を行う。
結果,全ての試験モデルの性能は影響するが,影響の程度は異なることがわかった。
論文 参考訳(メタデータ) (2020-05-12T11:01:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。