論文の概要: Towards Lithuanian grammatical error correction
- arxiv url: http://arxiv.org/abs/2203.09963v1
- Date: Fri, 18 Mar 2022 13:59:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-21 13:36:06.918231
- Title: Towards Lithuanian grammatical error correction
- Title(参考訳): リトアニア文法の誤り訂正に向けて
- Authors: Lukas Stankevi\v{c}ius and Mantas Luko\v{s}evi\v{c}ius
- Abstract要約: 我々は古風な特徴に富んだリトアニア語に対する文法的誤り訂正モデルを構築した。
サブワードとバイトレベルのアプローチを比較し、最高のトレーニングモデルを共有し、F$_0.5$=0.92を達成し、関連するコードをオンラインオープンソースリポジトリで共有します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Everyone wants to write beautiful and correct text, yet the lack of language
skills, experience, or hasty typing can result in errors. By employing the
recent advances in transformer architectures, we construct a grammatical error
correction model for Lithuanian, the language rich in archaic features. We
compare subword and byte-level approaches and share our best trained model,
achieving F$_{0.5}$=0.92, and accompanying code, in an online open-source
repository.
- Abstract(参考訳): 誰もが美しく正しいテキストを書きたがっていますが、言語スキルの欠如、経験の欠如、あるいはタイピングの急激さがエラーを引き起こします。
近年のトランスフォーマーアーキテクチャの進歩を利用して,古来の特徴に富むリトアニア語に対する文法的誤り訂正モデルを構築した。
サブワードとバイトレベルのアプローチを比較して、最高のトレーニングモデルを共有し、f$_{0.5}$=0.92をオンラインのオープンソースリポジトリで達成します。
関連論文リスト
- From English-Centric to Effective Bilingual: LLMs with Custom Tokenizers for Underrepresented Languages [0.5706164516481158]
そこで本研究では,二言語ベース大言語モデル (LLM) を開発するための,モデルに依存しないコスト効率のアプローチを提案する。
私たちは3つの言語で実験を行い、それぞれが非ラテン文字(ウクライナ語、アラビア語、グルジア語)を使用しました。
論文 参考訳(メタデータ) (2024-10-24T15:20:54Z) - GEE! Grammar Error Explanation with Large Language Models [64.16199533560017]
本稿では,文法的誤りを1対の誤り文と訂正文に1文で説明する必要がある文法的誤り説明の課題を提案する。
文法的誤り説明における GPT-4 の能力を解析し, ワンショットプロンプトを用いた60.2% の誤り説明しか生成しないことを確認した。
我々は、構造化されたアトミックトークンの編集を行うために、微調整された大規模言語モデルを活用する2段階のパイプラインを開発した。
論文 参考訳(メタデータ) (2023-11-16T02:45:47Z) - A Language Model for Grammatical Error Correction in L2 Russian [0.3149883354098941]
文法的誤り訂正は自然言語処理の基本課題の1つである。
ロシア語では、ほとんどのスペルチェッカーは正確なタイポスや他の単純なエラーを高い精度で利用できるが、非ネイティブ(L2)文字に直面すると失敗することが多い。
本稿では,L2ロシア文字の誤り訂正を目的とした言語モデルを含むパイプラインを提案する。
論文 参考訳(メタデータ) (2023-07-04T09:50:13Z) - Byte-Level Grammatical Error Correction Using Synthetic and Curated
Corpora [0.0]
文法的誤り訂正(英: Grammatical error correction, GEC)とは、文字のタイプミス、スペル、句読点、文法的問題を訂正する作業である。
バイトレベルのモデルにより、サブワードアプローチよりも高い補正品質が得られることを示す。
論文 参考訳(メタデータ) (2023-05-29T06:35:40Z) - Towards Fine-Grained Information: Identifying the Type and Location of
Translation Errors [80.22825549235556]
既存のアプローチでは、エラーの位置と型を同期的に考慮することはできない。
我々はtextbf の追加と textbfomission エラーを予測するために FG-TED モデルを構築した。
実験により,本モデルではエラータイプと位置の同時同定が可能であり,最先端の結果が得られた。
論文 参考訳(メタデータ) (2023-02-17T16:20:33Z) - GrammarTagger: A Multilingual, Minimally-Supervised Grammar Profiler for
Language Education [7.517366022163375]
GrammarTaggerは、入力テキストを与えられたオープンソースの文法プロファイラで、言語教育に有用な文法的特徴を特定します。
モデルアーキテクチャにより、スパンとそのラベルで注釈付けされた少量のテキストから学ぶことができる。
また,その読解困難度と文法的特徴を指標とした言語学習教材の検索エンジン octanove learn を構築した。
論文 参考訳(メタデータ) (2021-04-07T15:31:20Z) - Correcting Automated and Manual Speech Transcription Errors using Warped
Language Models [2.8614709576106874]
そこで本稿では,音声の書き起こしを訂正するために,ワープ言語モデルの頑健性を活かした新しい手法を提案する。
提案手法は,音声言語の自動書き起こしと手話書き起こしの両方の単語誤り率を最大10%削減できることを示す。
論文 参考訳(メタデータ) (2021-03-26T16:43:23Z) - Improving Translation Robustness with Visual Cues and Error Correction [58.97421756225425]
ノイズの多いテキストに対する翻訳の堅牢性を改善するビジュアルコンテキストのアイデアを紹介します。
また,誤り訂正を補助タスクとして扱うことで,新しい誤り訂正訓練手法を提案する。
論文 参考訳(メタデータ) (2021-03-12T15:31:34Z) - Learning Contextualised Cross-lingual Word Embeddings and Alignments for
Extremely Low-Resource Languages Using Parallel Corpora [63.5286019659504]
そこで本稿では,小さな並列コーパスに基づく文脈型言語間単語埋め込み学習手法を提案する。
本手法は,入力文の翻訳と再構成を同時に行うLSTMエンコーダデコーダモデルを用いて単語埋め込みを実現する。
論文 参考訳(メタデータ) (2020-10-27T22:24:01Z) - Comparison of Interactive Knowledge Base Spelling Correction Models for
Low-Resource Languages [81.90356787324481]
低リソース言語に対する正規化の推進は、パターンの予測が難しいため、難しい作業である。
この研究は、ターゲット言語データに様々な量を持つニューラルモデルとキャラクタ言語モデルの比較を示す。
我々の利用シナリオは、ほぼゼロのトレーニング例によるインタラクティブな修正であり、より多くのデータが収集されるにつれてモデルを改善する。
論文 参考訳(メタデータ) (2020-10-20T17:31:07Z) - On the Robustness of Language Encoders against Grammatical Errors [66.05648604987479]
我々は、非ネイティブ話者から実際の文法的誤りを収集し、これらの誤りをクリーンテキストデータ上でシミュレートするために敵攻撃を行う。
結果,全ての試験モデルの性能は影響するが,影響の程度は異なることがわかった。
論文 参考訳(メタデータ) (2020-05-12T11:01:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。