論文の概要: DECOR: Improving Coherence in L2 English Writing with a Novel Benchmark for Incoherence Detection, Reasoning, and Rewriting
- arxiv url: http://arxiv.org/abs/2406.19650v2
- Date: Wed, 02 Oct 2024 23:11:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-04 23:30:23.620315
- Title: DECOR: Improving Coherence in L2 English Writing with a Novel Benchmark for Incoherence Detection, Reasoning, and Rewriting
- Title(参考訳): DECOR: インコヒーレンス検出・推論・書き換えのための新しいベンチマークによるL2英語文字のコヒーレンス向上
- Authors: Xuanming Zhang, Anthony Diaz, Zixun Chen, Qingyang Wu, Kun Qian, Erik Voss, Zhou Yu,
- Abstract要約: 我々は,L2英語文における不整合を検出するための専門家アノテーションを含む新しいベンチマークであるDECORを紹介する。
DECORは、L2英語の文章を改善するために特別に設計された最初のコヒーレンスアセスメントデータセットである。
学生エッセイにおける不整合を自動的に検出および書き直しするために、モデルを微調整した。
- 参考スコア(独自算出の注目度): 18.67557179321966
- License:
- Abstract: Coherence in writing, an aspect that second-language (L2) English learners often struggle with, is crucial in assessing L2 English writing. Existing automated writing evaluation systems primarily use basic surface linguistic features to detect coherence in writing. However, little effort has been made to correct the detected incoherence, which could significantly benefit L2 language learners seeking to improve their writing. To bridge this gap, we introduce DECOR, a novel benchmark that includes expert annotations for detecting incoherence in L2 English writing, identifying the underlying reasons, and rewriting the incoherent sentences. To our knowledge, DECOR is the first coherence assessment dataset specifically designed for improving L2 English writing, featuring pairs of original incoherent sentences alongside their expert-rewritten counterparts. Additionally, we fine-tuned models to automatically detect and rewrite incoherence in student essays. We find that incorporating specific reasons for incoherence during fine-tuning consistently improves the quality of the rewrites, achieving a result that is favored in both automatic and human evaluations.
- Abstract(参考訳): コヒーレンス(Coherence in writing)は、第二言語(L2)の英語学習者がしばしば苦労する側面であり、L2の英語の文章を評価する上で重要である。
既存の自動筆記評価システムは主に、筆記におけるコヒーレンスを検出するために基本的表面言語的特徴を使用する。
しかし、検出された不整合を補正する努力はほとんど行われていないため、L2言語学習者が書き方を改善するのに大いに役立つだろう。
このギャップを埋めるために,L2 の英語文における不整合の検出,その原因の特定,不整合文の書き直しのための専門家アノテーションを含む新しいベンチマークである DECOR を導入する。
我々の知る限り、DECORはL2英語の文章を改善するために特別に設計された最初のコヒーレンス評価データセットである。
さらに,学生エッセイにおける不整合を自動的に検出し,書き直しするモデルを微調整した。
微調整中に不整合性の特定の理由を取り入れることで、書き直しの品質が一貫して向上し、自動評価と人的評価の両方で好まれる結果が得られます。
関連論文リスト
- Neural Automated Writing Evaluation with Corrective Feedback [4.0230668961961085]
本稿では,修正フィードバックを用いた自動筆記評価システムを提案する。
このシステムにより、言語学習者はエッセイの執筆テストをシミュレートできる。
また、無数のエッセイを手作業で修正することの負担を軽減する。
論文 参考訳(メタデータ) (2024-02-27T15:42:33Z) - Evaluating Prompting Strategies for Grammatical Error Correction Based
on Language Proficiency [3.848964608707635]
オーバーコレクションは,習熟度A(初心者レベル)と習熟度B(中間レベル)ではなく,先進言語学習者の書記(習熟度C)で主に発生する。
微調整のLLMや、英語学習者の例を書いている数発のショットでさえ、実際にはリコール対策の低下を示す傾向にある。
論文 参考訳(メタデータ) (2024-02-24T23:17:56Z) - SwinTextSpotter v2: Towards Better Synergy for Scene Text Spotting [126.01629300244001]
我々はSwinTextSpotter v2と呼ばれる新しいエンドツーエンドのシーンテキストスポッティングフレームワークを提案する。
我々は,新しい認識変換モジュールと認識アライメントモジュールを用いて,2つのタスク間の関係を強化する。
SwinTextSpotter v2は、様々な多言語(英語、中国語、ベトナム語)のベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-01-15T12:33:00Z) - Evaluation of ChatGPT Feedback on ELL Writers' Coherence and Cohesion [0.7028778922533686]
ChatGPTは、学生が宿題を手伝うために利用し、教師が教育実践に積極的に採用している教育に変革をもたらす。
本研究は,英語学習者(ELL)のエッセイの一貫性と凝集性について,ChatGPTが生み出したフィードバックの質を評価した。
論文 参考訳(メタデータ) (2023-10-10T10:25:56Z) - Boosting Punctuation Restoration with Data Generation and Reinforcement
Learning [70.26450819702728]
触覚回復は自動音声認識(ASR)における重要な課題である
テキストの句読点とASRテキストとの相違は、ASRテキストの句読点復元システムのトレーニングにおいて、テキストのユーザビリティを制限している。
本稿では,このギャップを埋めるために,話題内テキストを活用した強化学習手法と大規模事前学習型生成言語モデルの最近の進歩を提案する。
論文 参考訳(メタデータ) (2023-07-24T17:22:04Z) - Dual-Alignment Pre-training for Cross-lingual Sentence Embedding [79.98111074307657]
本稿では,言語間文埋め込みのためのDAP(Dual-alignment pre-training)フレームワークを提案する。
そこで本研究では,一方の文脈化トークン表現を用いて翻訳相手を再構成する,新しい表現翻訳学習(RTL)タスクを提案する。
我々の手法は文の埋め込みを大幅に改善できる。
論文 参考訳(メタデータ) (2023-05-16T03:53:30Z) - Complex Handwriting Trajectory Recovery: Evaluation Metrics and
Algorithm [10.642342653937794]
そこで我々は,様々なストローク幅の影響を排除したアダプティブ・コンベンション(AIoU)と,トラジェクティブ・ポイントアライメント問題を解決する長さ非依存動的時間ワープ(LDTW)という2つの新しい指標を考案した。
次に、複雑なグリフと長い軌跡を持つ文字に対して、PEN-Net(Parsing-and-tracing ENcoder-decoder Network)と呼ばれる新しい手書き軌道復元モデルを提案する。
実験の結果,AIoU と LDTW の2つの新しい指標は,手書き軌道復元の精度を真に評価できることがわかった。
論文 参考訳(メタデータ) (2022-10-28T03:57:07Z) - Improving Chinese Spelling Check by Character Pronunciation Prediction:
The Effects of Adaptivity and Granularity [76.20568599642799]
中国語のスペルチェック(英語: Chinese spelling check, CSC)は、中国語のテキスト中のスペルエラーを検出し修正する基本的なNLPタスクである。
本稿では,CSCを改善するために中国語発音予測(CPP)の補助的タスクを導入することを検討する。
本稿では,共有エンコーダの2つの並列デコーダ上に構築したSCOPEを提案する。
論文 参考訳(メタデータ) (2022-10-20T03:42:35Z) - Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。
主な課題は、しばしば異なるスタイルで手紙を書くことである。
我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文 参考訳(メタデータ) (2021-12-06T07:21:53Z) - LadRa-Net: Locally-Aware Dynamic Re-read Attention Net for Sentence
Semantic Matching [66.65398852962177]
文意味マッチングのための新しい動的再読ネットワーク(DRr-Net)を開発した。
DRr-Netをローカルに認識する動的再読み取り注意ネット(LadRa-Net)に拡張する
2つの一般的な文意味マッチングタスクの実験により、DRr-Netは文意味マッチングの性能を大幅に改善できることを示した。
論文 参考訳(メタデータ) (2021-08-06T02:07:04Z) - Token-Level Supervised Contrastive Learning for Punctuation Restoration [7.9713449581347104]
句読解は自然言語の文章を理解するのに重要である。
ほとんどの自動音声認識システムは句読点を生成しない。
句読点修復における最近の研究は、事前訓練された言語モデルを大いに活用している。
論文 参考訳(メタデータ) (2021-07-19T18:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。