論文の概要: Exploiting the English Grammar Profile for L2 grammatical analysis with LLMs
- arxiv url: http://arxiv.org/abs/2603.17171v1
- Date: Tue, 17 Mar 2026 22:06:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.417087
- Title: Exploiting the English Grammar Profile for L2 grammatical analysis with LLMs
- Title(参考訳): LLMを用いたL2文法解析のための英語文法プロファイルの展開
- Authors: Stefano Bannò, Penny Karanasou, Kate Knill, Mark Gales,
- Abstract要約: 英語文法プロファイル(英語: English Grammar Profile, EGP)は、共通ヨーロッパ参照フレームワーク(CEFR)の習熟度にマッピングされた文法構成の分類法である。
本稿では,EGPを利用して学習者の文法的構成を検知し,それを成功あるいは失敗と分類する新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 3.027026792589421
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Evaluating the grammatical competence of second language (L2) learners is essential both for providing targeted feedback and for assessing proficiency. To achieve this, we propose a novel framework leveraging the English Grammar Profile (EGP), a taxonomy of grammatical constructs mapped to the proficiency levels of the Common European Framework of Reference (CEFR), to detect learners' attempts at grammatical constructs and classify them as successful or unsuccessful. This detection can then be used to provide fine-grained feedback. Moreover, the grammatical constructs are used as predictors of proficiency assessment by using automatically detected attempts as predictors of holistic CEFR proficiency. For the selection of grammatical constructs derived from the EGP, rule-based and LLM-based classifiers are compared. We show that LLMs outperform rule-based methods on semantically and pragmatically nuanced constructs, while rule-based approaches remain competitive for constructs that rely purely on morphological or syntactic features and do not require semantic interpretation. For proficiency assessment, we evaluate both rule-based and hybrid pipelines and show that a hybrid approach combining a rule-based pre-filter with an LLM consistently yields the strongest performance. Since our framework operates on pairs of original learner sentences and their corrected counterparts, we also evaluate a fully automated pipeline using automatic grammatical error correction. This pipeline closely approaches the performance of semi-automated systems based on manual corrections, particularly for the detection of successful attempts at grammatical constructs. Overall, our framework emphasises learners' successful attempts in addition to unsuccessful ones, enabling positive, formative feedback and providing actionable insights into grammatical development.
- Abstract(参考訳): 第二言語(L2)学習者の文法能力を評価することは,目標とするフィードバックの提供と習熟度の評価に不可欠である。
そこで本研究では,共通ヨーロッパ参照フレームワーク(CEFR)の習熟度にマッピングされた文法構文の分類である英語文法プロファイル(EGP)を活用して,学習者の文法構成に対する試みを検知し,それを成功あるいは失敗として分類する手法を提案する。
この検出は、きめ細かいフィードバックを提供するために使用できる。
さらに、この文法構造は、自動検出された試行を総合CEFR習熟度予測器として使用することにより、習熟度評価の予測器として使用される。
EGPから派生した文法構造の選択にはルールベースとLLMベースの分類器を比較した。
LLMは意味論的・実用的ニュアンス構造において,規則に基づく手法よりも優れており,規則に基づくアプローチは,純粋に形態的・構文的特徴に依存し,意味論的解釈を必要としない構造に対して競争力を持つことを示す。
習熟度評価では,ルールベースとハイブリッドパイプラインの双方を評価し,ルールベースプレフィルタとLLMを組み合わせたハイブリッドアプローチが一貫した性能が得られることを示す。
また,本フレームワークは,元の学習文とその修正文のペアで動作するため,自動文法誤り訂正を用いた完全自動パイプラインの評価も行う。
このパイプラインは、手動による修正に基づく半自動システムの性能に近づき、特に文法的構成における成功した試みの検出に近づいた。
全体として,本フレームワークは,学習者の試みの失敗に加えて,肯定的かつ形式的なフィードバックの実現,文法的開発に対する実用的な洞察の提供などにも重点を置いている。
関連論文リスト
- From Prompting to Preference Optimization: A Comparative Study of LLM-based Automated Essay Scoring [2.3843476850953995]
大規模言語モデル (LLM) が最近,自動エッセイスコーリング (AES) を改定した。
本稿では,LLM をベースとした主要な AES パラダイムを包括的に比較する。
この結果から,k-SFTとRAGを組み合わせた構成がF1-Score 93%で最強となる精度・コスト・ロバスト性トレードオフが明らかとなった。
論文 参考訳(メタデータ) (2026-03-06T15:59:32Z) - SAGE:Specification-Aware Grammar Extraction for Automated Test Case Generation with LLMs [8.576669309128382]
我々は,オープンソースの大規模言語モデル(LLM)を用いて,CCFG(Context-free Grammars with Counters)を誘導する方法について検討する。
CCFGは、導出中のカウンタ値の保存と再利用によって論理的制約を持つ仕様を表す。
提案手法は, 文法品質とテスト効率の両面において, より高度な一般化を実現し, オープンかつクローズドソースの LLM を17 に上回っている。
論文 参考訳(メタデータ) (2025-06-04T08:44:25Z) - MoRE-LLM: Mixture of Rule Experts Guided by a Large Language Model [54.14155564592936]
大規模言語モデル(MoRE-LLM)によるルールエキスパートの混合を提案する。
MoRE-LLMは、トレーニング中の局所的なルールベースのサロゲートの発見と、それらの分類タスクの利用を操縦する。
LLMはルールを修正・コンテキスト化することで、ルールのドメイン知識の整合性を高める役割を担います。
論文 参考訳(メタデータ) (2025-03-26T11:09:21Z) - Assessing the validity of new paradigmatic complexity measures as criterial features for proficiency in L2 writings in English [1.465540676497032]
この記事では、新しい文法的および構造的複雑性メトリクスの調査を通じて、第二言語(L2)による開発について述べる。
言語機能と特定の文法的パラダイムをリンクすることで、学習者英語におけるパラダイム生産を探求する。
論文 参考訳(メタデータ) (2025-03-13T10:01:07Z) - Analysis of LLM as a grammatical feature tagger for African American English [0.6927055673104935]
アフリカ系アメリカ人英語(AAE)は自然言語処理(NLP)に固有の課題を提示している
本研究では,利用可能なNLPモデルの性能を体系的に比較する。
本研究は,AAEの固有の言語特性をよりよく適合させるために,モデルトレーニングとアーキテクチャ調整の改善の必要性を強調した。
論文 参考訳(メタデータ) (2025-02-09T19:46:33Z) - Preference Alignment Improves Language Model-Based TTS [76.70693823683091]
選好アライメントアルゴリズムは、報酬モデルの嗜好に合わせてLMを調整し、生成されたコンテンツの望ましさを高める。
1.15B のパラメータ LM に基づく TTS モデルを用いて、嗜好の整合性は常に知性、話者類似性、代用主観的評価スコアを向上することを示した。
論文 参考訳(メタデータ) (2024-09-19T01:58:19Z) - DECIDER: A Dual-System Rule-Controllable Decoding Framework for Language Generation [57.07295906718989]
制約付き復号法は,事前訓練された大言語(Ms と PLMs)が生成するテキストの意味やスタイルを,推論時に様々なタスクに対して制御することを目的としている。
これらの方法は、しばしば、欲求的かつ明示的にターゲットを選択することによって、もっともらしい連続を導く。
認知二重プロセス理論に着想を得て,新しい復号化フレームワークDECDERを提案する。
論文 参考訳(メタデータ) (2024-03-04T11:49:08Z) - Large Language Models can Contrastively Refine their Generation for Better Sentence Representation Learning [57.74233319453229]
大規模言語モデル(LLM)は画期的な技術として登場し、それらの非並列テキスト生成能力は、基本的な文表現学習タスクへの関心を喚起している。
コーパスを生成するためにLLMの処理を分解するマルチレベルコントラスト文表現学習フレームワークであるMultiCSRを提案する。
実験の結果,MultiCSRはより高度なLCMをChatGPTの性能を超えつつ,ChatGPTに適用することで最先端の成果を得られることがわかった。
論文 参考訳(メタデータ) (2023-10-17T03:21:43Z) - Structural Pre-training for Dialogue Comprehension [51.215629336320305]
本稿では,SPIDER, Structure Pre-trained DialoguE Readerについて述べる。
対話のような特徴をシミュレートするために,元のLM目的に加えて,2つの訓練目標を提案する。
広く使われている対話ベンチマークの実験結果から,新たに導入した自己教師型タスクの有効性が検証された。
論文 参考訳(メタデータ) (2021-05-23T15:16:54Z) - SLM: Learning a Discourse Language Representation with Sentence
Unshuffling [53.42814722621715]
談話言語表現を学習するための新しい事前学習目的である文レベル言語モデリングを導入する。
本モデルでは,この特徴により,従来のBERTの性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2020-10-30T13:33:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。