論文の概要: The Crutch or the Ceiling? How Different Generations of LLMs Shape EFL Student Writings
- arxiv url: http://arxiv.org/abs/2604.15460v1
- Date: Thu, 16 Apr 2026 18:19:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.620582
- Title: The Crutch or the Ceiling? How Different Generations of LLMs Shape EFL Student Writings
- Title(参考訳): クラッチ」か「シーリング」か : LLM 形 EFL の学生文の世代の違い
- Authors: Hengky Susanto, David James Woo, Chingyi Yeung, Stephanie Wing Yan Lo-Philip, Chi Ho Yeung,
- Abstract要約: 本研究では,外国語(EFL)学生の文章作成作業を支援するために,Large Language Models (LLMs) の範囲と限界について検討する。
以上の結果から,LLMは低習熟度学習者に対する評価スコアと語彙の多様性を高めることが示唆された。
AI支援の実践を真の学習に転換するためには、教育はアウトプットの品質から学習プロセスの検証へとシフトする必要がある。
- 参考スコア(独自算出の注目度): 0.26097841018267615
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid evolution of Large Language Models (LLMs) has made them powerful tools for enhancing student writing. This study explores the extent and limitations of LLMs in assisting secondary-level English as a Foreign Language (EFL) students with their writing tasks. While existing studies focus on output quality, our research examines the developmental shift in LLMs and their impact on EFL students, assessing whether smarter models act as true scaffolds or mere compensatory crutches. To achieve this, we analyse student compositions assisted by LLMs before and after ChatGPT's release, using both expert qualitative scoring and quantitative metrics (readability tests, Pearson's correlation coefficient, MTLD, and others). Our results indicate that advanced LLMs boost assessment scores and lexical diversity for lower-proficiency learners, potentially masking their true ability. Crucially, increased LLM assistance correlated negatively with human expert ratings, suggesting surface fluency without deep coherence. To transform AI-assisted practice into genuine learning, pedagogy must shift from focusing on output quality to verifying the learning process. Educators should align AI functions, specifically differentiating ideational scaffolding from textual production, within the learner's Zone of Proximal Development.
- Abstract(参考訳): LLM(Large Language Models)の急速な進化は、学生の書き込みを向上させる強力なツールとなった。
本研究は、中等レベルの英語を外国語(EFL)の学生が文章を書くことを支援する上でのLLMの範囲と限界について考察する。
既存の研究は出力品質に重点を置いているが、LLMの発達的変化とEFL学生への影響を調査し、よりスマートなモデルが真の足場として機能するか、単に補償松葉杖として機能するかを評価する。
そこで我々は,ChatGPTのリリース前後に,専門家の質的評価と定量的指標(可読性テスト,ピアソン相関係数,MTLDなど)を用いて,LLMによる学生構成の分析を行った。
以上の結果から,LLMは低習熟度学習者に対する評価スコアや語彙の多様性を高めることが示唆され,その正しさを隠蔽する可能性が示唆された。
重要なことに、LLM支援の増大は、人間の専門家による評価と負の相関を示し、深部コヒーレンスを伴わない表面流速を示唆した。
AI支援の実践を真の学習に転換するためには、教育はアウトプットの品質から学習プロセスの検証へとシフトする必要がある。
教育者は、学習者の近縁開発ゾーン内で、AI機能、具体的には、テキスト生産と概念的足場を区別するべきである。
関連論文リスト
- ZPD-SCA: Unveiling the Blind Spots of LLMs in Assessing Students' Cognitive Abilities [19.704166621790836]
大規模言語モデル(LLM)は、教育応用の可能性を示しているが、読み物の認知的アライメントを正確に評価する能力は、まだ十分に研究されていない。
ステージレベルの中国語読解難易度を評価するための新しいベンチマークであるZPD-SCAを紹介する。
実験の結果,LLMはゼロショット学習のシナリオでは不十分であり,Qwen-max と GLM はランダムな推測の確率よりも低い値を示した。
論文 参考訳(メタデータ) (2025-08-20T03:08:47Z) - Simulating LLM-to-LLM Tutoring for Multilingual Math Feedback [11.889826908536941]
大規模言語モデル(LLM)を用いた多言語チューター-学生間相互作用の大規模シミュレーションについて述べる。
より強いモデルは教師の役割を担い、ヒントの形でフィードバックを生成し、弱いモデルは生徒をシミュレートする。
本研究では,学生の入力言語,教師のフィードバック言語,モデル選択,言語資源レベルがパフォーマンスにどのように影響するかを検討する。
論文 参考訳(メタデータ) (2025-06-05T11:53:04Z) - Enhanced Bloom's Educational Taxonomy for Fostering Information Literacy in the Era of Large Language Models [16.31527042425208]
本稿では,大規模言語モデル(LLM)を用いた学生の情報リテラシー(IL)の認識と評価を目的としたLLMによるブルーム教育分類法を提案する。
このフレームワークは、LLMを使用するために必要な認知能力に対応するILを、Exploration & ActionとCreation & Metacognitionの2つの異なるステージに分類する。
論文 参考訳(メタデータ) (2025-03-25T08:23:49Z) - Position: LLMs Can be Good Tutors in English Education [120.25980336297444]
大規模言語モデル(LLM)は、英語教育において効果的な家庭教師として機能する可能性がある。
LLMは、データエンハンサー、学習材料の作成の改善、学生シミュレーションの3つの重要な役割を果たすことができる。
論文 参考訳(メタデータ) (2025-02-08T06:48:49Z) - Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing [56.75702900542643]
大規模言語モデルの自己改善のためのAlphaLLMを紹介する。
モンテカルロ木探索(MCTS)とLLMを統合し、自己改善ループを確立する。
実験の結果,AlphaLLM は付加アノテーションを使わずに LLM の性能を大幅に向上することがわかった。
論文 参考訳(メタデータ) (2024-04-18T15:21:34Z) - FAC$^2$E: Better Understanding Large Language Model Capabilities by Dissociating Language and Cognition [56.76951887823882]
大規模言語モデル(LLM)は、主に様々なテキスト理解および生成タスクにおける全体的なパフォーマンスによって評価される。
FAC$2$E, FAC$2$Eについて述べる。
論文 参考訳(メタデータ) (2024-02-29T21:05:37Z) - Supervised Knowledge Makes Large Language Models Better In-context Learners [94.89301696512776]
大規模言語モデル(LLM)は、素早い工学を通して、文脈内学習能力の出現を示す。
自然言語理解と質問応答におけるLLMの一般化性と事実性の向上という課題は、まだ未解決のままである。
本研究では, LLM の信頼性を高める枠組みを提案する。1) 分布外データの一般化,2) 差別モデルによる LLM のメリットの解明,3) 生成タスクにおける幻覚の最小化。
論文 参考訳(メタデータ) (2023-12-26T07:24:46Z) - Language Model Self-improvement by Reinforcement Learning Contemplation [13.152789365858812]
本稿では,LanguageModel Self-Improvement by Reinforcement Learning Contemplation (SIRLC) という,教師なしの新しい手法を提案する。
学生として、モデルはラベルのない質問に対する回答を生成し、教師として、生成されたテキストを評価し、それに応じてスコアを割り当てる。
我々は,SIRLCを推論問題,テキスト生成,機械翻訳など,様々なNLPタスクに適用できることを実証した。
論文 参考訳(メタデータ) (2023-05-23T19:25:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。