論文の概要: Large Language Models in K-12 Education: Alignment with State Curriculum Standards and Student Personas
- arxiv url: http://arxiv.org/abs/2606.04846v1
- Date: Wed, 03 Jun 2026 13:14:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.774942
- Title: Large Language Models in K-12 Education: Alignment with State Curriculum Standards and Student Personas
- Title(参考訳): K-12教育における大規模言語モデル:国家カリキュラム基準と学生の人格との整合性
- Authors: Lisa Korver, Tomo Lazovich, Sherief Reda,
- Abstract要約: 我々は、米国史のカリキュラムのバリエーションを特定し、異なるLLMがこれらの州固有のカリキュラムの違いを反映する程度を評価する。
モデルが歴史的トピックの提示を調整できる一方で、こうした変化は国家の政治的傾向が認識されていることから生じる可能性がある。
- 参考スコア(独自算出の注目度): 3.147897243459717
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As Large Language Models (LLMs) become increasingly popular in educational settings, they raise important questions about the ethical implications of their use. Publicly available online chatbots are quickly improving in capability and accuracy leading to more widespread use, including among students looking for help with their homework. This makes it crucial to consider whether these models are aligned with educational standards. Because curriculum standards in the United States are set at the state level, they differ significantly in required content, emphasis, and narrative focus. In this work, we develop an LLM-based pipeline to identify variations in U.S. History curricula across states and evaluate the extent to which different LLMs reflect these state-specific curricular differences. In addition, we conduct controlled experiments that vary user personas by stating user attributes such as geographic location, grade level, gender and race to evaluate the sensitivity of LLM responses to user characteristics. We find that while models are able to adjust their presentation of historical topics, these shifts may come from the perceived political leanings of states and do not necessarily reflect actual curriculum content. Additionally, models successfully adapt to a student's grade level while showing minimal sensitivity to race or gender, suggesting they are capable of useful adaptation to student personas with limited demographic bias. Together, these findings highlight potential risks that open access to LLM chatbots may cause to student learning outcomes stemming from misalignment with state curriculum standards and highlight the need for more robust alignment techniques.
- Abstract(参考訳): 大規模言語モデル(LLM)は、教育現場で人気が高まるにつれて、それらの利用の倫理的意味について重要な疑問を提起する。
一般公開されたオンラインチャットボットは、能力と精度が急速に向上し、宿題の助けを求める学生を含む、より広く使われるようになった。
これにより、これらのモデルが教育基準に準拠しているかどうかを考えることが重要である。
アメリカ合衆国のカリキュラムの基準は州レベルで設定されているので、それらは要求される内容、強調、物語の焦点で大きく異なる。
本研究では, LLMに基づくパイプラインを開発し, 州間での米国史カリキュラムの変動を同定し, 異なるLLMがこれらの州固有のカリキュラム差を反映する程度を評価する。
さらに,ユーザ特性に対するLLM応答の感度を評価するために,地理的位置,学年レベル,性別,人種などのユーザ属性を記述し,ユーザ個性を変化させる制御実験を行った。
モデルが歴史的トピックの提示を調整できる一方で、これらの変化は国家の政治的傾きから来ている可能性があり、必ずしも実際のカリキュラムの内容を反映しているとは限らない。
さらに、モデルは、人種や性別に対する感受性を最小限に保ちながら、学生の学級レベルに適応することに成功した。
これらの知見は、LLMチャットボットへのオープンアクセスが、国家のカリキュラム基準の不適合に起因する学生の学習結果にもたらす潜在的なリスクを強調し、より堅牢なアライメント技術の必要性を強調している。
関連論文リスト
- Sociodemographic Biases in Educational Counselling by Large Language Models [61.30199414932204]
本研究では,Large Language Models(LLMs)における社会デマトグラフィーバイアスについて検討する。
多様な状況下で生徒を記述した900のヴィグネットに関する質問に答える6つのLDMからの回答を評価した。
論文 参考訳(メタデータ) (2026-04-03T14:08:22Z) - Revisiting LLM Value Probing Strategies: Are They Robust and Expressive? [81.49470136653665]
広範に利用されている3つの探索戦略における値表現の頑健さと表現性を評価する。
人口統計学的文脈は自由テキスト生成にはほとんど影響を与えず、モデルの値は値に基づく行動の好みと弱い相関しか示さない。
論文 参考訳(メタデータ) (2025-07-17T18:56:41Z) - Can LLMs Reliably Simulate Real Students' Abilities in Mathematics and Reading Comprehension? [8.558834738072363]
大規模言語モデル (LLMs) は、知能学習システム (ITSs) の開発において、代用学生としての利用が増えている。
我々は,4,8,12の数学と読解に関する全国教育進歩評価(NAEP)から,489項目のデータセットを収集した。
本研究では,11種類の多種多様かつ最先端のLLMを実生と同じ能力尺度に位置づけるために,IRTモデルを適用した。
論文 参考訳(メタデータ) (2025-07-11T00:36:57Z) - Does the Prompt-based Large Language Model Recognize Students' Demographics and Introduce Bias in Essay Scoring? [3.7498611358320733]
大規模言語モデル (LLM) は自動エッセイ・スコーリング (AES) で広く使われている。
本研究は,学生の属性の予測力と評価課題における評価バイアスとの関係について検討した。
論文 参考訳(メタデータ) (2025-04-30T05:36:28Z) - Embracing AI in Education: Understanding the Surge in Large Language Model Use by Secondary Students [53.20318273452059]
OpenAIのChatGPTのような大規模言語モデル(LLM)は、新しい教育の道を開いた。
学校制限にもかかわらず,中高生300人以上を対象に調査を行ったところ,学生の70%がLDMを利用していることがわかった。
我々は、対象特化モデル、パーソナライズドラーニング、AI教室など、このような問題に対処するいくつかのアイデアを提案する。
論文 参考訳(メタデータ) (2024-11-27T19:19:34Z) - Large Language Models Reflect the Ideology of their Creators [71.65505524599888]
大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。
本稿では, LLMのイデオロギー的姿勢が創造者の世界観を反映していることを示す。
論文 参考訳(メタデータ) (2024-10-24T04:02:30Z) - LLM-as-a-Judge & Reward Model: What They Can and Cannot Do [2.2469442203227863]
自動評価器の総合的な分析を行い,その挙動に関するいくつかの重要な知見を報告する。
英語の評価能力は言語固有の評価能力に大きく影響し,英語で訓練された評価者が他の言語に容易にスキルを伝達できることがわかった。
我々は、現在最先端の評価者が、英語と韓国語の両方において、複雑な推論問題の評価や生成の限界について、挑戦的なプロンプトに苦しむことに気付きました。
論文 参考訳(メタデータ) (2024-09-17T14:40:02Z) - CIVICS: Building a Dataset for Examining Culturally-Informed Values in Large Language Models [59.22460740026037]
大規模言語モデル(LLM)の社会的・文化的変動を評価するためのデータセット「CIVICS:文化インフォームド・バリュース・インクルーシブ・コーパス・フォー・ソシエティ・インパクト」
我々は、LGBTQIの権利、社会福祉、移民、障害権利、代理など、特定の社会的に敏感なトピックに対処する、手作りの多言語プロンプトのデータセットを作成します。
論文 参考訳(メタデータ) (2024-05-22T20:19:10Z) - Sociodemographic Prompting is Not Yet an Effective Approach for Simulating Subjective Judgments with LLMs [13.744746481528711]
大規模言語モデル(LLM)は、様々な文脈で人間の反応をシミュレートするために広く使われている。
我々は,2つの主観的判断課題(丁寧さと攻撃性)において,人口差を理解する能力について,9つの人気のLCMを評価した。
ゼロショット設定では、両方のタスクのほとんどのモデルの予測は、アジアやブラックの参加者よりもホワイトの参加者のラベルとより密接に一致している。
論文 参考訳(メタデータ) (2023-11-16T10:02:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。