論文の概要: Do Large Language Models Mentalize When They Teach?
- arxiv url: http://arxiv.org/abs/2604.01594v1
- Date: Thu, 02 Apr 2026 04:04:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.258804
- Title: Do Large Language Models Mentalize When They Teach?
- Title(参考訳): 大規模言語モデルは教えるときにメンタル化するか?
- Authors: Sevan K. Harootonian, Mark K. Ho, Thomas L. Griffiths, Yael Niv, Ilia Sucholutsky,
- Abstract要約: 我々は、シミュレーション教師として様々なLSMを実行し、試行錯誤の選択を人間と同じ認知モデルに適合させる。
ほとんどのLSMは良好に動作し、試行よりも戦略がほとんど変化せず、グラフ・バイ・グラフの性能は人間のものと類似している。
- 参考スコア(独自算出の注目度): 15.991054959432269
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: How do LLMs decide what to teach next: by reasoning about a learner's knowledge, or by using simpler rules of thumb? We test this in a controlled task previously used to study human teaching strategies. On each trial, a teacher LLM sees a hypothetical learner's trajectory through a reward-annotated directed graph and must reveal a single edge so the learner would choose a better path if they replanned. We run a range of LLMs as simulated teachers and fit their trial-by-trial choices with the same cognitive models used for humans: a Bayes-Optimal teacher that infers which transitions the learner is missing (inverse planning), weaker Bayesian variants, heuristic baselines (e.g., reward based), and non-mentalizing utility models. In a baseline experiment matched to the stimuli presented to human subjects, most LLMs perform well, show little change in strategy over trials, and their graph-by-graph performance is similar to that of humans. Model comparison (BIC) shows that Bayes-Optimal teaching best explains most models' choices. When given a scaffolding intervention, models follow auxiliary inference- or reward-focused prompts, but these scaffolds do not reliably improve later teaching on heuristic-incongruent test graphs and can sometimes reduce performance. Overall, cognitive model fits provide insight into LLM tutoring policies and show that prompt compliance does not guarantee better teaching decisions.
- Abstract(参考訳): LLMは、学習者の知識を推論したり、より単純な親指の規則を使って、次に何を教えるかをどう決めるか?
我々は、これまで人間の教え方略の研究に用いられてきた制御タスクでこれをテストした。
各試行において、LLM教師は、報酬を付与した有向グラフを通して仮説学習者の軌跡を視認し、修正された場合、学習者がより良い経路を選択するように、単一のエッジを明らかにする必要がある。
我々は、LLMをシミュレーション教師として実行し、そのトライアル・バイ・トライアル選択を、学習者が欠落している(逆計画)ベイズ・最適教師、弱いベイズ変種、ヒューリスティック・ベースライン(例えば報酬ベース)、非メンタライズユーティリティモデルといった、人間が使用する認知モデルに適合させる。
被験者に提示された刺激に合わせたベースライン実験では、ほとんどのLCMは良好に動作し、試行よりも戦略がほとんど変化せず、グラフ・バイ・グラフのパフォーマンスは人間のものと類似している。
モデル比較(BIC)は、ベイズ最適指導がほとんどのモデルの選択を最もよく説明していることを示している。
足場の介入が与えられると、モデルは補助的な推論や報酬に焦点を当てたプロンプトに従うが、これらの足場はヒューリスティックな矛盾したテストグラフに関する後の教育を確実に改善せず、時には性能を低下させる。
全体として、認知モデルはLLMの教育方針に関する洞察を与え、コンプライアンスの迅速化がより良い教育決定を保証していないことを示す。
関連論文リスト
- PATS: Personality-Aware Teaching Strategies with Large Language Model Tutors [66.56586559631516]
大型言語モデル (LLM) は教育教師としての可能性を秘めている。
しかし、異なる学習戦略は、異なる学生の個性に利益をもたらす。
それにもかかわらず、現在のLLM教育システムは生徒の性格特性を考慮に入れていない。
論文 参考訳(メタデータ) (2026-01-13T10:17:26Z) - From Problem-Solving to Teaching Problem-Solving: Aligning LLMs with Pedagogy using Reinforcement Learning [82.50157695987558]
大規模言語モデル(LLM)は教育を変換することができるが、直接質問応答のための最適化はしばしば効果的な教育を損なう。
オンライン強化学習(RL)に基づくアライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-21T15:00:07Z) - Can Large Language Models Match Tutoring System Adaptivity? A Benchmarking Study [0.0]
大規模言語モデル(LLM)は動的命令補助として約束を守る。
しかし、LLMが知的チューリングシステム(ITS)の適応性を再現できるかどうかは不明である。
論文 参考訳(メタデータ) (2025-04-07T23:57:32Z) - Can LLMs Learn by Teaching for Better Reasoning? A Preliminary Study [26.317548264733425]
既存のLLMトレーニング/プロンプティングパイプラインにLbTのアイデアを組み込むことができ、改善がもたらされることを示す。
具体的には,LbTの3つのレベルのうちの1つを模倣する3つの手法を設計する。
学生が学習しやすくする教材は、学生の「学習」方法としてコンテキスト内学習を用いることで、より明確で正確な論理を習得する。(2)弱体化:LbTは、弱体化モデルを教えることによって、強力なモデルを改善するのに役立つかもしれない。
論文 参考訳(メタデータ) (2024-06-20T18:00:17Z) - Toward In-Context Teaching: Adapting Examples to Students' Misconceptions [54.82965010592045]
本稿ではAdapTと呼ばれる一連のモデルと評価手法を紹介する。
AToMは、学生の過去の信念を共同で推論し、将来の信念の正しさを最適化する適応教育の新しい確率論的モデルである。
本研究は,適応型学習課題の難しさと,それを解決するための学習適応モデルの可能性を両立させるものである。
論文 参考訳(メタデータ) (2024-05-07T17:05:27Z) - Democratizing Reasoning Ability: Tailored Learning from Large Language
Model [97.4921006089966]
そこで我々は,そのような推論能力をより小さなLMに蒸留する,適切な学習手法を提案する。
対話型多ラウンド学習パラダイムを構築することにより,理科教員としてのLLMの可能性を活用する。
より小さなLMの推論可能性を活用するために,学生が自作ミスから学習する動機付けを目的とした自己回帰学習を提案する。
論文 参考訳(メタデータ) (2023-10-20T07:50:10Z) - Position: AI Evaluation Should Learn from How We Test Humans [65.36614996495983]
人間の評価のための20世紀起源の理論である心理測定は、今日のAI評価における課題に対する強力な解決策になり得る、と我々は主張する。
論文 参考訳(メタデータ) (2023-06-18T09:54:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。