論文の概要: Hey Chat, Can You Teach Me? Structuring Socratic Dialogue for Human Learning in the Wild
- arxiv url: http://arxiv.org/abs/2606.11744v1
- Date: Wed, 10 Jun 2026 07:20:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.340007
- Title: Hey Chat, Can You Teach Me? Structuring Socratic Dialogue for Human Learning in the Wild
- Title(参考訳): ヘイ・チャット, 教えられるか? 野生の人間の学習のためのソクラテス的対話を構造化する
- Authors: Sidney Tio, Arunesh Sinha, Pradeep Varakantham,
- Abstract要約: 大規模な言語モデルは今では日常的な学習に広く使われている。
しかし、基礎となる対話は通常、カリキュラムに従うのではなく、非構造化のチャットである。
このギャップは、スケーリングモデルだけでは閉じられません。
- 参考スコア(独自算出の注目度): 36.633166596198635
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models are now widely used for everyday learning, but the underlying interactions are typically unstructured chats rather than following a curriculum. Unlike formal online learning systems, these interactions carry no prior record of the student, so any estimate of what the student already knows must be inferred from the dialogue itself. We show that this gap is not closed by scaling models alone. Frontier and education-tuned LLMs perform poorly when asked to tutor a student over an extended session, because doing so requires three things at once. The tutor must sequence a curriculum, conduct Socratic dialogue, and infer the student's knowledge state from that dialogue. We propose separating these responsibilities. Given a student query, our system constructs a prerequisite knowledge graph in which subtopics are nodes and dependencies are edges, and frames tutoring as deciding which node to teach next and how many dialogue turns to spend on it before moving on. A lightweight PPO policy handles this sequencing decision, while an LLM conducts the Socratic exchange at the chosen node and returns a signal of student progress. Across held-out STEM and non-STEM topics, our PPO-paired tutor outperforms heuristic baselines, frontier general-purpose models, and a model specialised for Socratic dialogue: on both the rate at which students reach full curriculum mastery and the number of turns required. Explicit curriculum structure delivers gains that scaling the underlying model does not.
- Abstract(参考訳): 大規模な言語モデルは今では日常的な学習に広く使われているが、基礎となる相互作用は通常、カリキュラムに従うのではなく、構造化されていないチャットである。
公式のオンライン学習システムとは異なり、これらの相互作用は生徒の事前の記録を持たないので、生徒が既に知っていることの見積もりは、対話そのものから推測されなければならない。
このギャップは、スケーリングモデルだけでは閉じられません。
フロンティアと教育用に調整されたLLMは、拡張セッションで生徒に指導を依頼すると、パフォーマンスが悪くなります。
教師はカリキュラムを解析し、ソクラテス的な対話を行い、その対話から生徒の知識状態を推測しなければならない。
これらの責任を分離することを提案する。
学生問合せを前提として,サブトピックがノードであり,依存関係がエッジである前提知識グラフを構築し,次にどのノードを教えるか,どの対話に何回費やすかを決定するフレームを学習する。
軽量PPOポリシーはこのシーケンシング決定を処理し、LCMは選択ノードでソクラテス交換を行い、生徒の進歩のシグナルを返す。
STEMと非STEMのトピック全体で、私たちのPPO対応チューターは、ヒューリスティックベースライン、フロンティア汎用モデル、ソクラティック対話に特化したモデル、すなわち、学生が完全なカリキュラムの熟達と必要なターン数に到達する速度において、優れたパフォーマンスを発揮します。
明示的なカリキュラム構造は、基礎となるモデルをスケールしない利益をもたらす。
関連論文リスト
- MIDAS: Multi-level Intent, Domain, And Slot Knowledge Distillation for Multi-turn NLU [9.047800457694656]
MIDASはマルチレベルインテント,ドメイン,スロット知識の蒸留を多ターンNLUに適用する新しい手法である。
我々は、SI検出、WSフィリング、会話レベルドメイン(CD)分類のための個別の教師を構築し、それぞれが特定の知識のために微調整されている。
その結果,マルチターン会話理解におけるモデルの有効性が示された。
論文 参考訳(メタデータ) (2024-08-15T13:28:18Z) - Unsupervised Mutual Learning of Discourse Parsing and Topic Segmentation in Dialogue [37.618612723025784]
対話システムでは、会話の焦点の管理と対話のコーディネートにおいて、会話が重要な役割を果たす。
修辞的構造と主題的構造という2つの重要な構造から構成される。
我々は、修辞構造とトピック構造を統合する統一表現を導入し、それら間のセマンティック一貫性を確保する。
本稿では,レトリック構造とトピック構造を協調的にモデル化し,追加アノテーションを必要とせずに相互に強化できる教師なし相互学習フレームワーク(UMLF)を提案する。
論文 参考訳(メタデータ) (2024-05-30T08:10:50Z) - ChatPLUG: Open-Domain Generative Dialogue System with Internet-Augmented
Instruction Tuning for Digital Human [76.62897301298699]
ChatPLUGは、デジタルヒューマンアプリケーションのための中国のオープンドメイン対話システムである。
モデルネームは, 自動評価と人的評価の両方において, 最先端の中国語対話システムより優れていることを示す。
高速な推論でスマートスピーカーやインスタントメッセージアプリケーションのような実世界のアプリケーションにモデルネームをデプロイします。
論文 参考訳(メタデータ) (2023-04-16T18:16:35Z) - Response Generation with Context-Aware Prompt Learning [19.340498579331555]
本稿では,対話生成問題を素早い学習課題とする,事前学習型対話モデリングのための新しい手法を提案する。
限られた対話データを微調整する代わりに、我々のアプローチであるDialogPromptは、対話コンテキストに最適化された連続的なプロンプト埋め込みを学習する。
提案手法は,微調整ベースラインと汎用的なプロンプト学習法を著しく上回っている。
論文 参考訳(メタデータ) (2021-11-04T05:40:13Z) - Few-Shot Bot: Prompt-Based Learning for Dialogue Systems [58.27337673451943]
ごく少数の例を使って会話を学ぶことは、会話型AIにおける大きな課題である。
現在の最良の会話モデルは、良いチャットシャッター(例:BlenderBot)またはゴール指向システム(例:MinTL)である。
グラデーションベースの微調整を必要とせず、学習の唯一の源としていくつかの例を用いるプロンプトベースの数ショット学習を提案する。
論文 参考訳(メタデータ) (2021-10-15T14:36:45Z) - Knowledge Injection into Dialogue Generation via Language Models [85.65843021510521]
InjKは対話生成モデルに知識を注入するための2段階のアプローチである。
まず、大規模言語モデルをトレーニングし、テキスト知識としてクエリする。
次に、対話生成モデルを作成し、テキスト知識と対応する応答を逐次生成する。
論文 参考訳(メタデータ) (2020-04-30T07:31:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。