論文の概要: Book2Dial: Generating Teacher-Student Interactions from Textbooks for
Cost-Effective Development of Educational Chatbots
- arxiv url: http://arxiv.org/abs/2403.03307v1
- Date: Tue, 5 Mar 2024 20:12:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 16:55:05.564468
- Title: Book2Dial: Generating Teacher-Student Interactions from Textbooks for
Cost-Effective Development of Educational Chatbots
- Title(参考訳): Book2Dial:教育チャットボットのコスト効果開発のための教科書からの教師と学生のインタラクションの生成
- Authors: Junling Wang, Jakub Macina, Nico Daheim, Sankalan Pal Chowdhury,
Mrinmaya Sachan
- Abstract要約: 教科書の集合に根ざした合成教師と学生の相互作用を生成するための枠組みを提案する。
我々は、このような対話が満たすべき様々な品質基準を強調し、プロンプトや微調整の大きな言語モデルに依存するいくつかのアプローチを比較した。
我々の研究は、サイズと品質のバランスをとる会話データを合成する今後の取り組みに対する洞察を提供する。
- 参考スコア(独自算出の注目度): 37.304476231479725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Educational chatbots are a promising tool for assisting student learning.
However, the development of effective chatbots in education has been
challenging, as high-quality data is seldom available in this domain. In this
paper, we propose a framework for generating synthetic teacher-student
interactions grounded in a set of textbooks. Our approaches capture one aspect
of learning interactions where curious students with partial knowledge
interactively ask a teacher questions about the material in the textbook. We
highlight various quality criteria that such dialogues should fulfill and
compare several approaches relying on either prompting or fine-tuning large
language models. We use synthetic dialogues to train educational chatbots and
show benefits of further fine-tuning in different educational domains. However,
human evaluation shows that our best data synthesis method still suffers from
hallucinations and tends to reiterate information from previous conversations.
Our findings offer insights for future efforts in synthesizing conversational
data that strikes a balance between size and quality. We will open-source our
data and code.
- Abstract(参考訳): 教育チャットボットは、学生の学習を支援する有望なツールだ。
しかし、この領域では高品質なデータがほとんど利用できないため、教育における効果的なチャットボットの開発は困難である。
本稿では,教科書に基礎を置き,教師と学生の対話を合成する枠組みを提案する。
本手法は,教師が教科書の教材について対話的に質問する,学習相互作用の1つの側面を捉えている。
我々は、このような対話が満たすべき様々な品質基準を強調し、プロンプトや微調整の大きな言語モデルに依存するいくつかのアプローチを比較した。
我々は合成対話を用いて教育用チャットボットを訓練し、異なる教育領域でさらなる微調整の利点を示す。
しかし,人間の評価では,最高のデータ合成手法は今でも幻覚に悩まされており,過去の会話から情報を再送する傾向がある。
我々の研究は、サイズと品質のバランスをとる会話データを合成する今後の取り組みに対する洞察を提供する。
データとコードをオープンソースにします。
関連論文リスト
- Conversations as a Source for Teaching Scientific Concepts at Different Education Levels [22.315652391541285]
本稿では,様々な難易度で科学的概念の会話的教えを容易にするための新しい情報源を提案する。
我々は、このデータソースを様々な方法で分析し、文脈的に適切な応答を生成するのに使用できる多様なサンプル群を提供することを示す。
論文 参考訳(メタデータ) (2024-04-16T11:33:36Z) - Learning From Free-Text Human Feedback -- Collect New Datasets Or Extend
Existing Ones? [57.16050211534735]
一般的な対話データセットにおける自由文フィードバックのタイプと頻度について検討する。
この結果から, エラータイプ, ユーザ応答タイプ, それらの関係性など, 調査したデータセットの構成に関する新たな知見が得られた。
論文 参考訳(メタデータ) (2023-10-24T12:01:11Z) - Curriculum-Driven Edubot: A Framework for Developing Language Learning Chatbots Through Synthesizing Conversational Data [23.168347070904318]
本稿では,チャットボットの対話的特徴と英語教科書の体系的素材を組み合わせたチャットボットを開発するためのフレームワークであるCurriculum-Driven EduBotを紹介する。
まず、教科書から関連するトピックを抽出し、大きな言語モデルを用いてこれらのトピックに関連する対話を生成する。
論文 参考訳(メタデータ) (2023-09-28T19:14:18Z) - AutoConv: Automatically Generating Information-seeking Conversations
with Large Language Models [74.10293412011455]
合成会話生成のためのAutoConvを提案する。
具体的には,会話生成問題を言語モデリングタスクとして定式化する。
我々は、情報探索プロセスの特徴を捉えるために、人間同士の会話でLLMを微調整する。
論文 参考訳(メタデータ) (2023-08-12T08:52:40Z) - Developing Effective Educational Chatbots with ChatGPT prompts: Insights
from Preliminary Tests in a Case Study on Social Media Literacy (with
appendix) [43.55994393060723]
ChatGPTのようなゼロショット学習機能を持つ言語学習モデルの最近の進歩は、教育チャットボットを開発する新たな可能性を示している。
本稿では,混合ターンチャットボットのインタラクションを可能にするシンプルなシステムを用いたケーススタディを提案する。
本稿では,ChatGPTが複数の相互接続型学習目標を追求し,文化,年齢,教育レベルなどのユーザ特性に教育活動を適応させ,多様な教育戦略や会話スタイルを活用できる能力について検討する。
論文 参考訳(メタデータ) (2023-06-18T22:23:18Z) - PLACES: Prompting Language Models for Social Conversation Synthesis [103.94325597273316]
我々は、プロンプトを用いてソーシャルな会話データセットを合成するために、専門家による会話の小さなセットをコンテキスト内例として使用します。
人工会話の徹底的な評価を,人間による会話と比較して行った。
論文 参考訳(メタデータ) (2023-02-07T05:48:16Z) - Opportunities and Challenges in Neural Dialog Tutoring [54.07241332881601]
言語学習のための2つの対話学習データセットを用いて、様々な生成言語モデルを厳密に分析する。
現在のアプローチでは、制約のある学習シナリオでチューリングをモデル化できますが、制約の少ないシナリオではパフォーマンスが悪くなります。
人的品質評価では, モデルと接地木アノテーションの両方が, 同等のチュータリングの点で低い性能を示した。
論文 参考訳(メタデータ) (2023-01-24T11:00:17Z) - Few-Shot Bot: Prompt-Based Learning for Dialogue Systems [58.27337673451943]
ごく少数の例を使って会話を学ぶことは、会話型AIにおける大きな課題である。
現在の最良の会話モデルは、良いチャットシャッター(例:BlenderBot)またはゴール指向システム(例:MinTL)である。
グラデーションベースの微調整を必要とせず、学習の唯一の源としていくつかの例を用いるプロンプトベースの数ショット学習を提案する。
論文 参考訳(メタデータ) (2021-10-15T14:36:45Z) - A Taxonomy of Empathetic Response Intents in Human Social Conversations [1.52292571922932]
自然言語処理コミュニティでは、オープンドメインの会話エージェントがますます人気を高めている。
課題のひとつは、共感的な方法で会話できるようにすることです。
現在のニューラルレスポンス生成手法は、大規模な会話データからエンドツーエンドの学習のみに頼って対話を生成する。
近年,対話act/intentモデリングとニューラルレスポンス生成を組み合わせることが期待されている。
論文 参考訳(メタデータ) (2020-12-07T21:56:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。