Fugu-MT 論文翻訳(概要): Exploring Automated Distractor and Feedback Generation for Math Multiple-choice Questions via In-context Learning

論文の概要: Exploring Automated Distractor and Feedback Generation for Math Multiple-choice Questions via In-context Learning

arxiv url: http://arxiv.org/abs/2308.03234v1
Date: Mon, 7 Aug 2023 01:03:04 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-08 15:53:36.905554
Title: Exploring Automated Distractor and Feedback Generation for Math Multiple-choice Questions via In-context Learning
Title（参考訳）: テキスト内学習による複数質問に対する自動抽出とフィードバック生成の探索
Authors: Hunter McNichols, Wanyong Feng, Jaewook Lee, Alexander Scarlatos, Digory Smith, Simon Woodhead, Andrew Lan
Abstract要約: MCQ(Multiple-choice Question)は、ほぼ全てのレベルの教育において、ユビキタスである。 MCQは管理しやすく、格付けしやすく、評価と実践の両方において信頼性の高いフォーマットである。現在まで、高品質な気晴らし器を製作する作業は、労働集約的なプロセスのままである。
参考スコア（独自算出の注目度）: 55.76160432284081
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Multiple-choice questions (MCQs) are ubiquitous in almost all levels of education since they are easy to administer, grade, and are a reliable format in both assessments and practices. An important aspect of MCQs is the distractors, i.e., incorrect options that are designed to target specific misconceptions or insufficient knowledge among students. To date, the task of crafting high-quality distractors has largely remained a labor-intensive process for teachers and learning content designers, which has limited scalability. In this work, we explore the task of automated distractor and corresponding feedback message generation in math MCQs using large language models. We establish a formulation of these two tasks and propose a simple, in-context learning-based solution. Moreover, we explore using two non-standard metrics to evaluate the quality of the generated distractors and feedback messages. We conduct extensive experiments on these tasks using a real-world MCQ dataset that contains student response information. Our findings suggest that there is a lot of room for improvement in automated distractor and feedback generation. We also outline several directions for future work
Abstract（参考訳）: 多重選択質問(MCQ)は、管理しやすく、格付けしやすく、評価と実践の両方において信頼性の高いフォーマットであるため、ほぼ全てのレベルの教育においてユビキタスである。 mcqsの重要な側面は、生徒の特定の誤解や不十分な知識をターゲットにした不正確なオプションである。これまで、高品質の邪魔者を作る仕事は、教師やコンテンツデザイナーにとって労働集約的なプロセスであり、スケーラビリティは限られていた。本研究では,大規模言語モデルを用いた数学MCQにおける自動散逸器とそれに対応するフィードバックメッセージ生成の課題について検討する。我々は,これら2つのタスクを定式化し,シンプルで文脈内学習に基づくソリューションを提案する。さらに,2つの非標準メトリクスを用いて,生成した気晴らしとフィードバックメッセージの品質評価を行う。我々は,学生の回答情報を含む実世界のMCQデータセットを用いて,これらのタスクに関する広範な実験を行う。この結果から,自動イントラクタとフィードバック生成の改善の余地が十分にあることが示唆された。今後の作業の方向性も概説します

関連論文リスト

Inferential Question Answering [67.54465021408724]
新しいタスクであるInferential QAを導入します。これは、答えをサポートするパスから答えを推測するためにモデルに挑戦するものです。そこで本研究では,7,401問と2.4M節からなるQUITデータセットを構築した。我々は,従来のQAタスクに有効な手法が推論QAに苦しむことを示し,レトリバーは性能が低下し,リランカーは利得が制限され,微調整は不整合の改善をもたらすことを示した。
論文参考訳（メタデータ） (2026-02-01T14:02:43Z)
MMAU: A Holistic Benchmark of Agent Capabilities Across Diverse Domains [54.117238759317004]
大規模マルチタスクエージェント理解(MMAU)ベンチマークは、複雑な環境設定を必要としない包括的なオフラインタスクを特徴としている。ツールユース、DAG(Directed Acyclic Graph)QA、データサイエンスと機械学習コーディング、コンテストレベルのプログラミング、数学の5分野にわたるモデルを評価する。 3K以上の異なるプロンプトを含む20の精巧に設計されたタスクにより、MMAUはLLMエージェントの強度と限界を評価するための包括的なフレームワークを提供する。
論文参考訳（メタデータ） (2024-07-18T00:58:41Z)
Math Multiple Choice Question Generation via Human-Large Language Model Collaboration [5.081508251092439]
複数選択質問(MCQ)は,学生の知識を評価するための一般的な方法である。大規模言語モデル(LLM)の最近の進歩は、MCQ生成の自動化への関心を喚起している。本稿では,LLMと教育者間の協調を支援するためのプロトタイプツールを提案する。
論文参考訳（メタデータ） (2024-05-01T20:53:13Z)
Improving Automated Distractor Generation for Math Multiple-choice Questions with Overgenerate-and-rank [44.04217284677347]
本稿では,過剰生成・ランク化により生成したトラクタの品質を向上する新しい手法を提案する。我々のランキングモデルでは、人間が作成したものよりも、人間の権威のあるものの方が好まれるが、人間の権威のあるトラクタとのアライメントが向上する。
論文参考訳（メタデータ） (2024-04-19T00:25:44Z)
Exploring Automated Distractor Generation for Math Multiple-choice Questions via Large Language Models [40.50115385623107]
マルチチョイス質問(MCQ)は、評価や実践において、管理しやすく、格付けし、信頼性の高いフォーマットであるため、ほぼ全てのレベルの教育においてユビキタスである。 MCQの最も重要な側面の1つは、実際の学生の間でよくある誤りや誤解を狙った誤った選択肢である。現在まで、高品質なイントラクタを開発するというタスクは、拡張性に制限のある教師や学習コンテンツデザイナにとって、労働力と時間を要するプロセスのままである。
論文参考訳（メタデータ） (2024-04-02T17:31:58Z)
Distractor Generation in Multiple-Choice Tasks: A Survey of Methods, Datasets, and Evaluation [20.14906249952034]
イントラクタ生成タスクは、客観的な質問に対して不正確だが妥当な選択肢を生成することに焦点を当てる。人工知能(AI)の進化は、タスクを従来の手法からニューラルネットワークや事前訓練された言語モデルに移行した。本調査では、英語の客観的質問に対して、イントラクタ生成タスク、データセット、メソッド、および現在の評価指標について検討する。
論文参考訳（メタデータ） (2024-02-02T15:53:31Z)
Rethinking Label Smoothing on Multi-hop Question Answering [87.68071401870283]
MHQA (Multi-Hop Question Answering) は質問応答において重要な分野である。本研究では,マルチホップ推論の性能を制限する主要な要因を解析する。学習プロセスに不確実性を組み込んだ新しいラベル平滑化手法F1 Smoothingを提案する。
論文参考訳（メタデータ） (2022-12-19T14:48:08Z)
Learning to Reuse Distractors to support Multiple Choice Question Generation in Education [19.408786425460498]
本稿では,教師が複数選択質問(MCQ)の作成を支援するために,手作業による回答と注意散らしの集合をいかに活用するかを検討する。データ駆動モデルをいくつか構築し,静的な特徴ベースモデルと比較した。自動評価と人的評価は、コンテキスト認識モデルが静的な特徴ベースのアプローチを一貫して上回っていることを示している。
論文参考訳（メタデータ） (2022-10-25T12:48:56Z)
ProtoTransformer: A Meta-Learning Approach to Providing Student Feedback [54.142719510638614]
本稿では,フィードバックを数発の分類として提供するという課題について考察する。メタラーナーは、インストラクターによるいくつかの例から、新しいプログラミング質問に関する学生のコードにフィードバックを与えるように適応します。本手法は,第1段階の大学が提供したプログラムコースにおいて,16,000名の学生試験ソリューションに対するフィードバックの提供に成功している。
論文参考訳（メタデータ） (2021-07-23T22:41:28Z)
Neural Multi-Task Learning for Teacher Question Detection in Online Classrooms [50.19997675066203]
教師の音声記録から質問を自動的に検出するエンドツーエンドのニューラルネットワークフレームワークを構築している。マルチタスク学習手法を取り入れることで,質問の種類によって意味的関係の理解を深めることが可能となる。
論文参考訳（メタデータ） (2020-05-16T02:17:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。