論文の概要: The NCTE Transcripts: A Dataset of Elementary Math Classroom Transcripts
- arxiv url: http://arxiv.org/abs/2211.11772v1
- Date: Mon, 21 Nov 2022 19:00:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 17:25:44.559469
- Title: The NCTE Transcripts: A Dataset of Elementary Math Classroom Transcripts
- Title(参考訳): The NCTE Transcripts: a dataset of elementary Math Classroom Transcripts
- Authors: Dorottya Demszky and Heather Hill
- Abstract要約: 研究者が利用可能な数学教室の教科書の最大のデータセットについて紹介する。
匿名化された文字起こしは、4つの学区の317人の教師のデータを表現している。
我々は、ターンレベルのアノテーションに基づいて訓練された自然言語処理モデルが、対話的談話の動きを識別できることを実証した。
- 参考スコア(独自算出の注目度): 4.931378519409227
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classroom discourse is a core medium of instruction -- analyzing it can
provide a window into teaching and learning as well as driving the development
of new tools for improving instruction. We introduce the largest dataset of
mathematics classroom transcripts available to researchers, and demonstrate how
this data can help improve instruction. The dataset consists of 1,660 45-60
minute long 4th and 5th grade elementary mathematics observations collected by
the National Center for Teacher Effectiveness (NCTE) between 2010-2013. The
anonymized transcripts represent data from 317 teachers across 4 school
districts that serve largely historically marginalized students. The
transcripts come with rich metadata, including turn-level annotations for
dialogic discourse moves, classroom observation scores, demographic
information, survey responses and student test scores. We demonstrate that our
natural language processing model, trained on our turn-level annotations, can
learn to identify dialogic discourse moves and these moves are correlated with
better classroom observation scores and learning outcomes. This dataset opens
up several possibilities for researchers, educators and policymakers to learn
about and improve K-12 instruction. The data and its terms of use can be
accessed here: https://github.com/ddemszky/classroom-transcript-analysis
- Abstract(参考訳): 分析は、教育と学習の窓口を提供するだけでなく、教育を改善するための新しいツールの開発を促進することができる。
我々は、研究者が利用可能な数学教室の教科書の最大のデータセットを紹介し、このデータが教育改善にどのように役立つかを実証する。
このデータセットは、2010年から2013年にかけてNCTE(National Center for Teacher Effectiveness)が収集した1,660の45-60分の長さと5年生の初等数学の観測から成り立っている。
匿名化された書き起こしは4つの学区にまたがる317人の教師のデータを表している。
書き起こしには、対話的談話の動き、教室の観察スコア、人口統計情報、調査回答、学生テストスコアのターンレベルアノテーションなど、豊富なメタデータが含まれている。
我々の自然言語処理モデルはターンレベルのアノテーションに基づいて学習し、対話的談話の動きを識別できることを示し、これらの動きはより良い教室の観察スコアと学習結果と相関することを示した。
このデータセットは、研究者、教育者、政策立案者がK-12指導について学び、改善するいくつかの可能性を開く。
https://github.com/ddemszky/classroom-transcript- analysis データのアクセスと利用規約は以下のとおりである。
関連論文リスト
- Towards Student Actions in Classroom Scenes: New Dataset and Baseline [43.268586725768465]
複雑な教室シーンを対象とした,SAV(Multi-label student action video)データセットを提案する。
データセットは、758の教室から、4,324の慎重にトリミングされたビデオクリップで構成され、それぞれに15の教室で生徒が表示するアクションがラベル付けされている。
論文 参考訳(メタデータ) (2024-09-02T03:44:24Z) - Measuring Five Accountable Talk Moves to Improve Instruction at Scale [1.4549461207028445]
説明可能な会話理論にインスパイアされた5つの指導的話の動きを識別するモデルを微調整する。
学習者のエンゲージメントと満足度を指標として,各講演の動きのインストラクターの使い方を関連づける。
これらの結果は、説明可能な話し方の有効性に関する過去の研究を裏付けるものである。
論文 参考訳(メタデータ) (2023-11-02T03:04:50Z) - MathDial: A Dialogue Tutoring Dataset with Rich Pedagogical Properties
Grounded in Math Reasoning Problems [74.73881579517055]
そこで本稿では,一般学生の誤りを表現した大規模言語モデルを用いて,人間教師の対話を生成する枠組みを提案する。
このフレームワークを用いて3kの1対1の教師-学生対話のデータセットであるMathDialを収集する方法について述べる。
論文 参考訳(メタデータ) (2023-05-23T21:44:56Z) - Selective Annotation Makes Language Models Better Few-Shot Learners [97.07544941620367]
大規模な言語モデルはコンテキスト内学習を実行でき、いくつかのタスクデモから新しいタスクを学ぶことができる。
本研究は、新しい自然言語タスクのためのデータセット作成において、文脈内学習がもたらす意味について考察する。
本稿では,無教師付きグラフベースの選択的アノテーションであるvoke-kを提案する。
論文 参考訳(メタデータ) (2022-09-05T14:01:15Z) - The TalkMoves Dataset: K-12 Mathematics Lesson Transcripts Annotated for
Teacher and Student Discursive Moves [8.090330715662962]
本稿では、567人の人間によるK-12数学の授業書き起こしからなるTalkMovesデータセットについて述べる。
このデータセットは、教育者、政策立案者、研究者によってK-12の数学教室における教師と生徒の談話の性質を理解するために利用することができる。
論文 参考訳(メタデータ) (2022-04-06T18:12:30Z) - A Semi-Supervised Learning Approach with Two Teachers to Improve
Breakdown Identification in Dialogues [25.499578161686355]
そこで我々は,この課題に対処するために,教師・教師・学生を対象とした新しい学習フレームワークを提案する。
本稿では,ラベル付きデータと乱ラベル付きデータで学習した教師を2名紹介する。
我々は、未ラベルデータを活用して、未ラベルデータのラベル付けを洗練させるために2人の教師を雇う学生教育における分類を改善する。
論文 参考訳(メタデータ) (2022-02-22T14:39:51Z) - On Guiding Visual Attention with Language Specification [76.08326100891571]
注意をそらすのではなく,タスク関連機能に分類証拠を限定するためのアドバイスとして,ハイレベルな言語仕様を用いる。
この方法で空間的注意を監督することは、偏りのあるノイズのあるデータを用いた分類タスクの性能を向上させる。
論文 参考訳(メタデータ) (2022-02-17T22:40:19Z) - Annotation Curricula to Implicitly Train Non-Expert Annotators [56.67768938052715]
自発的な研究は、しばしば、アノテータがタスク、そのアノテーションスキーム、およびデータドメインに精通することを要求する。
これは最初は圧倒的であり、精神的に課税され、結果として生じるアノテーションにエラーを誘導する。
暗黙的にアノテータを訓練する新しい手法であるアノテーションキュリキュラを提案する。
論文 参考訳(メタデータ) (2021-06-04T09:48:28Z) - SLADE: A Self-Training Framework For Distance Metric Learning [75.54078592084217]
我々は、追加のラベルのないデータを活用することで、検索性能を向上させるための自己学習フレームワークSLADEを提案する。
まず、ラベル付きデータに基づいて教師モデルをトレーニングし、ラベルなしデータに対して擬似ラベルを生成する。
次に、最終機能埋め込みを生成するために、ラベルと擬似ラベルの両方で学生モデルをトレーニングします。
論文 参考訳(メタデータ) (2020-11-20T08:26:10Z) - Watch and Learn: Mapping Language and Noisy Real-world Videos with
Self-supervision [54.73758942064708]
我々は、明示的なアノテーションを使わずに、文章と騒々しいビデオスニペットのマッピングを学習することで、視覚と自然言語を理解するように機械に教える。
トレーニングと評価のために、多数のオンラインビデオとサブタイトルを含む新しいデータセットApartmenTourをコントリビュートする。
論文 参考訳(メタデータ) (2020-11-19T03:43:56Z) - Teaching to Learn: Sequential Teaching of Agents with Inner States [20.556373950863247]
学習者の内的状態が授業の相互作用によって変化するようなマルチエージェントの定式化を導入する。
このような学習者を指導するために,学習者の今後のパフォーマンスを考慮に入れた最適制御手法を提案する。
論文 参考訳(メタデータ) (2020-09-14T07:03:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。