論文の概要: Multimodal Classification of Teaching Activities from University Lecture
Recordings
- arxiv url: http://arxiv.org/abs/2312.17262v1
- Date: Sun, 24 Dec 2023 08:33:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 12:50:45.405007
- Title: Multimodal Classification of Teaching Activities from University Lecture
Recordings
- Title(参考訳): 大学講義記録からの授業活動のマルチモーダル分類
- Authors: Oscar Sapena and Eva Onaindia
- Abstract要約: 本稿では,授業のいつでも実施されている活動の種類を特定するマルチモーダル分類アルゴリズムを提案する。
いくつかの学術活動は、音声信号とより容易に識別でき、テキストの書き起こしに頼って他者を特定する必要がある。
- 参考スコア(独自算出の注目度): 0.9790236766474201
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The way of understanding online higher education has greatly changed due to
the worldwide pandemic situation. Teaching is undertaken remotely, and the
faculty incorporate lecture audio recordings as part of the teaching material.
This new online teaching-learning setting has largely impacted university
classes. While online teaching technology that enriches virtual classrooms has
been abundant over the past two years, the same has not occurred in supporting
students during online learning. {To overcome this limitation, our aim is to
work toward enabling students to easily access the piece of the lesson
recording in which the teacher explains a theoretical concept, solves an
exercise, or comments on organizational issues of the course. To that end, we
present a multimodal classification algorithm that identifies the type of
activity that is being carried out at any time of the lesson by using a
transformer-based language model that exploits features from the audio file and
from the automated lecture transcription. The experimental results will show
that some academic activities are more easily identifiable with the audio
signal while resorting to the text transcription is needed to identify others.
All in all, our contribution aims to recognize the academic activities of a
teacher during a lesson.
- Abstract(参考訳): 世界的なパンデミックにより、オンライン高等教育の理解方法は大きく変化している。
授業は遠隔で行われ、教員は教材の一部として講義音声記録を組み込む。
この新しいオンライン学習環境は、大学の授業に大きな影響を与えている。
仮想教室を充実させるオンライン教育技術は,過去2年間に多く行われてきたが,オンライン学習の学生支援においては,同じことが起こっていない。
2) この制限を克服するためには,教師が理論的概念を説明し,演習を解決し,教科の組織的問題についてコメントする授業記録に,学生が容易にアクセスできるようにすることが目的である。
そこで本研究では,音声ファイルと自動講義書き起こしの機能を利用するトランスフォーマーベース言語モデルを用いて,授業のいつでも実行されているアクティビティの種類を識別するマルチモーダル分類アルゴリズムを提案する。
実験の結果,音声信号の識別が容易で,テキストの書き起こしによる識別が容易であることが判明した。
私たちの貢献は、授業中の教師の学業活動を認識することを目的としています。
関連論文リスト
- Awaking the Slides: A Tuning-free and Knowledge-regulated AI Tutoring System via Language Model Coordination [52.20542825755132]
Slide2Lectureは、チューニング不要で知識を制御した知的チューリングシステムである。
入力された講義スライドを、不均一な教育行為の集合からなる構造化された教育課題に効果的に変換することができる。
教師や開発者にとって、Slide2Lectureはパーソナライズされた要求に対応するカスタマイズを可能にする。
論文 参考訳(メタデータ) (2024-09-11T16:03:09Z) - Intelligent Interface: Enhancing Lecture Engagement with Didactic Activity Summaries [0.054204929130712134]
このプロトタイプは、機械学習に基づく技術を用いて、講義のビデオ録画の中で選択された実践的、行動的な教師の特徴を認識する。
このシステムは、新しい/追加の機械学習モデルと画像およびビデオ分析のためのソフトウェアモジュールの(将来の)統合のための柔軟性を提供する。
論文 参考訳(メタデータ) (2024-06-20T12:45:23Z) - Audio Representation Learning by Distilling Video as Privileged
Information [25.71206255965502]
本稿では,音声・視覚データを用いた深層音声表現学習のための新しい手法を提案する。
我々は、特権情報(LUPI)を用いた学習の枠組みの下で、教師による知識蒸留を採用する。
LUPIを用いた先行研究と同様に、単独の音声認識よりも大幅な改善が見られた。
論文 参考訳(メタデータ) (2023-02-06T15:09:34Z) - Multimodal Lecture Presentations Dataset: Understanding Multimodality in
Educational Slides [57.86931911522967]
学習内容のマルチモーダル理解における機械学習モデルの能力を検証する。
このデータセットには,180時間以上のビデオと9000時間以上のスライドが,各科目から10人の講師が参加している。
マルチモーダル・トランスフォーマーであるPolyViLTを導入する。
論文 参考訳(メタデータ) (2022-08-17T05:30:18Z) - The TalkMoves Dataset: K-12 Mathematics Lesson Transcripts Annotated for
Teacher and Student Discursive Moves [8.090330715662962]
本稿では、567人の人間によるK-12数学の授業書き起こしからなるTalkMovesデータセットについて述べる。
このデータセットは、教育者、政策立案者、研究者によってK-12の数学教室における教師と生徒の談話の性質を理解するために利用することができる。
論文 参考訳(メタデータ) (2022-04-06T18:12:30Z) - Real-time Attention Span Tracking in Online Education [0.0]
本稿では,オンライン授業中の学生のリアルタイムの注意レベルを監視するために,カメラフィードとマイクロホン入力を利用するメカニズムを提案する。
我々は,5つの異なる非言語的特徴を用いて,コンピュータによるタスク中の学生の注意スコアを計算し,学生と組織の両方に対してリアルタイムのフィードバックを生成するシステムを提案する。
論文 参考訳(メタデータ) (2021-11-29T17:05:59Z) - Iterative Teacher-Aware Learning [136.05341445369265]
人間の教育において、教師と学生はコミュニケーション効率を最大化するために適応的に交流することができる。
本稿では,教師の協調意図を可能性関数に組み込むことができる,勾配最適化に基づく教師認識学習者を提案する。
論文 参考訳(メタデータ) (2021-10-01T00:27:47Z) - Seminar Learning for Click-Level Weakly Supervised Semantic Segmentation [149.9226057885554]
クリックレベルの監視を伴う意味的セグメンテーションのための新しい学習パラダイムであるセミナー学習を提案する。
セミナー学習の理論的根拠は、異なるネットワークからの知識を活用して、クリックレベルのアノテーションで提供される不十分な情報を補うことである。
実験により,72.51%の新たな最先端性能を実現するセミナー学習の有効性が示された。
論文 参考訳(メタデータ) (2021-08-30T17:27:43Z) - Interactive Knowledge Distillation [79.12866404907506]
本稿では,効率的な知識蒸留のための対話型指導戦略を活用するために,対話型知識蒸留方式を提案する。
蒸留工程では,教師と学生のネットワーク間の相互作用を交換操作により行う。
教員ネットワークの典型的な設定による実験により,IAKDで訓練された学生ネットワークは,従来の知識蒸留法で訓練された学生ネットワークよりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-03T03:22:04Z) - Neural Multi-Task Learning for Teacher Question Detection in Online
Classrooms [50.19997675066203]
教師の音声記録から質問を自動的に検出するエンドツーエンドのニューラルネットワークフレームワークを構築している。
マルチタスク学習手法を取り入れることで,質問の種類によって意味的関係の理解を深めることが可能となる。
論文 参考訳(メタデータ) (2020-05-16T02:17:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。