論文の概要: A Spatio-Temporal Attention-Based Method for Detecting Student Classroom Behaviors
- arxiv url: http://arxiv.org/abs/2310.02523v4
- Date: Mon, 9 Sep 2024 10:57:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-11 04:03:29.670601
- Title: A Spatio-Temporal Attention-Based Method for Detecting Student Classroom Behaviors
- Title(参考訳): 時空間アテンションに基づく生徒の授業行動検出法
- Authors: Fan Yang,
- Abstract要約: 生徒の行動検出の精度が低いことが問題となっている。
学生の授業行動検出のための時空間アテンションベース手法(BDSTA)を提案する。
SlowFastモデルと比較すると,BDSTAを用いた生徒行動分類の平均精度は8.94%向上した。
- 参考スコア(独自算出の注目度): 3.6119958671506707
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurately detecting student behavior from classroom videos is beneficial for analyzing their classroom status and improving teaching efficiency. However, low accuracy in student classroom behavior detection is a prevalent issue. To address this issue, we propose a Spatio-Temporal Attention-Based Method for Detecting Student Classroom Behaviors (BDSTA). Firstly, the SlowFast network is used to generate motion and environmental information feature maps from the video. Then, the spatio-temporal attention module is applied to the feature maps, including information aggregation, compression and stimulation processes. Subsequently, attention maps in the time, channel and space dimensions are obtained, and multi-label behavior classification is performed based on these attention maps. To solve the long-tail data problem that exists in student classroom behavior datasets, we use an improved focal loss function to assign more weight to the tail class data during training. Experimental results are conducted on a self-made student classroom behavior dataset named STSCB. Compared with the SlowFast model, the average accuracy of student behavior classification detection improves by 8.94\% using BDSTA.
- Abstract(参考訳): 授業映像から生徒の行動の正確な検出は,授業状況の分析と指導効率の向上に有用である。
しかし、学生の授業行動検出の精度が低いことが問題となっている。
この問題に対処するため,学生の授業行動検出のための時空間注意ベース手法(BDSTA)を提案する。
まず、SlowFastネットワークを使用して、動画から動きと環境情報の特徴マップを生成する。
次に、情報集約、圧縮、刺激プロセスを含む特徴マップに時空間注目モジュールを適用する。
その後、時間、チャネル、空間次元のアテンションマップを取得し、これらのアテンションマップに基づいてマルチラベルの行動分類を行う。
学生の授業行動データセットに存在する長期データ問題を解決するため、学習中のテールクラスデータにより重みを割り当てるために焦点損失関数を改良した。
STSCBという自作教室行動データセットを用いて実験を行った。
SlowFast モデルと比較すると,BDSTA を用いた学生行動分類の精度は8.94 %向上した。
関連論文リスト
- Adaptive Rentention & Correction for Continual Learning [114.5656325514408]
連続学習における一般的な問題は、最新のタスクに対する分類層のバイアスである。
アダプティブ・リテンション・アンド・コレクション (ARC) のアプローチを例に挙げる。
ARCはCIFAR-100とImagenet-Rのデータセットで平均2.7%と2.6%のパフォーマンス向上を達成した。
論文 参考訳(メタデータ) (2024-05-23T08:43:09Z) - Student Classroom Behavior Detection based on Spatio-Temporal Network and Multi-Model Fusion [6.069671582146248]
生徒の授業行動を自動的に検出する深層学習手法は,授業成績を分析し,授業効果を向上させる上で有望なアプローチである。
しかし、学生の行動に関する公開データセットの欠如と、そのようなデータセットを手作業でラベル付けするコストは、この分野の研究者にとって大きな課題となっている。
学生教室シナリオデータセットを画像・時間的行動データセットを通じて拡張する手法を提案する。
論文 参考訳(メタデータ) (2023-10-25T00:46:26Z) - Student Classroom Behavior Detection based on Improved YOLOv7 [3.6119958671506707]
改良型YOLOv7に基づく授業行動検出手法を提案する。
まず、学生教室行動データセット(SCB-Dataset)を作成し、18.4kラベルと4.2kイメージを含む。
混み合ったシーンにおける検出精度を向上させるために,バイフォーマーアテンションモジュールとWise-IoUをYOLOv7ネットワークに統合した。
実験はSCB-Datasetで行われ、モデルがmAP@0.5の79%を達成し、その結果、以前の結果よりも1.8%改善した。
論文 参考訳(メタデータ) (2023-06-06T00:01:40Z) - Knowledge Diffusion for Distillation [53.908314960324915]
知識蒸留(KD)における教師と学生の表現ギャップ
これらの手法の本質は、ノイズ情報を捨て、その特徴の貴重な情報を蒸留することである。
DiffKDと呼ばれる新しいKD手法を提案し、拡散モデルを用いて特徴を明示的に識別し一致させる。
論文 参考訳(メタデータ) (2023-05-25T04:49:34Z) - Student Classroom Behavior Detection based on YOLOv7-BRA and Multi-Model Fusion [8.800332201027299]
YOLOv7-BRAに基づく授業行動検出システムを提案する。
立ち上がり、座り、話すこと、聞くこと、歩くこと、手を上げること、読むこと、書くことを含む8つの異なる行動パターンを特定しました。
SCB-Datasetの実験を行い、YOLOv7-BRAはmAP@0.5の87.1%を達成した。
論文 参考訳(メタデータ) (2023-05-13T02:46:41Z) - Boundary-Denoising for Video Activity Localization [57.9973253014712]
本稿では,映像活動のローカライゼーション問題について,認知的視点から検討する。
具体的には,DenoiseLocというエンコーダデコーダモデルを提案する。
実験によると、DenoiseLocはいくつかのビデオアクティビティ理解タスクで%前進している。
論文 参考訳(メタデータ) (2023-04-06T08:48:01Z) - ALLSH: Active Learning Guided by Local Sensitivity and Hardness [98.61023158378407]
本稿では,局所感度と硬度認識獲得機能を備えたラベル付きサンプルの検索を提案する。
本手法は,様々な分類タスクにおいてよく用いられるアクティブラーニング戦略よりも一貫した利得が得られる。
論文 参考訳(メタデータ) (2022-05-10T15:39:11Z) - Self-supervised Pretraining with Classification Labels for Temporal
Activity Detection [54.366236719520565]
時間的アクティビティ検出は、1フレーム当たりのアクティビティクラスを予測することを目的としている。
検出に必要なフレームレベルのアノテーションが高価なため、検出データセットの規模は限られている。
本研究では,分類ラベルを利用した自己教師付き事前学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-26T18:59:28Z) - ZSTAD: Zero-Shot Temporal Activity Detection [107.63759089583382]
本研究では,ゼロショット時間的活動検出(ZSTAD)と呼ばれる新たなタスク設定を提案する。
このソリューションのアーキテクチャとして,R-C3Dに基づくエンドツーエンドのディープネットワークを設計する。
THUMOS14とCharadesデータセットの両方の実験は、目に見えない活動を検出するという点で有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-03-12T02:40:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。