論文の概要: Student Classroom Behavior Detection based on YOLOv7-BRA and Multi-Model Fusion
- arxiv url: http://arxiv.org/abs/2305.07825v2
- Date: Mon, 9 Sep 2024 11:08:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-11 04:24:51.596250
- Title: Student Classroom Behavior Detection based on YOLOv7-BRA and Multi-Model Fusion
- Title(参考訳): YOLOv7-BRAとマルチモデル融合に基づく学生の授業行動検出
- Authors: Fan Yang, Tao Wang, Xiaofei Wang,
- Abstract要約: YOLOv7-BRAに基づく授業行動検出システムを提案する。
立ち上がり、座り、話すこと、聞くこと、歩くこと、手を上げること、読むこと、書くことを含む8つの異なる行動パターンを特定しました。
SCB-Datasetの実験を行い、YOLOv7-BRAはmAP@0.5の87.1%を達成した。
- 参考スコア(独自算出の注目度): 8.800332201027299
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurately detecting student behavior in classroom videos can aid in analyzing their classroom performance and improving teaching effectiveness. However, the current accuracy rate in behavior detection is low. To address this challenge, we propose the Student Classroom Behavior Detection system based on based on YOLOv7-BRA (YOLOv7 with Bi-level Routing Attention ). We identified eight different behavior patterns, including standing, sitting, speaking, listening, walking, raising hands, reading, and writing. We constructed a dataset, which contained 11,248 labels and 4,001 images, with an emphasis on the common behavior of raising hands in a classroom setting (Student Classroom Behavior dataset, SCB-Dataset). To improve detection accuracy, we added the biformer attention module to the YOLOv7 network. Finally, we fused the results from YOLOv7 CrowdHuman, SlowFast, and DeepSort models to obtain student classroom behavior data. We conducted experiments on the SCB-Dataset, and YOLOv7-BRA achieved an mAP@0.5 of 87.1%, resulting in a 2.2% improvement over previous results. Our SCB-dataset can be downloaded from: https://github.com/Whiffe/SCB-datase
- Abstract(参考訳): 教室ビデオにおける生徒の行動の正確な検出は、教室のパフォーマンスを分析し、教育効果を向上させるのに役立つ。
しかし、動作検出における現在の精度は低い。
そこで本稿では, YOLOv7-BRA (YOLOv7 with Bi-level Routing Attention ) に基づく授業行動検出システムを提案する。
立ち上がり、座り、話すこと、聞くこと、歩くこと、手を上げること、読むこと、書くことを含む8つの異なる行動パターンを特定しました。
本研究では,11,248個のラベルと4,001個の画像を含むデータセットを構築し,教室環境における手を挙げる一般的な行動に着目した(Student Classroom Behavior dataset, SCB-Dataset)。
検出精度を向上させるため, YOLOv7ネットワークにバイフォーマーアテンションモジュールを付加した。
最後に、学生の教室行動データを得るために、YOLOv7 CrowdHuman、SlowFast、DeepSortモデルの結果を融合した。
SCB-Datasetの実験を行い、YOLOv7-BRAはmAP@0.5の87.1%を達成した。
SCBデータセットは、https://github.com/Whiffe/SCB-dataseからダウンロードできます。
関連論文リスト
- BAL: Balancing Diversity and Novelty for Active Learning [53.289700543331925]
多様な不確実なデータのバランスをとるために適応的なサブプールを構築する新しいフレームワークであるBalancing Active Learning (BAL)を導入する。
我々のアプローチは、広く認識されているベンチマークにおいて、確立されたすべてのアクティブな学習方法より1.20%優れています。
論文 参考訳(メタデータ) (2023-12-26T08:14:46Z) - Student Classroom Behavior Detection based on Spatio-Temporal Network and Multi-Model Fusion [6.069671582146248]
生徒の授業行動を自動的に検出する深層学習手法は,授業成績を分析し,授業効果を向上させる上で有望なアプローチである。
しかし、学生の行動に関する公開データセットの欠如と、そのようなデータセットを手作業でラベル付けするコストは、この分野の研究者にとって大きな課題となっている。
学生教室シナリオデータセットを画像・時間的行動データセットを通じて拡張する手法を提案する。
論文 参考訳(メタデータ) (2023-10-25T00:46:26Z) - A Spatio-Temporal Attention-Based Method for Detecting Student Classroom Behaviors [3.6119958671506707]
生徒の行動検出の精度が低いことが問題となっている。
学生の授業行動検出のための時空間アテンションベース手法(BDSTA)を提案する。
SlowFastモデルと比較すると,BDSTAを用いた生徒行動分類の平均精度は8.94%向上した。
論文 参考訳(メタデータ) (2023-10-04T01:47:36Z) - SCB-Dataset3: A Benchmark for Detecting Student Classroom Behavior [6.878489963907169]
学生のクラスルーム行動データセット(SCB-dataset3)は現実のシナリオを表す。
データセットは5686枚の画像と45578枚のラベルで構成されており、手作り、読み書き、電話の使用、頭をお辞儀、テーブルの上に傾ける6つの行動に焦点を当てている。
論文 参考訳(メタデータ) (2023-10-04T01:43:46Z) - Student Classroom Behavior Detection based on Improved YOLOv7 [3.6119958671506707]
改良型YOLOv7に基づく授業行動検出手法を提案する。
まず、学生教室行動データセット(SCB-Dataset)を作成し、18.4kラベルと4.2kイメージを含む。
混み合ったシーンにおける検出精度を向上させるために,バイフォーマーアテンションモジュールとWise-IoUをYOLOv7ネットワークに統合した。
実験はSCB-Datasetで行われ、モデルがmAP@0.5の79%を達成し、その結果、以前の結果よりも1.8%改善した。
論文 参考訳(メタデータ) (2023-06-06T00:01:40Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - SCB-dataset: A Dataset for Detecting Student Classroom Behavior [3.6119958671506707]
学生クラスルーム行動データセット(SCBデータセット)には、11,248のラベルと4,003のイメージが含まれている。
データセットには11,248のラベルと4,003のイメージが含まれており、手作り行動に焦点を当てている。
YOLOv7アルゴリズムを用いてデータセットを評価し,平均精度(マップ)を85.3%まで向上させた。
論文 参考訳(メタデータ) (2023-04-05T15:02:30Z) - To be Critical: Self-Calibrated Weakly Supervised Learning for Salient
Object Detection [95.21700830273221]
弱教師付き有色物体検出(WSOD)は,画像レベルのアノテーションを用いた有色度モデルの開発を目的としている。
擬似ラベルとネットワーク予測の相互校正ループを明確に設定し,自己校正学習戦略を提案する。
十分に整合したアノテーションを持つはるかに小さなデータセットであっても、モデルがより優れたパフォーマンスと一般化性を達成するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-04T02:45:22Z) - Towards Reducing Labeling Cost in Deep Object Detection [61.010693873330446]
本稿では,検知器の不確実性と頑健性の両方を考慮した,アクティブラーニングのための統一的なフレームワークを提案する。
提案手法は, 確率分布のドリフトを抑えながら, 極めて確実な予測を擬似ラベル化することができる。
論文 参考訳(メタデータ) (2021-06-22T16:53:09Z) - CoMatch: Semi-supervised Learning with Contrastive Graph Regularization [86.84486065798735]
CoMatchは、支配的なアプローチを統一する、新しい半教師付き学習手法である。
複数のデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-11-23T02:54:57Z) - SLADE: A Self-Training Framework For Distance Metric Learning [75.54078592084217]
我々は、追加のラベルのないデータを活用することで、検索性能を向上させるための自己学習フレームワークSLADEを提案する。
まず、ラベル付きデータに基づいて教師モデルをトレーニングし、ラベルなしデータに対して擬似ラベルを生成する。
次に、最終機能埋め込みを生成するために、ラベルと擬似ラベルの両方で学生モデルをトレーニングします。
論文 参考訳(メタデータ) (2020-11-20T08:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。