論文の概要: Learning Behavior Recognition in Smart Classroom with Multiple Students
Based on YOLOv5
- arxiv url: http://arxiv.org/abs/2303.10916v1
- Date: Mon, 20 Mar 2023 07:16:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 16:21:22.571890
- Title: Learning Behavior Recognition in Smart Classroom with Multiple Students
Based on YOLOv5
- Title(参考訳): YOLOv5に基づく複数学生によるスマート教室における学習行動認識
- Authors: Zhifeng Wang, Jialong Yao, Chunyan Zeng, Wanxuan Wu, Hongmin Xu, Yang
Yang
- Abstract要約: 学生の教室行動の認識と分析を行うために, YOLOアルゴリズムを1回のみ用いたYOLOv5sネットワーク構造を提案する。
YOLOv4と比較すると,提案手法はmAPの性能を11%向上させることができる。
- 参考スコア(独自算出の注目度): 4.239144309557045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning-based computer vision technology has grown stronger in recent
years, and cross-fertilization using computer vision technology has been a
popular direction in recent years. The use of computer vision technology to
identify students' learning behavior in the classroom can reduce the workload
of traditional teachers in supervising students in the classroom, and ensure
greater accuracy and comprehensiveness. However, existing student learning
behavior detection systems are unable to track and detect multiple targets
precisely, and the accuracy of learning behavior recognition is not high enough
to meet the existing needs for the accurate recognition of student behavior in
the classroom. To solve this problem, we propose a YOLOv5s network structure
based on you only look once (YOLO) algorithm to recognize and analyze students'
classroom behavior in this paper. Firstly, the input images taken in the smart
classroom are pre-processed. Then, the pre-processed image is fed into the
designed YOLOv5 networks to extract deep features through convolutional layers,
and the Squeeze-and-Excitation (SE) attention detection mechanism is applied to
reduce the weight of background information in the recognition process.
Finally, the extracted features are classified by the Feature Pyramid Networks
(FPN) and Path Aggregation Network (PAN) structures. Multiple groups of
experiments were performed to compare with traditional learning behavior
recognition methods to validate the effectiveness of the proposed method. When
compared with YOLOv4, the proposed method is able to improve the mAP
performance by 11%.
- Abstract(参考訳): 近年,深層学習に基づくコンピュータビジョン技術が強くなり,近年はコンピュータビジョン技術を用いた異種交配が普及している。
コンピュータビジョン技術を用いて教室で生徒の学習行動を識別することで、教室で生徒を監督する従来の教師の作業負荷を削減し、正確性と包括性を高めることができる。
しかし、既存の学生学習行動検出システムは、複数の目標を正確に追跡・検出できず、学習行動認識の精度は、教室における学生行動の正確な認識に対する既存のニーズを満たすほど高くない。
そこで本稿では, 生徒の授業行動の認識と分析を行うために, YOLOアルゴリズムを1回だけ用いたYOLOv5sネットワーク構造を提案する。
まず、スマート教室で撮影された入力画像を前処理する。
そして、前処理した画像を設計されたYOLOv5ネットワークに入力して畳み込み層を介して深い特徴を抽出し、Squeeze-and-Excitation(SE)アテンション検出機構を適用して認識処理における背景情報の重みを低減する。
最後に、抽出した特徴を特徴ピラミッドネットワーク(FPN)と経路集約ネットワーク(PAN)構造で分類する。
提案手法の有効性を検証するために,従来の学習行動認識法との比較実験を行った。
YOLOv4と比較すると,提案手法はmAPの性能を11%向上させることができる。
関連論文リスト
- Multi-Scale Deformable Transformers for Student Learning Behavior Detection in Smart Classroom [5.487296795434267]
マルチスケール変形型変圧器(SCB-DETR)を用いた学生の学習行動検出について紹介する。
この技術は、学生の行動分析のための堅牢なソリューションを提供することにより、マルチスケールおよび隠蔽対象の検出能力を著しく改善する。
SCB-DETRは平均平均精度(mAP)が0.626で、これはベースラインモデルのmAPよりも1.5%改善され、AP50は6%増加した。
論文 参考訳(メタデータ) (2024-10-10T11:51:57Z) - Student Activity Recognition in Classroom Environments using Transfer
Learning [0.0]
本稿では,教室環境における学生の活動を検出し,認識するシステムを提案する。
Xceptionは、新しい教室データセットで93%の精度を達成した。
論文 参考訳(メタデータ) (2023-12-01T04:51:57Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - SSMTL++: Revisiting Self-Supervised Multi-Task Learning for Video
Anomaly Detection [108.57862846523858]
自己教師型マルチタスク学習フレームワークを再考し、元の手法にいくつかのアップデートを提案する。
マルチヘッド・セルフアテンション・モジュールを導入することで3次元畳み込みバックボーンを近代化する。
モデルをさらに改良するために,セグメントマップの予測などの自己指導型学習タスクについて検討した。
論文 参考訳(メタデータ) (2022-07-16T19:25:41Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Improving Music Performance Assessment with Contrastive Learning [78.8942067357231]
本研究では,既存のMPAシステムを改善するための潜在的手法として,コントラスト学習について検討する。
畳み込みニューラルネットワークに適用された回帰タスクに適した重み付きコントラスト損失を導入する。
この結果から,MPA回帰タスクにおいて,コントラッシブ・ベースの手法がSoTA性能に適合し,超越できることが示唆された。
論文 参考訳(メタデータ) (2021-08-03T19:24:25Z) - Bridging the gap between Human Action Recognition and Online Action
Detection [0.456877715768796]
行動認識、早期予測、オンライン行動検出は、しばしば独立して研究される補完的な分野です。
前述の分野間で教師と学生のフレームワークでタスク固有の機能抽出に取り組みます。
当社のネットワークは、オンライン早期予測とオンライン時間セグメント提案を並行して組み込みます。
論文 参考訳(メタデータ) (2021-01-21T21:01:46Z) - Incremental Embedding Learning via Zero-Shot Translation [65.94349068508863]
現在の最先端のインクリメンタル学習手法は、従来の分類ネットワークにおける破滅的な忘れ方問題に取り組む。
ゼロショット変換クラス増分法(ZSTCI)と呼ばれる新しい組込みネットワークのクラス増分法を提案する。
さらに、ZSTCIを既存の正規化ベースのインクリメンタル学習手法と組み合わせることで、組み込みネットワークの性能をより向上させることができる。
論文 参考訳(メタデータ) (2020-12-31T08:21:37Z) - Point Adversarial Self Mining: A Simple Method for Facial Expression
Recognition [79.75964372862279]
本稿では,表情認識における認識精度を向上させるために,PASM(Point Adversarial Self Mining)を提案する。
PASMは、目標タスクに関連する最も情報性の高い位置を見つけるために、ポイント敵攻撃法と訓練された教師ネットワークを使用する。
適応学習教材の生成と教師/学生の更新を複数回行うことができ、ネットワーク能力が反復的に向上する。
論文 参考訳(メタデータ) (2020-08-26T06:39:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。