論文の概要: A Smart Classroom Behavior Analysis Framework with a New Highly Congested Classroom Dataset
- arxiv url: http://arxiv.org/abs/2606.21568v1
- Date: Fri, 19 Jun 2026 16:09:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 12:40:23.840054
- Title: A Smart Classroom Behavior Analysis Framework with a New Highly Congested Classroom Dataset
- Title(参考訳): 高度に集約されたクラスルームデータセットを用いたスマートクラスルーム行動分析フレームワーク
- Authors: Wei Xu, Maoxiang Chu, Yuelong Fan, Guanghao Liao, Yinxiang Yu, Zhi Chen, Haotian Wang, Yutian Zhu,
- Abstract要約: ODER-HSFNetは、混み合った教室に適したYOLOベースの検出フレームワークである。
ODER-HSFNetは、Occlusion-aware Deformable Edge Rectifier (ODER)、Hypergraph-State Space Fusion (HSSF)モジュール、Occlusion-Calibrated Detection Head (OCDetect)の3つのタスク固有のイノベーションを導入した。
- 参考スコア(独自算出の注目度): 8.939752692975919
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Student behavior detection is important for intelligent classroom analysis but remains challenging in large-class scenarios due to dense instance co-occurrence, asymmetric occlusion, depth-wise scale variation, and fine-grained semantic degradation in distant targets. Existing classroom behavior datasets and general-purpose detectors are insufficient to characterize and address these challenges. This paper constructs the Highly Congested Classroom Behavior (HCCB) dataset, containing 50,229 student behavior instances across seven categories: reading, writing, heads up, sleeping, looking around, bowing head, and using phone. HCCB provides a challenging benchmark that integrates dense distributions, severe occlusion, scale variation, and fine-grained behavioral semantics. To address these issues, we propose ODER-HSFNet, a YOLO-based detection framework tailored to highly crowded classrooms. At its core, ODER-HSFNet introduces three task-specific innovations: the Occlusion-aware Deformable Edge Rectifier (ODER), which strengthens boundary evidence under occlusion; the Hypergraph-State Spatial Fusion (HSSF) module, which integrates local structure enhancement, state-space contextual modeling, and high-order relation aggregation; and the Occlusion-Calibrated Detection Head (OCDetect), which suppresses low-quality Pre-NMS candidates and reduces false positives from occlusion boundaries and neighboring instances. Experiments on two classroom behavior detection datasets show that ODER-HSFNet outperforms mainstream YOLO-series methods, achieving 60.60%/80.12% mAP50:95/mAP50 on HCCB and 57.36%/74.65% on SCB-D3-S. Ablation studies further verify the effectiveness of the proposed design for highly crowded classroom behavior detection.
- Abstract(参考訳): 生徒の行動検出は知的教室分析において重要であるが、高密度インスタンス共起、非対称オクルージョン、深度スケールのばらつき、遠方ターゲットの微粒化による大規模シナリオでは依然として困難である。
既存の教室行動データセットと汎用検出器はこれらの課題を特徴づけ、対処するには不十分である。
本稿では,5つのカテゴリにまたがる50,229人の生徒行動事例を含むHCCB(Highly Congested Classroom Behavior)データセットを構築した。
HCCBは、密度分布、厳密な閉塞、スケールのばらつき、きめ細かい行動意味論を統合する、挑戦的なベンチマークを提供する。
これらの問題に対処するために,混み合った教室に適したYOLOベースの検出フレームワークであるODER-HSFNetを提案する。
ODER-HSFNetは、Occlusion-aware Deformable Edge Rectifier (ODER)、Hypergraph-State Spatial Fusion (HSSF)モジュール、Occlusion-Calibrated Detection Head (OCDetect)、Occlusion-Calibrated Detection Head (OCDetect)の3つのタスク固有のイノベーションを紹介している。
ODER-HSFNetは、HCCBでは60.60%/80.12% mAP50:95/mAP50、SCB-D3-Sでは57.36%/74.65%を達成している。
さらに,高密度教室における行動検出における提案手法の有効性について検討した。
関連論文リスト
- STAR-IOD: Scale-decoupled Topology Alignment with Pseudo-label Refinement for Remote Sensing Incremental Object Detection [26.581594459769363]
従来の検出器は、新しいものを学ぶ際に、以前に学んだカテゴリを忘れることが多い。
既存の手法は、リモートセンシングシーンでよく見られるクラス内スケールのバリエーションを概ね見落としている。
これらの課題に対処するための新しいフレームワークSTAR-IODを提案する。
論文 参考訳(メタデータ) (2026-05-20T05:43:09Z) - EEG-D3: A Solution to the Hidden Overfitting Problem of Deep Learning Models [33.22173262655432]
本稿では,脳波データセット間でのディープラーニングモデルをトレーニングする弱い教師付き手法であるDisentangled Decoding Decomposition (D3)を紹介する。
入力ウィンドウがサンプリングされた各トライアルシーケンスの場所を予測することで、EEG-D3は脳活動の潜伏成分を分離する。
我々は、線形分離可能な潜伏空間を利用して、睡眠段階分類における効果的な数ショット学習を行う。
論文 参考訳(メタデータ) (2025-12-15T19:00:10Z) - Human-Centric Anomaly Detection in Surveillance Videos Using YOLO-World and Spatio-Temporal Deep Learning [0.1019561860229868]
監視ビデオにおける異常検出は、異常事象の多様性、クラス不均衡、シーン依存の視覚的乱れなどにより、依然として困難な課題である。
マルチクラス異常分類のための時間的モデリングと人間の重み付け前処理を統合した頑健なディープラーニングフレームワークを提案する。
本手法は,3つの独立した試験において平均テスト精度が92.41%であり,クラスごとのF1スコアは0.85以上である。
論文 参考訳(メタデータ) (2025-10-24T22:38:17Z) - Hierarchical Self-Supervised Representation Learning for Depression Detection from Speech [51.14752758616364]
音声による抑うつ検出 (SDD) は、従来の臨床評価に代わる有望で非侵襲的な代替手段である。
HAREN-CTCは,マルチタスク学習フレームワーク内でのクロスアテンションを用いて,多層SSL機能を統合した新しいアーキテクチャである。
このモデルはDAIC-WOZで0.81、MODMAで0.82の最先端マクロF1スコアを達成し、両方の評価シナリオで先行手法より優れている。
論文 参考訳(メタデータ) (2025-10-05T09:32:12Z) - Self-Classification Enhancement and Correction for Weakly Supervised Object Detection [113.51483527300496]
弱い監督対象検出(WSOD)は、ラベル付けコストの低いため、多くの注目を集めている。
本稿では,この2つの問題を改善するための新しいWSODフレームワークを紹介する。
まず,2つの異なるMCCタスク間のギャップを埋めるために,クラス内バイナリ分類(ICBC)を統合した自己分類拡張モジュールを提案する。
また,2つのMCCタスクの結果を組み合わせて,誤分類予測を効果的に削減する自己分類補正アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-05-22T06:45:58Z) - Uncertainty Meets Diversity: A Comprehensive Active Learning Framework for Indoor 3D Object Detection [2.1062220557947957]
本稿では,室内3次元物体検出のためのアクティブラーニングに関する最初の研究を行い,本課題に適した新しい枠組みを提案する。
提案手法は,不確実性と多様性という2つの重要な基準を取り入れて,アノテーションのための最も曖昧で情報に富んだサンプルを積極的に選択する。
我々は,SUN RGB-D と ScanNetV2 の手法を評価したところ,基準値が大幅に向上し,アノテーション予算の 10% に留まらず,全監督性能の 85% 以上を達成できた。
論文 参考訳(メタデータ) (2025-03-20T13:12:39Z) - Multi-Scale Deformable Transformers for Student Learning Behavior Detection in Smart Classroom [5.487296795434267]
マルチスケール変形型変圧器(SCB-DETR)を用いた学生の学習行動検出について紹介する。
この技術は、学生の行動分析のための堅牢なソリューションを提供することにより、マルチスケールおよび隠蔽対象の検出能力を著しく改善する。
SCB-DETRは平均平均精度(mAP)が0.626で、これはベースラインモデルのmAPよりも1.5%改善され、AP50は6%増加した。
論文 参考訳(メタデータ) (2024-10-10T11:51:57Z) - Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and
Class-balanced Pseudo-Labeling [38.07637524378327]
ドメイン適応型3Dオブジェクト検出において,疑似ラベリング技術を用いた教師なしドメイン適応(DA)が重要なアプローチとして浮上している。
既存のDAメソッドは、マルチクラスのトレーニング環境に適用した場合、パフォーマンスが大幅に低下する。
本稿では,すべてのクラスを一度に検出する学習に適した新しいReDBフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-16T04:34:11Z) - Exploring Active 3D Object Detection from a Generalization Perspective [58.597942380989245]
不確実性に基づくアクティブな学習ポリシーは、ポイントクラウドの情報性とボックスレベルのアノテーションコストの間のトレードオフのバランスを取れません。
冗長な3次元境界ボックスラベルの点群を階層的にフィルタリングするtextscCrbを提案する。
実験により,提案手法が既存のアクティブラーニング戦略より優れていることが示された。
論文 参考訳(メタデータ) (2023-01-23T02:43:03Z) - Static-Dynamic Co-Teaching for Class-Incremental 3D Object Detection [71.18882803642526]
ディープラーニングアプローチは、3Dオブジェクト検出タスクにおいて顕著なパフォーマンスを示している。
古いデータを再考することなく、新しいクラスを漸進的に学習するときに、破滅的なパフォーマンス低下に悩まされる。
この「破滅的な忘れ物」現象は、現実世界のシナリオにおける3Dオブジェクト検出アプローチの展開を妨げる。
SDCoTは,新しい静的なコティーチング手法である。
論文 参考訳(メタデータ) (2021-12-14T09:03:41Z) - Semantics-Guided Contrastive Network for Zero-Shot Object detection [67.61512036994458]
ゼロショット物体検出(ZSD)はコンピュータビジョンにおける新しい課題である。
ゼロショット検出の領域にコントラスト学習機構をもたらすフレームワークであるContrastZSDを開発した。
本手法は,ZSDタスクと一般化ZSDタスクの両方において,従来の最先端技術よりも優れていた。
論文 参考訳(メタデータ) (2021-09-04T03:32:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。