論文の概要: Autonomous AI Surveillance: Multimodal Deep Learning for Cognitive and Behavioral Monitoring
- arxiv url: http://arxiv.org/abs/2507.01590v1
- Date: Wed, 02 Jul 2025 10:59:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:23:00.159611
- Title: Autonomous AI Surveillance: Multimodal Deep Learning for Cognitive and Behavioral Monitoring
- Title(参考訳): 自律型AIサーベイランス:認知と行動モニタリングのためのマルチモーダルディープラーニング
- Authors: Ameer Hamza, Zuhaib Hussain But, Umar Arif, Samiya, M. Abdullah Asad, Muhammad Naeem,
- Abstract要約: 本研究は,携帯電話の使用状況の追跡,顔認識など,複数のモダリティを統合した新しい教室監視システムを提案する。
このフレームワークは、顔認識のためのRMFDデータセットや携帯電話検出のためのRoboflowデータセットなど、特殊なデータセットに基づいてトレーニングされている。
この統合されたアプローチは、教室の監視を強化するだけでなく、顔認識による自動出席記録も保証する。
- 参考スコア(独自算出の注目度): 1.0480116882302977
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study presents a novel classroom surveillance system that integrates multiple modalities, including drowsiness, tracking of mobile phone usage, and face recognition,to assess student attentiveness with enhanced precision.The system leverages the YOLOv8 model to detect both mobile phone and sleep usage,(Ghatge et al., 2024) while facial recognition is achieved through LResNet Occ FC body tracking using YOLO and MTCNN.(Durai et al., 2024) These models work in synergy to provide comprehensive, real-time monitoring, offering insights into student engagement and behavior.(S et al., 2023) The framework is trained on specialized datasets, such as the RMFD dataset for face recognition and a Roboflow dataset for mobile phone detection. The extensive evaluation of the system shows promising results. Sleep detection achieves 97. 42% mAP@50, face recognition achieves 86. 45% validation accuracy and mobile phone detection reach 85. 89% mAP@50. The system is implemented within a core PHP web application and utilizes ESP32-CAM hardware for seamless data capture.(Neto et al., 2024) This integrated approach not only enhances classroom monitoring, but also ensures automatic attendance recording via face recognition as students remain seated in the classroom, offering scalability for diverse educational environments.(Banada,2025)
- Abstract(参考訳): 本研究は,携帯電話の使用状況の追跡や,学生の注意度を精度良く評価するために,複数モードを統合した新しい教室監視システムを提案する。このシステムは,YOLOv8モデルを用いて携帯電話と睡眠の両方を検知する(Ghatge et al , 2024)。
(Durai et al ,2024)
これらのモデルは、総合的でリアルタイムなモニタリングを提供し、学生のエンゲージメントと行動に関する洞察を提供するために、シナジーで機能する。
(S et al , 2023)
このフレームワークは、顔認識のためのRMFDデータセットや携帯電話検出のためのRoboflowデータセットなど、特殊なデータセットに基づいてトレーニングされている。
システムの広範な評価は、有望な結果を示している。
睡眠検出は97。
42% mAP@50, 顔認識では86。
45%の精度で携帯電話検出が85。
89%mAP@50。
このシステムはコアPHP Webアプリケーション内に実装され、ESP32-CAMハードウェアを使ってシームレスなデータキャプチャを行う。
(Neto et al , 2024)
この統合されたアプローチは、教室の監視を強化するだけでなく、学生が教室に留まり、多様な教育環境にスケーラビリティを提供するため、顔認識による自動出席記録を保証する。
(花田2025年)
関連論文リスト
- AndroIDS : Android-based Intrusion Detection System using Federated Learning [0.0]
本稿では,AndroIDSという,統合学習に基づく侵入検知フレームワークを提案する。
システムコールトレースをパーソナライズされたプライバシ保護データソースとして使用する。
精度は96.46 %、92.87 %、F1 スコアは89 %、86 %である。
論文 参考訳(メタデータ) (2025-06-19T17:42:02Z) - Scalable Video-to-Dataset Generation for Cross-Platform Mobile Agents [57.59830804627066]
実世界のモバイルOSナビゲーションをキャプチャする20Kの指導ビデオから,313Kの注釈付きフレームの大規模データセットであるMONDAYを紹介した。
MONDAYを事前学習フェーズに含むモデルは、堅牢なクロスプラットフォームの一般化機能を示す。
公開されているビデオコンテンツを利用して、包括的なタスクデータセットを作成する自動化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-19T02:39:03Z) - Exploring FMCW Radars and Feature Maps for Activity Recognition: A Benchmark Study [2.251010251400407]
本研究では、人間の活動認識のための周波数変調連続波レーダに基づくフレームワークを提案する。
特徴写像を画像として処理する従来の手法とは異なり、本研究では多次元特徴写像をデータベクトルとして与える。
ConvLSTMモデルは従来の機械学習およびディープラーニングモデルよりも優れ、精度は90.51%に達した。
論文 参考訳(メタデータ) (2025-03-07T17:53:29Z) - CADDI: An in-Class Activity Detection Dataset using IMU data from low-cost sensors [3.3860149185538613]
安価なIMUセンサを用いたクラス内アクティビティ検出のための新しいデータセットを提案する。
データセットは、典型的な教室のシナリオで12人の参加者が実行した、瞬間的および連続的な19の多様なアクティビティで構成されている。
加速度計、ジャイロスコープ、回転ベクトルデータ、および同期ステレオ画像を含み、センサーと視覚データを用いたマルチモーダルアルゴリズムを開発するための包括的なリソースを提供する。
論文 参考訳(メタデータ) (2025-03-04T18:29:57Z) - DailyDVS-200: A Comprehensive Benchmark Dataset for Event-Based Action Recognition [51.96660522869841]
DailyDVS-200は、イベントベースのアクション認識コミュニティに適したベンチマークデータセットである。
実世界のシナリオで200のアクションカテゴリをカバーし、47人の参加者によって記録され、22,000以上のイベントシーケンスで構成されている。
DailyDVS-200には14の属性がアノテートされており、記録されたアクションの詳細なキャラクタリゼーションが保証されている。
論文 参考訳(メタデータ) (2024-07-06T15:25:10Z) - Automated Medical Device Display Reading Using Deep Learning Object
Detection [0.0]
本研究は,深層学習物体検出モデルに基づく医療機器からの7セグメントディスプレイの検出と読取を行うエンド・ツー・エンド手法を提案する。
EfficientDetとEfficientDet-liteの2つの状態は、モバイルデジタルカメラで撮影された医療機器の写真からなるデータセットに基づいて微調整された。
訓練されたモデルの評価は高い効率を示し、全てのモデルが98%以上の検出精度と98%以上の分類精度を達成した。
論文 参考訳(メタデータ) (2022-10-04T02:39:45Z) - Learning-Based UE Classification in Millimeter-Wave Cellular Systems
With Mobility [67.81523988596841]
ミリ波携帯電話通信では、送信機と受信機のビームのアライメントを可能にするビームフォーミング手順が必要である。
効率的なビームトラッキングでは、トラフィックと移動パターンに応じてユーザーを分類することが有利である。
これまでの研究は、機械学習に基づくUE分類の効率的な方法を示してきた。
論文 参考訳(メタデータ) (2021-09-13T12:00:45Z) - Real-Time Activity Recognition and Intention Recognition Using a
Vision-based Embedded System [4.060731229044571]
ドアを通そうとしないという人々の意図を認識するために,リアルタイムな活動認識を導入する。
このシステムは、エレベーターや自動ドアに適用すれば、省エネと効率の向上につながる。
組込みシステムは、意図認識データセットの98.78%の精度で実装された。
論文 参考訳(メタデータ) (2021-07-27T11:38:44Z) - A Computer Vision System to Help Prevent the Transmission of COVID-19 [79.62140902232628]
新型コロナウイルスのパンデミックは世界中の日常生活のあらゆる領域に影響を与える。
保健機関は、ソーシャルディスタンス、フェイスマスクを着用し、触れる顔を避けることをアドバイスします。
我々は、新型コロナウイルスの感染を防ぐためのディープラーニングベースのコンピュータビジョンシステムを開発した。
論文 参考訳(メタデータ) (2021-03-16T00:00:04Z) - Identity-Aware Attribute Recognition via Real-Time Distributed Inference
in Mobile Edge Clouds [53.07042574352251]
我々は、MEC対応カメラ監視システムにおいて、re-IDを用いた歩行者属性認識のための新しいモデルの設計を行う。
本稿では,属性認識と人物再IDを協調的に考慮し,分散モジュールの集合を持つ新しい推論フレームワークを提案する。
そこで我々は,提案した分散推論フレームワークのモジュール分布の学習に基づくアルゴリズムを考案した。
論文 参考訳(メタデータ) (2020-08-12T12:03:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。