論文の概要: LSP-YOLO: A Lightweight Single-Stage Network for Sitting Posture Recognition on Embedded Devices
- arxiv url: http://arxiv.org/abs/2511.14322v1
- Date: Tue, 18 Nov 2025 10:24:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:53.052186
- Title: LSP-YOLO: A Lightweight Single-Stage Network for Sitting Posture Recognition on Embedded Devices
- Title(参考訳): LSP-YOLO:組み込みデバイスにおける姿勢認識のための軽量シングルステージネットワーク
- Authors: Nanjun Li, Ziyue Hao, Quanqiang Wang, Xuanyin Wang,
- Abstract要約: LSP-YOLOは、組み込みエッジデバイス上での姿勢認識のための軽量なシングルステージネットワークである。
モデルトレーニングとテストのために、6つの姿勢カテゴリにわたる5000の画像を含むデータセットを構築した。
最小のトレーニングモデルであるLSP-YOLO-nは、わずか1.9MBのパーソナルコンピュータ(PC)で94.2%の精度と251FPSを達成した。
- 参考スコア(独自算出の注目度): 1.476945306033059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rise in sedentary behavior, health problems caused by poor sitting posture have drawn increasing attention. Most existing methods, whether using invasive sensors or computer vision, rely on two-stage pipelines, which result in high intrusiveness, intensive computation, and poor real-time performance on embedded edge devices. Inspired by YOLOv11-Pose, a lightweight single-stage network for sitting posture recognition on embedded edge devices termed LSP-YOLO was proposed. By integrating partial convolution(PConv) and Similarity-Aware Activation Module(SimAM), a lightweight module, Light-C3k2, was designed to reduce computational cost while maintaining feature extraction capability. In the recognition head, keypoints were directly mapped to posture classes through pointwise convolution, and intermediate supervision was employed to enable efficient fusion of pose estimation and classification. Furthermore, a dataset containing 5,000 images across six posture categories was constructed for model training and testing. The smallest trained model, LSP-YOLO-n, achieved 94.2% accuracy and 251 Fps on personal computer(PC) with a model size of only 1.9 MB. Meanwhile, real-time and high-accuracy inference under constrained computational resources was demonstrated on the SV830C + GC030A platform. The proposed approach is characterized by high efficiency, lightweight design and deployability, making it suitable for smart classrooms, rehabilitation, and human-computer interaction applications.
- Abstract(参考訳): 摂食行動の増加に伴い、座位姿勢の悪化による健康問題に注目が集まっている。
侵入センサーやコンピュータビジョンを使用する場合、既存のほとんどの方法は2段階のパイプラインに依存しており、高い侵入性、集中的な計算、組込みエッジデバイスでのリアルタイムパフォーマンスの低下をもたらす。
LSP-YOLOと呼ばれる組込みエッジデバイス上での座位姿勢認識のための軽量シングルステージネットワークであるYOLOv11-Poseに着想を得た。
部分畳み込み(PConv)とSimAM(Simimity-Aware Activation Module)を統合することで、軽量モジュールLight-C3k2が特徴抽出能力を維持しながら計算コストを削減するように設計された。
認識ヘッドでは、キーポイントをポイントワイド・コンボリューションを通じて姿勢クラスに直接マッピングし、ポーズ推定と分類の効率的な融合を可能にするために中間的監督を施した。
さらに、モデルトレーニングとテストのために、6つの姿勢カテゴリにわたる5000の画像を含むデータセットを構築した。
最小のトレーニングモデルであるLSP-YOLO-nは、わずか1.9MBのパーソナルコンピュータ(PC)で94.2%の精度と251FPSを達成した。
一方, SV830C+GC030Aプラットフォームでは, 制約付き計算資源下でのリアルタイム・高精度の推論が実証された。
提案手法の特徴は,高効率,軽量な設計,展開性であり,スマート教室,リカバリ,ヒューマンコンピュータのインタラクションに適している。
関連論文リスト
- STAR: A Privacy-Preserving, Energy-Efficient Edge AI Framework for Human Activity Recognition via Wi-Fi CSI in Mobile and Pervasive Computing Environments [0.0]
Wi-Fi Channel State Information (CSI)によるヒューマンアクティビティ認識は、スマートホーム、ヘルスケア監視、モバイルIoTシステムに適した、プライバシ保護、コンタクトレスセンシングアプローチを提供する。
本稿では,軽量ニューラルネットワーク,適応信号処理,ハードウェア対応協調最適化を統合したエッジAI最適化フレームワークSTAR(Sensing Technology for Activity Recognition)を提案する。
サブ秒以下の応答レイテンシと低消費電力により、リアルタイムでプライバシ保護のHARが保証され、モバイルおよび普及型コンピューティング環境に実用的なスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2025-10-30T05:08:25Z) - Enhancing Fitness Movement Recognition with Attention Mechanism and Pre-Trained Feature Extractors [1.7619303397097408]
フィットネス運動認識は、健康モニタリング、リハビリテーション、パーソナライズされたフィットネストレーニングにおいて重要な役割を果たす。
本稿では,空間的注意によって強化されたLong Short-Term Memory(LSTM)ネットワークと,事前訓練された2次元畳み込みニューラルネットワーク(CNN)を統合するフレームワークを提案する。
我々は、このフレームワークをUCF101データセットのキュレートされたサブセット上で評価し、ResNet50ベースの構成で93.34%のピーク精度を達成した。
論文 参考訳(メタデータ) (2025-09-02T17:04:42Z) - Attention-Enhanced Lightweight Hourglass Network for Human Pose Estimation [6.885386072475789]
本稿では,奥行き分離可能な畳み込みと畳み込みブロック注意モジュールを利用する軽量な注目型ポーズ推定ネットワークを提案する。
このモデルは2.3Mパラメータと3.7G FLOPでこの性能を達成する。
論文 参考訳(メタデータ) (2024-12-09T06:02:07Z) - Unifying Synergies between Self-supervised Learning and Dynamic
Computation [53.66628188936682]
SSLとDCのパラダイム間の相互作用に関する新しい視点を提示する。
SSL設定において、スクラッチから高密度かつゲートされたサブネットワークを同時に学習することは可能であることを示す。
密集エンコーダとゲートエンコーダの事前学習における共進化は、良好な精度と効率のトレードオフをもたらす。
論文 参考訳(メタデータ) (2023-01-22T17:12:58Z) - High-Throughput, High-Performance Deep Learning-Driven Light Guide Plate
Surface Visual Quality Inspection Tailored for Real-World Manufacturing
Environments [75.66288398180525]
光導光板は、医療用照明器具からバックライトテレビディスプレイまで幅広い用途で広く利用されている光学部品である。
本研究では,光ガイド板表面の視覚的品質検査(VQI)を現実の製造環境に適した,完全に統合された,高性能なディープラーニング駆動ワークフローを提案する。
完全統合VQIシステム内のエッジコンピューティング上でのVQIの自動化を実現するため、高コンパクトな深層アンチエイリアス型アテンションコンデンサニューラルネットワーク(LightDefectNetと呼ぶ)が開発された。
LightDetectNetが検出精度を実現する実験
論文 参考訳(メタデータ) (2022-12-20T20:11:11Z) - Deep Learning for Real Time Satellite Pose Estimation on Low Power Edge
TPU [58.720142291102135]
本稿では,ニューラルネットワークアーキテクチャを利用したポーズ推定ソフトウェアを提案する。
我々は、低消費電力の機械学習アクセラレーターが宇宙での人工知能の活用を可能にしていることを示す。
論文 参考訳(メタデータ) (2022-04-07T08:53:18Z) - Multi-scale Interaction for Real-time LiDAR Data Segmentation on an
Embedded Platform [62.91011959772665]
LiDARデータのリアルタイムセマンティックセグメンテーションは、自動運転車にとって不可欠である。
ポイントクラウド上で直接動作する現在のアプローチでは、複雑な空間集約操作を使用する。
本稿では,マルチスケールインタラクションネットワーク(MINet)と呼ばれるプロジェクションベースの手法を提案する。
論文 参考訳(メタデータ) (2020-08-20T19:06:11Z) - EfficientPose: Scalable single-person pose estimation [3.325625311163864]
一人称ポーズ推定のための新しい畳み込みニューラルネットワークアーキテクチャであるEfficientPoseを提案する。
我々のトップパフォーマンスモデルは、低複雑さのConvNetを用いて、シングルパーソンMPIIにおける最先端の精度を実現する。
複雑さと効率が低いため、EfficientPoseはメモリフットプリントと計算コストを制限し、エッジデバイス上の現実世界のアプリケーションを可能にする。
論文 参考訳(メタデータ) (2020-04-25T16:50:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。