論文の概要: An Efficient Deep Convolutional Neural Network Model For Yoga Pose
Recognition Using Single Images
- arxiv url: http://arxiv.org/abs/2306.15768v1
- Date: Tue, 27 Jun 2023 19:34:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-29 16:44:40.808421
- Title: An Efficient Deep Convolutional Neural Network Model For Yoga Pose
Recognition Using Single Images
- Title(参考訳): 単一画像を用いたヨガ詩認識のための高効率深部畳み込みニューラルネットワークモデル
- Authors: Santosh Kumar Yadav, Apurv Shukla, Kamlesh Tiwari, Hari Mohan Pandey,
Shaik Ali Akbar
- Abstract要約: 本稿では,RGB画像からヨガを認識可能な,効率的な深部畳み込みニューラルネットワーク(CNN)モデルYPoseを提案する。
提案したモデルはYoga-82データセットでテストされている。
- 参考スコア(独自算出の注目度): 2.6717276381722033
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Pose recognition deals with designing algorithms to locate human body joints
in a 2D/3D space and run inference on the estimated joint locations for
predicting the poses. Yoga poses consist of some very complex postures. It
imposes various challenges on the computer vision algorithms like occlusion,
inter-class similarity, intra-class variability, viewpoint complexity, etc.
This paper presents YPose, an efficient deep convolutional neural network (CNN)
model to recognize yoga asanas from RGB images. The proposed model consists of
four steps as follows: (a) first, the region of interest (ROI) is segmented
using segmentation based approaches to extract the ROI from the original
images; (b) second, these refined images are passed to a CNN architecture based
on the backbone of EfficientNets for feature extraction; (c) third, dense
refinement blocks, adapted from the architecture of densely connected networks
are added to learn more diversified features; and (d) fourth, global average
pooling and fully connected layers are applied for the classification of the
multi-level hierarchy of the yoga poses. The proposed model has been tested on
the Yoga-82 dataset. It is a publicly available benchmark dataset for yoga pose
recognition. Experimental results show that the proposed model achieves the
state-of-the-art on this dataset. The proposed model obtained an accuracy of
93.28%, which is an improvement over the earlier state-of-the-art (79.35%) with
a margin of approximately 13.9%. The code will be made publicly available.
- Abstract(参考訳): ポーズ認識は、人体関節を2d/3d空間に配置し、推定された関節位置を推定してポーズを予測するアルゴリズムの設計を扱う。
ヨガのポーズは非常に複雑な姿勢から成り立っている。
これは、オクルージョン、クラス間の類似性、クラス内変動性、視点複雑性など、コンピュータビジョンアルゴリズムに様々な課題を課している。
本稿では,RGB画像からヨガを認識可能な,効率的な深部畳み込みニューラルネットワーク(CNN)モデルYPoseを提案する。
提案モデルは以下の4段階からなる。
(a)まず、関心領域(ROI)を分割に基づくアプローチを用いて分割し、元の画像からROIを抽出する。
第二に、これらの洗練された画像は、特徴抽出のためにEfficientNetsのバックボーンに基づいてCNNアーキテクチャに渡される。
(c)より多様化した特徴を学習するために、密結合ネットワークのアーキテクチャから適応した第3の高密度化ブロックを付加する。
(d)ヨガポーズのマルチレベル階層の分類には,4番目,グローバル平均プーリングと完全連結層が適用される。
提案したモデルはYoga-82データセットでテストされている。
これはヨガポーズ認識のための公開ベンチマークデータセットである。
実験結果から,提案モデルがこのデータセットの最先端性を達成できることが示唆された。
提案モデルは93.28%の精度を得たが、これは初期の最先端(79.35%)よりも改善され、マージンは約13.9%であった。
コードは公開される予定だ。
関連論文リスト
- Iterative Graph Filtering Network for 3D Human Pose Estimation [5.177947445379688]
グラフ畳み込みネットワーク(GCN)は3次元人間のポーズ推定に有効な手法であることが証明されている。
本稿では,3次元ポーズ推定のための反復グラフフィルタリングフレームワークを提案する。
我々のアプローチは、ラプラシア正規化によるグラフフィルタリングを反復的に解くという考え方に基づいている。
論文 参考訳(メタデータ) (2023-07-29T20:46:44Z) - CheckerPose: Progressive Dense Keypoint Localization for Object Pose
Estimation with Graph Neural Network [66.24726878647543]
単一のRGB画像から固い物体の6-DoFのポーズを推定することは、非常に難しい課題である。
近年の研究では、高密度対応型解の大きな可能性を示している。
そこで本研究では,CheckerPoseというポーズ推定アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-29T17:30:53Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - 3D Multi-Object Tracking with Differentiable Pose Estimation [0.0]
室内環境におけるRGB-Dシーケンスからの3次元多対象追跡と再構成のための新しい手法を提案する。
我々は、これらの対応を利用してグラフニューラルネットワークに通知し、すべてのオブジェクトの最適かつ時間的に一貫性のある7-DoFポーズトラジェクトリを解決する。
本手法は,既存の最先端手法に比べて,すべてのテストシーケンスに対して蓄積したMOTAスコアを24.8%向上させる。
論文 参考訳(メタデータ) (2022-06-28T06:46:32Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - Wise-SrNet: A Novel Architecture for Enhancing Image Classification by
Learning Spatial Resolution of Feature Maps [0.5892638927736115]
畳み込みニューラルネットワークの進歩による大きな課題の1つは、抽出した特徴マップを最終分類層に接続する方法である。
本稿では,GAP層をWise-SrNetと呼ばれる新しいアーキテクチャに置き換えることで,この問題に対処する。
奥行きの畳み込みのアイデアにインスパイアされ、計算コストを増大させることなく空間分解能を処理するように設計されている。
論文 参考訳(メタデータ) (2021-04-26T00:37:11Z) - Road Segmentation for Remote Sensing Images using Adversarial Spatial
Pyramid Networks [28.32775611169636]
合成画像生成と道路分割に構造化領域適応を適用した新しいモデルを提案する。
マルチレベルの特徴マップから学び、特徴のセマンティクスを改善するために、新しいスケールワイズアーキテクチャが導入された。
我々のモデルは、14.89Mパラメータと86.78B FLOPを持つマサチューセッツのデータセット上で、最先端の78.86 IOUを達成し、4倍少ないFLOPを持つが、より高精度(+3.47% IOU)である。
論文 参考訳(メタデータ) (2020-08-10T11:00:19Z) - PerMO: Perceiving More at Once from a Single Image for Autonomous
Driving [76.35684439949094]
単一画像から完全テクスチャ化された車両の3次元モデルを検出し,セグメント化し,再構成する新しい手法を提案する。
私たちのアプローチは、ディープラーニングの強みと従来のテクニックの優雅さを組み合わせています。
我々はこれらのアルゴリズムを自律運転システムに統合した。
論文 参考訳(メタデータ) (2020-07-16T05:02:45Z) - Yoga-82: A New Dataset for Fine-grained Classification of Human Poses [46.319423568714505]
82クラスからなる大規模ヨガポーズ認識のためのデータセットYoga-82を提案する。
Yoga-82は、細かいアノテーションができない複雑なポーズで構成されている。
データセットには、体の位置、体の位置の変化、実際のポーズ名を含む3レベル階層が含まれている。
論文 参考訳(メタデータ) (2020-04-22T01:43:44Z) - ZoomNet: Part-Aware Adaptive Zooming Neural Network for 3D Object
Detection [69.68263074432224]
ステレオ画像に基づく3D検出のためのZoomNetという新しいフレームワークを提案する。
ZoomNetのパイプラインは、通常の2Dオブジェクト検出モデルから始まり、左右のバウンディングボックスのペアを取得するために使用される。
さらに,RGB画像のテクスチャキューを多用し,より正確な異質度推定を行うため,適応ズームという概念的に真直ぐなモジュールを導入する。
論文 参考訳(メタデータ) (2020-03-01T17:18:08Z) - Learning 3D Human Shape and Pose from Dense Body Parts [117.46290013548533]
本研究では,3次元の人体形状を学習し,身体部分の密接な対応からポーズをとるために,分解・集約ネットワーク(DaNet)を提案する。
ローカルストリームからのメッセージは集約され、回転ベースのポーズの堅牢な予測が強化される。
提案手法は,Human3.6M,UP3D,COCO,3DPWを含む屋内および実世界のデータセットで検証される。
論文 参考訳(メタデータ) (2019-12-31T15:09:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。