論文の概要: Yoga Pose Classification Using Transfer Learning
- arxiv url: http://arxiv.org/abs/2411.00833v1
- Date: Tue, 29 Oct 2024 14:34:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:50:04.763698
- Title: Yoga Pose Classification Using Transfer Learning
- Title(参考訳): トランスファーラーニングを用いたヨガ詩の分類
- Authors: M. M. Akash, Rahul Deb Mohalder, Md. Al Mamun Khan, Laboni Paul, Ferdous Bin Ali,
- Abstract要約: 大規模なヨガポーズ認識のためのベンチマークデータセットであるYoga-82は、正確なアノテーションを不可能にする難しい位置にある。
私たちはVGG-16、ResNet-50、ResNet-101、DenseNet-121を使って、より良い結果を得るために様々な方法でそれらを微調整しました。
実験の結果,トップ1の精度85%,トップ5の精度96%のDenseNet-121が最高性能を示した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Yoga has recently become an essential aspect of human existence for maintaining a healthy body and mind. People find it tough to devote time to the gym for workouts as their lives get more hectic and they work from home. This kind of human pose estimation is one of the notable problems as it has to deal with locating body key points or joints. Yoga-82, a benchmark dataset for large-scale yoga pose recognition with 82 classes, has challenging positions that could make precise annotations impossible. We have used VGG-16, ResNet-50, ResNet-101, and DenseNet-121 and finetuned them in different ways to get better results. We also used Neural Architecture Search to add more layers on top of this pre-trained architecture. The experimental result shows the best performance of DenseNet-121 having the top-1 accuracy of 85% and top-5 accuracy of 96% outperforming the current state-of-the-art result.
- Abstract(参考訳): ヨガは、最近、健康な身体と心を維持するために、人間の存在の本質となっている。
人々は、ライフがよりヘキになり、家から働くので、運動のためにジムに時間を割くのが難しいと感じています。
この種の人間のポーズ推定は、身体のキーポイントや関節の配置に対処しなければならない重要な問題の1つである。
大規模なヨガポーズ認識のためのベンチマークデータセットであるYoga-82は、正確なアノテーションを不可能にする難しい位置にある。
私たちはVGG-16、ResNet-50、ResNet-101、DenseNet-121を使って、より良い結果を得るために様々な方法でそれらを微調整しました。
トレーニング済みのアーキテクチャの上にさらにレイヤを追加するために、Neural Architecture Searchも使用しました。
実験の結果、DenseNet-121の最高性能は85%、トップ5の精度は96%であり、現在の最先端の結果よりも優れていた。
関連論文リスト
- 3DYoga90: A Hierarchical Video Dataset for Yoga Pose Understanding [0.0]
3DYoga901は3レベルのラベル階層で構成されている。
我々のデータセットには、慎重にキュレートされたRGBヨガポーズビデオと3Dスケルトンシーケンスが含まれています。
論文 参考訳(メタデータ) (2023-10-16T07:15:31Z) - Fine-Grained Sports, Yoga, and Dance Postures Recognition: A Benchmark
Analysis [24.276782804825846]
人体位置推定はコンピュータビジョンの複雑な問題である。
近年,スポーツ,ヨガ,ダンスの姿勢に関する研究が盛んに行われている。
CNNは、様々な人体推定問題の解決において、大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2023-08-01T07:00:13Z) - Effective Whole-body Pose Estimation with Two-stages Distillation [52.92064408970796]
全体ポーズ推定は、画像内の人体、手、顔、足のキーポイントをローカライズする。
textbfWhole-body textbfPose 推定器の2段階ポーズ textbfDistillation を提案し,その有効性と効率性について検討した。
論文 参考訳(メタデータ) (2023-07-29T03:49:28Z) - 3D Pose Based Feedback for Physical Exercises [87.35086507661227]
ユーザが犯した誤りを識別する学習ベースのフレームワークを導入する。
私たちのフレームワークはハードコードされたルールに頼るのではなく、データからそれらを学ぶのです。
提案手法は90.9%の誤り識別精度を示し,94.2%の誤り訂正に成功した。
論文 参考訳(メタデータ) (2022-08-05T16:15:02Z) - A View Independent Classification Framework for Yoga Postures [2.922683311119656]
我々は、ランダムフォレスト分類器を訓練するために、身体全体に広がる136個のキーポイントを抽出するために、ヒューマンポーズ推定モデルからの転写学習を採用する。
その結果,4つの異なるカメラアングルから51人の被験者が収集した大規模なヨガ映像データベースを用いて評価を行った。
論文 参考訳(メタデータ) (2022-06-27T18:40:34Z) - Real-time Recognition of Yoga Poses using computer Vision for Smart
Health Care [13.709260905038624]
また、この作品には、ヨガの手札の識別も紹介されている。
YOGIデータセットは、ポーズごとに約400~900枚の画像を持つ10個のヨガ姿勢を含む。
RandomSearch CVのXGBoostは最も正確で、99.2%の精度がある。
論文 参考訳(メタデータ) (2022-01-19T13:41:58Z) - How Do Adam and Training Strategies Help BNNs Optimization? [50.22482900678071]
我々は、AdamがBNNの粗い損失面を扱うのに適しており、より高い一般化能力でより良い最適値に達することを示す。
我々は、既存のAdamベースの最適化に基づいて、ImageNetデータセット上で70.5%のトップ1の精度を達成する簡単なトレーニングスキームを導出する。
論文 参考訳(メタデータ) (2021-06-21T17:59:51Z) - MEAL V2: Boosting Vanilla ResNet-50 to 80%+ Top-1 Accuracy on ImageNet
without Tricks [57.69809561405253]
我々は、ImageNet上でバニラResNet-50を80%以上のTop-1精度に向上できるフレームワークを、トリックなしで導入する。
本手法は,バニラResNet-50を用いた224x224の1つの作物サイズを用いて,ImageNetの80.67%のトップ1精度を得る。
我々のフレームワークは常に69.76%から73.19%に改善されている。
論文 参考訳(メタデータ) (2020-09-17T17:59:33Z) - Whole-Body Human Pose Estimation in the Wild [88.09875133989155]
COCO-WholeBodyは、全体アノテーションでCOCOデータセットを拡張する。
これは人体全体に手動のアノテーションがある最初のベンチマークである。
ZoomNetという名前のシングルネットワークモデルは、完全な人体の階層構造を考慮するために考案された。
論文 参考訳(メタデータ) (2020-07-23T08:35:26Z) - Yoga-82: A New Dataset for Fine-grained Classification of Human Poses [46.319423568714505]
82クラスからなる大規模ヨガポーズ認識のためのデータセットYoga-82を提案する。
Yoga-82は、細かいアノテーションができない複雑なポーズで構成されている。
データセットには、体の位置、体の位置の変化、実際のポーズ名を含む3レベル階層が含まれている。
論文 参考訳(メタデータ) (2020-04-22T01:43:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。