論文の概要: A View Independent Classification Framework for Yoga Postures
- arxiv url: http://arxiv.org/abs/2206.13577v1
- Date: Mon, 27 Jun 2022 18:40:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-02 22:28:26.699458
- Title: A View Independent Classification Framework for Yoga Postures
- Title(参考訳): ヨガ姿勢の視点独立分類枠組み
- Authors: Mustafa Chasmai, Nirjhar Das, Aman Bhardwaj, Rahul Garg
- Abstract要約: 我々は、ランダムフォレスト分類器を訓練するために、身体全体に広がる136個のキーポイントを抽出するために、ヒューマンポーズ推定モデルからの転写学習を採用する。
その結果,4つの異なるカメラアングルから51人の被験者が収集した大規模なヨガ映像データベースを用いて評価を行った。
- 参考スコア(独自算出の注目度): 2.922683311119656
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Yoga is a globally acclaimed and widely recommended practice for a healthy
living. Maintaining correct posture while performing a Yogasana is of utmost
importance. In this work, we employ transfer learning from Human Pose
Estimation models for extracting 136 key-points spread all over the body to
train a Random Forest classifier which is used for estimation of the Yogasanas.
The results are evaluated on an in-house collected extensive yoga video
database of 51 subjects recorded from 4 different camera angles. We propose a 3
step scheme for evaluating the generalizability of a Yoga classifier by testing
it on 1) unseen frames, 2) unseen subjects, and 3) unseen camera angles. We
argue that for most of the applications, validation accuracies on unseen
subjects and unseen camera angles would be most important. We empirically
analyze over three public datasets, the advantage of transfer learning and the
possibilities of target leakage. We further demonstrate that the classification
accuracies critically depend on the cross validation method employed and can
often be misleading. To promote further research, we have made key-points
dataset and code publicly available.
- Abstract(参考訳): ヨガは世界的に評価され、健康な生活のために広く推奨される実践である。
ヨガサナの実行中に正しい姿勢を維持することが最も重要である。
本研究では,人間のポーズ推定モデルから転置学習を行い,体全体に広がる136個のキーポイントを抽出し,ヨガサナ推定に用いるランダム森林分類器を訓練する。
4つの異なるカメラアングルから51名の被験者を収集したヨガ映像データベースを用いて評価した。
ヨガ分類器の一般化性を評価するための3段階構成法を提案する。
1) 見えないフレーム,
2)未発見の科目,及び
3) カメラアングルが見えない。
ほとんどのアプリケーションでは、見えない被写体と見えないカメラアングルに対する検証の精度が最も重要であると我々は主張する。
我々は3つの公開データセット、転送学習の利点とターゲット漏洩の可能性について実証的に分析した。
さらに, 分類の精度は, 採用するクロス検証手法に致命的に依存し, 誤解を招くこともしばしばある。
さらなる研究を促進するため、キーポイントデータセットとコードを公開しました。
関連論文リスト
- Which Viewpoint Shows it Best? Language for Weakly Supervising View Selection in Multi-view Videos [66.1935609072708]
鍵となる仮説は、個々のビューがより正確にビューに依存しないテキストの要約を予測できるほど、それがより情報的になるということである。
本稿では,ビュー依存キャプション予測の相対的精度を,擬似ラベルを最もよく見るためのプロキシとして利用するフレームワークを提案する。
推論の間、我々のモデルは多視点ビデオ(言語やカメラのポーズなし)のみを入力として取り、各タイミングで見るのに最適な視点を返します。
論文 参考訳(メタデータ) (2024-11-13T16:31:08Z) - Yoga Pose Classification Using Transfer Learning [0.0]
大規模なヨガポーズ認識のためのベンチマークデータセットであるYoga-82は、正確なアノテーションを不可能にする難しい位置にある。
私たちはVGG-16、ResNet-50、ResNet-101、DenseNet-121を使って、より良い結果を得るために様々な方法でそれらを微調整しました。
実験の結果,トップ1の精度85%,トップ5の精度96%のDenseNet-121が最高性能を示した。
論文 参考訳(メタデータ) (2024-10-29T14:34:18Z) - 3DYoga90: A Hierarchical Video Dataset for Yoga Pose Understanding [0.0]
3DYoga901は3レベルのラベル階層で構成されている。
我々のデータセットには、慎重にキュレートされたRGBヨガポーズビデオと3Dスケルトンシーケンスが含まれています。
論文 参考訳(メタデータ) (2023-10-16T07:15:31Z) - Fine-Grained Sports, Yoga, and Dance Postures Recognition: A Benchmark
Analysis [24.276782804825846]
人体位置推定はコンピュータビジョンの複雑な問題である。
近年,スポーツ,ヨガ,ダンスの姿勢に関する研究が盛んに行われている。
CNNは、様々な人体推定問題の解決において、大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2023-08-01T07:00:13Z) - Self-Supervised Learning for Videos: A Survey [70.37277191524755]
自己教師型学習は、画像ドメインとビデオドメインの両方で有望である。
本稿では,ビデオ領域に着目した自己教師型学習における既存のアプローチについて概観する。
論文 参考訳(メタデータ) (2022-06-18T00:26:52Z) - FixMyPose: Pose Correctional Captioning and Retrieval [67.20888060019028]
本稿では,自動ポーズ修正システムに対応する新しいキャプションデータセットfixmyposeを提案する。
我々は「現在の」ポーズを「ターゲット」ポーズのように見えるように修正する記述を収集する。
MLバイアスを避けるため、さまざまな階層を持つキャラクタ間のバランスを維持します。
論文 参考訳(メタデータ) (2021-04-04T21:45:44Z) - CompGuessWhat?!: A Multi-task Evaluation Framework for Grounded Language
Learning [78.3857991931479]
本稿では,属性を用いたグラウンドド言語学習のための評価フレームワークGROLLAを提案する。
また、学習したニューラル表現の品質を評価するためのフレームワークの例として、新しいデータセットCompGuessWhat!?を提案する。
論文 参考訳(メタデータ) (2020-06-03T11:21:42Z) - Yoga-82: A New Dataset for Fine-grained Classification of Human Poses [46.319423568714505]
82クラスからなる大規模ヨガポーズ認識のためのデータセットYoga-82を提案する。
Yoga-82は、細かいアノテーションができない複雑なポーズで構成されている。
データセットには、体の位置、体の位置の変化、実際のポーズ名を含む3レベル階層が含まれている。
論文 参考訳(メタデータ) (2020-04-22T01:43:44Z) - Transferring Dense Pose to Proximal Animal Classes [83.84439508978126]
より一般的な対象検出器やセグメンタなどと同様に、密集したポーズ認識に存在する知識を、他のクラスにおける密集したポーズ認識の問題に移すことが可能であることを示す。
我々は、人間と幾何学的に整合した新しい動物のためのDensePoseモデルを確立することでこれを行う。
また、クラスチンパンジーにDensePoseの方法でラベル付けされた2つのベンチマークデータセットを導入し、アプローチを評価するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-02-28T21:43:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。