論文の概要: Yoga-82: A New Dataset for Fine-grained Classification of Human Poses
- arxiv url: http://arxiv.org/abs/2004.10362v1
- Date: Wed, 22 Apr 2020 01:43:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 18:23:22.046597
- Title: Yoga-82: A New Dataset for Fine-grained Classification of Human Poses
- Title(参考訳): Yoga-82:人間行動のきめ細かい分類のための新しいデータセット
- Authors: Manisha Verma, Sudhakar Kumawat, Yuta Nakashima, Shanmuganathan Raman
- Abstract要約: 82クラスからなる大規模ヨガポーズ認識のためのデータセットYoga-82を提案する。
Yoga-82は、細かいアノテーションができない複雑なポーズで構成されている。
データセットには、体の位置、体の位置の変化、実際のポーズ名を含む3レベル階層が含まれている。
- 参考スコア(独自算出の注目度): 46.319423568714505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human pose estimation is a well-known problem in computer vision to locate
joint positions. Existing datasets for the learning of poses are observed to be
not challenging enough in terms of pose diversity, object occlusion, and
viewpoints. This makes the pose annotation process relatively simple and
restricts the application of the models that have been trained on them. To
handle more variety in human poses, we propose the concept of fine-grained
hierarchical pose classification, in which we formulate the pose estimation as
a classification task, and propose a dataset, Yoga-82, for large-scale yoga
pose recognition with 82 classes. Yoga-82 consists of complex poses where fine
annotations may not be possible. To resolve this, we provide hierarchical
labels for yoga poses based on the body configuration of the pose. The dataset
contains a three-level hierarchy including body positions, variations in body
positions, and the actual pose names. We present the classification accuracy of
the state-of-the-art convolutional neural network architectures on Yoga-82. We
also present several hierarchical variants of DenseNet in order to utilize the
hierarchical labels.
- Abstract(参考訳): 人間のポーズ推定は、関節の位置を特定するコンピュータビジョンにおいてよく知られた問題である。
ポーズの学習のための既存のデータセットは、ポーズの多様性、オブジェクトのオクルージョン、ビューポイントの面では不十分である。
これにより、ポーズアノテーションプロセスが比較的簡単になり、トレーニングされたモデルの適用が制限される。
人間のポーズをより多様に扱うために,ポーズ推定を分類タスクとして定式化する,きめ細かな階層的なポーズ分類の概念を提案し,82クラスからなる大規模なヨガポーズ認識のためのデータセットであるYoga-82を提案する。
Yoga-82は、細かいアノテーションができない複雑なポーズで構成されている。
これを解決するために,ポーズの身体構成に基づいたヨガポーズの階層ラベルを提供する。
データセットには、体位、体位の変化、実際のポーズ名を含む3段階の階層が含まれている。
ヨガ82における最先端の畳み込みニューラルネットワークアーキテクチャの分類精度について述べる。
また,階層ラベルを利用するために,いくつかの階層的変種を提案する。
関連論文リスト
- 3DYoga90: A Hierarchical Video Dataset for Yoga Pose Understanding [0.0]
3DYoga901は3レベルのラベル階層で構成されている。
我々のデータセットには、慎重にキュレートされたRGBヨガポーズビデオと3Dスケルトンシーケンスが含まれています。
論文 参考訳(メタデータ) (2023-10-16T07:15:31Z) - Fine-Grained Sports, Yoga, and Dance Postures Recognition: A Benchmark
Analysis [24.276782804825846]
人体位置推定はコンピュータビジョンの複雑な問題である。
近年,スポーツ,ヨガ,ダンスの姿勢に関する研究が盛んに行われている。
CNNは、様々な人体推定問題の解決において、大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2023-08-01T07:00:13Z) - VINECS: Video-based Neural Character Skinning [82.39776643541383]
ポーズ依存のスキン重みを持つ完全リップ文字を作成するための完全自動アプローチを提案する。
提案手法は高密度4Dスキャンに頼らず,最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-07-03T08:35:53Z) - An Efficient Deep Convolutional Neural Network Model For Yoga Pose
Recognition Using Single Images [2.6717276381722033]
本稿では,RGB画像からヨガを認識可能な,効率的な深部畳み込みニューラルネットワーク(CNN)モデルYPoseを提案する。
提案したモデルはYoga-82データセットでテストされている。
論文 参考訳(メタデータ) (2023-06-27T19:34:46Z) - PoseVocab: Learning Joint-structured Pose Embeddings for Human Avatar
Modeling [30.93155530590843]
提案するPoseVocabは,高忠実度人間の細部をエンコードできる新しいポーズ符号化手法である。
キャラクターのマルチビューRGBビデオが与えられた後、PoseVocabはトレーニングポーズに基づいてキーポーズと潜在埋め込みを構築する。
実験により,本手法は他の最先端のベースラインよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-04-25T17:25:36Z) - PoseAug: A Differentiable Pose Augmentation Framework for 3D Human Pose
Estimation [83.50127973254538]
既存の3D人間のポーズ推定器は、新しいデータセットへの一般化性能が悪い。
PoseAugは、より多くの多様性に向けて利用可能なトレーニングのポーズを強化することを学ぶ新しい自動増強フレームワークです。
論文 参考訳(メタデータ) (2021-05-06T06:57:42Z) - FixMyPose: Pose Correctional Captioning and Retrieval [67.20888060019028]
本稿では,自動ポーズ修正システムに対応する新しいキャプションデータセットfixmyposeを提案する。
我々は「現在の」ポーズを「ターゲット」ポーズのように見えるように修正する記述を収集する。
MLバイアスを避けるため、さまざまな階層を持つキャラクタ間のバランスを維持します。
論文 参考訳(メタデータ) (2021-04-04T21:45:44Z) - Unsupervised 3D Human Pose Representation with Viewpoint and Pose
Disentanglement [63.853412753242615]
優れた3次元ポーズ表現を学習することは、人間のポーズ関連タスクにとって重要である。
本稿では,3次元ポーズ表現を学習するために,新しいシームズ・デノナイズドオートエンコーダを提案する。
提案手法は,2つの本質的に異なるタスクに対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-07-14T14:25:22Z) - Transferring Dense Pose to Proximal Animal Classes [83.84439508978126]
より一般的な対象検出器やセグメンタなどと同様に、密集したポーズ認識に存在する知識を、他のクラスにおける密集したポーズ認識の問題に移すことが可能であることを示す。
我々は、人間と幾何学的に整合した新しい動物のためのDensePoseモデルを確立することでこれを行う。
また、クラスチンパンジーにDensePoseの方法でラベル付けされた2つのベンチマークデータセットを導入し、アプローチを評価するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-02-28T21:43:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。