論文の概要: 3DYoga90: A Hierarchical Video Dataset for Yoga Pose Understanding
- arxiv url: http://arxiv.org/abs/2310.10131v1
- Date: Mon, 16 Oct 2023 07:15:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 15:58:48.221269
- Title: 3DYoga90: A Hierarchical Video Dataset for Yoga Pose Understanding
- Title(参考訳): 3dyoga90:ヨガポーズ理解のための階層型ビデオデータセット
- Authors: Seonok Kim
- Abstract要約: 3DYoga901は3レベルのラベル階層で構成されている。
我々のデータセットには、慎重にキュレートされたRGBヨガポーズビデオと3Dスケルトンシーケンスが含まれています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The increasing popularity of exercises including yoga and Pilates has created
a greater demand for professional exercise video datasets in the realm of
artificial intelligence. In this study, we developed 3DYoga901, which is
organized within a three-level label hierarchy. We have expanded the number of
poses from an existing state-of-the-art dataset, increasing it from 82 to 90
poses. Our dataset includes meticulously curated RGB yoga pose videos and 3D
skeleton sequences. This dataset was created by a dedicated team of six
individuals, including yoga instructors. It stands out as one of the most
comprehensive open datasets, featuring the largest collection of RGB videos and
3D skeleton sequences among publicly available resources. This contribution has
the potential to significantly advance the field of yoga action recognition and
pose assessment. Additionally, we conducted experiments to evaluate the
practicality of our proposed dataset. We employed three different model
variants for benchmarking purposes.
- Abstract(参考訳): ヨガやピレートなどのエクササイズの人気が高まり、人工知能の分野ではプロのエクササイズビデオデータセットに対する需要が高まっている。
本研究では,3段階のラベル階層に整理した3dyoga901を開発した。
我々は、既存の最先端データセットからのポーズ数を拡大し、82から90に増やした。
我々のデータセットには、慎重にキュレートされたRGBヨガポーズビデオと3Dスケルトンシーケンスが含まれています。
このデータセットはヨガインストラクターを含む6人の専用チームによって作成された。
これは最も包括的なオープンデータセットの1つであり、利用可能なリソースの中で最大のrgbビデオと3dスケルトンシーケンスを特徴としている。
この貢献はヨガの行動認識とポーズアセスメントの分野を著しく前進させる可能性がある。
また,提案するデータセットの実用性を評価する実験を行った。
ベンチマークのために3つの異なるモデル変種を使用しました。
関連論文リスト
- An Efficient Deep Convolutional Neural Network Model For Yoga Pose
Recognition Using Single Images [2.6717276381722033]
本稿では,RGB画像からヨガを認識可能な,効率的な深部畳み込みニューラルネットワーク(CNN)モデルYPoseを提案する。
提案したモデルはYoga-82データセットでテストされている。
論文 参考訳(メタデータ) (2023-06-27T19:34:46Z) - Learning 3D Human Pose Estimation from Dozens of Datasets using a
Geometry-Aware Autoencoder to Bridge Between Skeleton Formats [80.12253291709673]
本稿では,アフィン結合型オートエンコーダ(ACAE)法を提案する。
このアプローチは、28人の人間のポーズデータセットを使って1つのモデルを監督する、極端なマルチデータセット体制にスケールします。
論文 参考訳(メタデータ) (2022-12-29T22:22:49Z) - FLAG3D: A 3D Fitness Activity Dataset with Language Instruction [89.60371681477791]
FLAG3Dは,60カテゴリの180Kシーケンスを含む言語命令付き大規模3Dフィットネスアクティビティデータセットである。
FLAG3Dは、クロスドメインなヒューマンアクション認識、動的ヒューマンメッシュリカバリ、言語誘導型ヒューマンアクション生成など、さまざまな課題に対して大きな研究価値を提供する。
論文 参考訳(メタデータ) (2022-12-09T02:33:33Z) - A View Independent Classification Framework for Yoga Postures [2.922683311119656]
我々は、ランダムフォレスト分類器を訓練するために、身体全体に広がる136個のキーポイントを抽出するために、ヒューマンポーズ推定モデルからの転写学習を採用する。
その結果,4つの異なるカメラアングルから51人の被験者が収集した大規模なヨガ映像データベースを用いて評価を行った。
論文 参考訳(メタデータ) (2022-06-27T18:40:34Z) - StyleGAN-Human: A Data-Centric Odyssey of Human Generation [96.7080874757475]
この研究は、データ中心の観点から、"データエンジニアリング"における複数の重要な側面を調査します。
さまざまなポーズやテクスチャを抽出した230万以上のサンプルで、大規模な人間の画像データセットを収集し、注釈付けします。
本稿では,データサイズ,データ分布,データアライメントといった,スタイルGANに基づく人為的生成のためのデータ工学における3つの重要な要素について精査する。
論文 参考訳(メタデータ) (2022-04-25T17:55:08Z) - Real-time Recognition of Yoga Poses using computer Vision for Smart
Health Care [13.709260905038624]
また、この作品には、ヨガの手札の識別も紹介されている。
YOGIデータセットは、ポーズごとに約400~900枚の画像を持つ10個のヨガ姿勢を含む。
RandomSearch CVのXGBoostは最も正確で、99.2%の精度がある。
論文 参考訳(メタデータ) (2022-01-19T13:41:58Z) - REGRAD: A Large-Scale Relational Grasp Dataset for Safe and
Object-Specific Robotic Grasping in Clutter [52.117388513480435]
本稿では,オブジェクト間の関係のモデル化を継続するregradという新しいデータセットを提案する。
データセットは2D画像と3Dポイントクラウドの両方で収集されます。
ユーザは、好きなだけ多くのデータを生成するために、自由に独自のオブジェクトモデルをインポートできる。
論文 参考訳(メタデータ) (2021-04-29T05:31:21Z) - AcinoSet: A 3D Pose Estimation Dataset and Baseline Models for Cheetahs
in the Wild [51.35013619649463]
我々はAcinoSetと呼ばれる野生のフリーランニングチーターの広範なデータセットを提示する。
データセットには、119,490フレームのマルチビュー同期高速ビデオ映像、カメラキャリブレーションファイル、7,588フレームが含まれている。
また、結果の3D軌道、人間チェックされた3D地上真実、およびデータを検査するインタラクティブツールも提供される。
論文 参考訳(メタデータ) (2021-03-24T15:54:11Z) - Yoga-82: A New Dataset for Fine-grained Classification of Human Poses [46.319423568714505]
82クラスからなる大規模ヨガポーズ認識のためのデータセットYoga-82を提案する。
Yoga-82は、細かいアノテーションができない複雑なポーズで構成されている。
データセットには、体の位置、体の位置の変化、実際のポーズ名を含む3レベル階層が含まれている。
論文 参考訳(メタデータ) (2020-04-22T01:43:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。