論文の概要: Deep Learning-Based Human Pose Estimation: A Survey
- arxiv url: http://arxiv.org/abs/2012.13392v3
- Date: Sat, 2 Jan 2021 19:24:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-25 08:05:15.559422
- Title: Deep Learning-Based Human Pose Estimation: A Survey
- Title(参考訳): 深層学習に基づく人間のポーズ推定:調査
- Authors: Ce Zheng and Wenhan Wu and Taojiannan Yang and Sijie Zhu and Chen Chen
and Ruixu Liu and Ju Shen and Nasser Kehtarnavaz and Mubarak Shah
- Abstract要約: 人間ポーズ推定は、人体の部位を特定し、画像やビデオなどの入力データから人体表現を構築することを目的としている。
近年,人間のポーズ推定において,深層学習に基づく解が高性能に実現されている。
2014年以来240以上の研究論文がこの調査に取り上げられています。
- 参考スコア(独自算出の注目度): 48.36406891020275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human pose estimation aims to locate the human body parts and build human
body representation (e.g., body skeleton) from input data such as images and
videos. It has drawn increasing attention during the past decade and has been
utilized in a wide range of applications including human-computer interaction,
motion analysis, augmented reality, and virtual reality. Although the recently
developed deep learning-based solutions have achieved high performance in human
pose estimation, there still remain challenges due to insufficient training
data, depth ambiguities, and occlusion. The goal of this survey paper is to
provide a comprehensive review of recent deep learning-based solutions for both
2D and 3D pose estimation via a systematic analysis and comparison of these
solutions based on their input data and inference procedures. More than 240
research papers since 2014 are covered in this survey. Furthermore, 2D and 3D
human pose estimation datasets and evaluation metrics are included.
Quantitative performance comparisons of the reviewed methods on popular
datasets are summarized and discussed. Finally, the challenges involved,
applications, and future research directions are concluded. We also provide a
regularly updated project page: \url{https://github.com/zczcwh/DL-HPE}
- Abstract(参考訳): 人間のポーズ推定は、人体の部位を特定し、画像やビデオなどの入力データから人体表現(体骨格など)を構築することを目的としている。
この技術は過去10年間で注目を集め、人間とコンピュータのインタラクション、モーション分析、拡張現実、バーチャルリアリティーなど幅広い用途で利用されてきた。
最近開発されたディープラーニングベースのソリューションは、人間のポーズ推定において高いパフォーマンスを達成しているが、トレーニングデータ不足、深度あいまいさ、閉塞性などの問題はまだ残っている。
本研究の目的は,近年の深層学習に基づく2次元・3次元ポーズ推定手法の総合的なレビューを,入力データと推論手順に基づいて,体系的な解析と比較により提供することである。
2014年以降、240以上の研究論文が調査の対象となっている。
さらに、2次元および3次元の人格推定データセットおよび評価指標を含む。
一般的なデータセットに対するレビュー手法の定量的性能比較を要約し,考察した。
最後に、関連する課題、応用、今後の研究の方向性をまとめる。
また、定期的に更新されたプロジェクトページも提供しています。
関連論文リスト
- Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。
また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文 参考訳(メタデータ) (2024-05-13T14:44:22Z) - A Survey on 3D Egocentric Human Pose Estimation [3.5845457075304363]
エゴセントリックな人間のポーズ推定は、人間のポーズを推定し、ファースト・パーソン・カメラの観点から身体表現を開発することを目的としている。
近年、XR技術、人間とコンピュータのインタラクション、フィットネストラッキングといった分野に幅広く応用されているため、広く普及している。
エゴセントリックな3次元ポーズ推定に関する提案された解決策に基づく体系的な文献レビューは行われていない。
論文 参考訳(メタデータ) (2024-03-26T17:29:26Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Deep learning for 3D human pose estimation and mesh recovery: A survey [6.535833206786788]
本稿では過去5年間の3次元ポーズ推定のためのディープラーニング手法の進歩を概観する。
我々の知る限りでは、この調査は人間の3次元ポーズ推定のためのディープラーニング手法を包括的にカバーした最初のものであることは間違いない。
論文 参考訳(メタデータ) (2024-02-29T04:30:39Z) - 2D Human Pose Estimation: A Survey [16.56050212383859]
人間のポーズ推定は、入力データ中の人間の解剖学的キーポイントまたは身体部分のローカライズを目的としている。
ディープラーニング技術は、データから直接特徴表現を学習することを可能にする。
本稿では,近年の2次元ポーズ推定手法の成果を振り返り,包括的調査を行う。
論文 参考訳(メタデータ) (2022-04-15T08:09:43Z) - Recovering 3D Human Mesh from Monocular Images: A Survey [49.00136388529404]
単眼画像から人間のポーズと形状を推定することは、コンピュータビジョンにおける長年の問題である。
本調査は, 単分子型3次元メッシュ回収の課題に焦点を当てた。
論文 参考訳(メタデータ) (2022-03-03T18:56:08Z) - Recent Advances in Monocular 2D and 3D Human Pose Estimation: A Deep
Learning Perspective [69.44384540002358]
この問題に対処するための包括的で包括的な2D-to-3D視点を提供する。
2014年からの主流とマイルストーンのアプローチを統一フレームワークで分類しています。
また,ポーズ表現スタイル,ベンチマーク,評価指標,一般的なアプローチの定量的評価を要約した。
論文 参考訳(メタデータ) (2021-04-23T11:07:07Z) - Cascaded deep monocular 3D human pose estimation with evolutionary
training data [76.3478675752847]
深層表現学習は単眼の3次元ポーズ推定において顕著な精度を達成した。
本稿では,大量のトレーニングデータに対してスケーラブルな新しいデータ拡張手法を提案する。
本手法は,先行知識に触発された階層的人体表現と合成に基づいて,未知の3次元人体骨格を合成する。
論文 参考訳(メタデータ) (2020-06-14T03:09:52Z) - Monocular Human Pose Estimation: A Survey of Deep Learning-based Methods [25.3614052943568]
視覚に基づく単眼の人間のポーズ推定は、コンピュータビジョンにおける最も根本的で困難な問題の1つである。
近年の深層学習技術の発展は、人間のポーズ推定分野において顕著な進歩と画期的なブレークスルーをもたらしている。
論文 参考訳(メタデータ) (2020-06-02T07:07:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。