論文の概要: 2D Human Pose Estimation: A Survey
- arxiv url: http://arxiv.org/abs/2204.07370v1
- Date: Fri, 15 Apr 2022 08:09:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-18 19:45:17.779458
- Title: 2D Human Pose Estimation: A Survey
- Title(参考訳): 2次元人間のポーズ推定:調査
- Authors: Haoming Chen, Runyang Feng, Sifan Wu, Hao Xu, Fengcheng Zhou,
Zhenguang Liu
- Abstract要約: 人間のポーズ推定は、入力データ中の人間の解剖学的キーポイントまたは身体部分のローカライズを目的としている。
ディープラーニング技術は、データから直接特徴表現を学習することを可能にする。
本稿では,近年の2次元ポーズ推定手法の成果を振り返り,包括的調査を行う。
- 参考スコア(独自算出の注目度): 16.56050212383859
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human pose estimation aims at localizing human anatomical keypoints or body
parts in the input data (e.g., images, videos, or signals). It forms a crucial
component in enabling machines to have an insightful understanding of the
behaviors of humans, and has become a salient problem in computer vision and
related fields. Deep learning techniques allow learning feature representations
directly from the data, significantly pushing the performance boundary of human
pose estimation. In this paper, we reap the recent achievements of 2D human
pose estimation methods and present a comprehensive survey. Briefly, existing
approaches put their efforts in three directions, namely network architecture
design, network training refinement, and post processing. Network architecture
design looks at the architecture of human pose estimation models, extracting
more robust features for keypoint recognition and localization. Network
training refinement tap into the training of neural networks and aims to
improve the representational ability of models. Post processing further
incorporates model-agnostic polishing strategies to improve the performance of
keypoint detection. More than 200 research contributions are involved in this
survey, covering methodological frameworks, common benchmark datasets,
evaluation metrics, and performance comparisons. We seek to provide researchers
with a more comprehensive and systematic review on human pose estimation,
allowing them to acquire a grand panorama and better identify future
directions.
- Abstract(参考訳): 人間のポーズ推定は、入力データ(画像、ビデオ、信号など)中の人間の解剖学的キーポイントまたは身体部分のローカライズを目的としている。
マシンが人間の行動についての洞察に富む理解を可能にする上で重要な要素となり、コンピュータビジョンや関連分野において健全な問題となっている。
ディープラーニング技術は、データから直接特徴表現を学習し、人間のポーズ推定のパフォーマンス境界を大幅に押し上げる。
本稿では,2次元人格推定手法の最近の成果を振り返り,包括的調査を行う。
既存のアプローチでは、ネットワークアーキテクチャ設計、ネットワークトレーニングの改良、ポストプロセッシングという3つの方向に取り組みました。
ネットワークアーキテクチャ設計は、人間のポーズ推定モデルのアーキテクチャを調べ、キーポイント認識とローカライゼーションのためのより堅牢な特徴を抽出する。
ネットワークトレーニングの洗練は、ニューラルネットワークのトレーニングに踏み込み、モデルの表現能力を改善することを目的としている。
ポスト処理は、キーポイント検出の性能を改善するために、モデルに依存しない研磨戦略をさらに取り入れている。
この調査には200以上の研究コントリビューションが参加しており、方法論フレームワーク、一般的なベンチマークデータセット、評価指標、パフォーマンス比較がカバーされている。
我々は、研究者に人間のポーズ推定をより包括的で体系的なレビューを提供し、グランドパノラマを獲得し、将来の方向性をよりよく特定できるようにする。
関連論文リスト
- 3D WholeBody Pose Estimation based on Semantic Graph Attention Network and Distance Information [2.457872341625575]
新たなセマンティックグラフアテンションネットワークは、グローバルコンテキストをキャプチャする自己アテンションの能力の恩恵を受けることができる。
本体部分デコーダは、身体の特定のセグメントに関連する情報を抽出し、精製するのを支援する。
幾何学的損失(Geometry Loss)は身体の構造的骨格に批判的な制約を与え、モデルの予測が人間の姿勢の自然な限界に合致することを確実にする。
論文 参考訳(メタデータ) (2024-06-03T10:59:00Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Human as Points: Explicit Point-based 3D Human Reconstruction from
Single-view RGB Images [78.56114271538061]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。
提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。
我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文 参考訳(メタデータ) (2023-11-06T05:52:29Z) - Computation-efficient Deep Learning for Computer Vision: A Survey [121.84121397440337]
ディープラーニングモデルは、さまざまな視覚的知覚タスクにおいて、人間レベルのパフォーマンスに到達または超えた。
ディープラーニングモデルは通常、重要な計算資源を必要とし、現実のシナリオでは非現実的な電力消費、遅延、または二酸化炭素排出量につながる。
新しい研究の焦点は計算効率のよいディープラーニングであり、推論時の計算コストを最小限に抑えつつ、良好な性能を達成することを目指している。
論文 参考訳(メタデータ) (2023-08-27T03:55:28Z) - Deep Learning for Human Parsing: A Survey [54.812353922568995]
本研究では,人間の意味解析の先駆的な研究の幅広い範囲を網羅する,最先端の人間の構文解析手法の解析を行う。
1) 構造駆動型アーキテクチャは,人体の異なる部分と固有の階層構造を生かし,(2) グラフベースのネットワークは,効率的で完全な人体分析を実現するためにグローバルな情報を捉え,(3) コンテキスト認識ネットワークは,対応するクラスのピクセルを特徴付けるために,すべてのピクセルにわたって有用なコンテキストを探索し,(4) LSTMベースの手法は,短距離と長距離空間の依存関係を結合して,豊富な局所的・グローバルなコンテキストをうまく活用することができる。
論文 参考訳(メタデータ) (2023-01-29T10:54:56Z) - A survey of top-down approaches for human pose estimation [0.0]
Deep Learningで実装された最先端の手法は、人間のポーズ推定の分野で顕著な成果をもたらした。
本稿では,人々のポーズを認識するための深層学習手法に基づく2次元画像の広範なレビューを新参者に提供することを目的とする。
論文 参考訳(メタデータ) (2022-02-05T23:27:46Z) - Single Person Pose Estimation: A Survey [45.144269986277365]
制約のない画像やビデオにおける人間のポーズ推定は、基本的なコンピュータビジョンタスクである。
本稿では, 人間の代表的ポーズ法を構造化分類法で要約し, 特に深層学習モデルと一対一のイメージ設定に着目した。
我々は、データ拡張、モデルアーキテクチャ、バックボーンを含む典型的な人間のポーズ推定パイプラインのすべてのコンポーネントを調べ、調査する。
論文 参考訳(メタデータ) (2021-09-21T09:53:15Z) - Recent Advances in Monocular 2D and 3D Human Pose Estimation: A Deep
Learning Perspective [69.44384540002358]
この問題に対処するための包括的で包括的な2D-to-3D視点を提供する。
2014年からの主流とマイルストーンのアプローチを統一フレームワークで分類しています。
また,ポーズ表現スタイル,ベンチマーク,評価指標,一般的なアプローチの定量的評価を要約した。
論文 参考訳(メタデータ) (2021-04-23T11:07:07Z) - Deep Learning-Based Human Pose Estimation: A Survey [66.01917727294163]
人間のポーズ推定は、過去10年間に注目を集めてきた。
ヒューマン・コンピュータ・インタラクション、モーション・アナリティクス、拡張現実、バーチャル・リアリティーなど幅広い用途で利用されている。
最近のディープラーニングベースのソリューションは、人間のポーズ推定において高いパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-12-24T18:49:06Z) - Monocular Human Pose Estimation: A Survey of Deep Learning-based Methods [25.3614052943568]
視覚に基づく単眼の人間のポーズ推定は、コンピュータビジョンにおける最も根本的で困難な問題の1つである。
近年の深層学習技術の発展は、人間のポーズ推定分野において顕著な進歩と画期的なブレークスルーをもたらしている。
論文 参考訳(メタデータ) (2020-06-02T07:07:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。