論文の概要: VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild
Environment
- arxiv url: http://arxiv.org/abs/2004.06239v4
- Date: Mon, 24 Aug 2020 11:01:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 00:19:33.284462
- Title: VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild
Environment
- Title(参考訳): VoxelPose: 野生環境におけるマルチカメラ3D人物位置推定を目指して
- Authors: Hanyue Tu, Chunyu Wang, Wenjun Zeng
- Abstract要約: 複数のカメラビューから複数の人の3Dポーズを推定する手法を提案する。
本稿では,3D空間で動作するエンドツーエンドのソリューションを提案する。
本稿では,各提案の詳細な3次元ポーズを推定するために,Pose Regression Network (PRN)を提案する。
- 参考スコア(独自算出の注目度): 80.77351380961264
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present an approach to estimate 3D poses of multiple people from multiple
camera views. In contrast to the previous efforts which require to establish
cross-view correspondence based on noisy and incomplete 2D pose estimations, we
present an end-to-end solution which directly operates in the $3$D space,
therefore avoids making incorrect decisions in the 2D space. To achieve this
goal, the features in all camera views are warped and aggregated in a common 3D
space, and fed into Cuboid Proposal Network (CPN) to coarsely localize all
people. Then we propose Pose Regression Network (PRN) to estimate a detailed 3D
pose for each proposal. The approach is robust to occlusion which occurs
frequently in practice. Without bells and whistles, it outperforms the
state-of-the-arts on the public datasets. Code will be released at
https://github.com/microsoft/multiperson-pose-estimation-pytorch.
- Abstract(参考訳): 複数のカメラビューから複数の人の3Dポーズを推定する手法を提案する。
ノイズと不完全な2dポーズ推定に基づくクロスビュー対応の確立を求めるこれまでの取り組みとは対照的に,我々は,3ドルの空間で直接動作するエンドツーエンドのソリューションを提案する。
この目標を達成するために、すべてのカメラビューの機能は、共通の3d空間にゆがみ、集約され、すべての人々を粗くローカライズするためにcuboid proposal network (cpn)に供給される。
次に,各提案の詳細な3次元ポーズを推定するために,ポーズ回帰ネットワーク(prn)を提案する。
このアプローチは、実際に頻繁に発生する閉塞に対して堅牢である。
ベルやホイッスルがなければ、公開データセットの最先端よりも優れています。
コードはhttps://github.com/microsoft/multiperson-pose-estimation-pytorchでリリースされる。
関連論文リスト
- MPL: Lifting 3D Human Pose from Multi-view 2D Poses [75.26416079541723]
本稿では,大規模かつリッチなトレーニングデータセットが存在する2次元ポーズ推定と,トランスフォーマーネットワークを用いた2次元から3次元ポーズリフトを提案する。
実験の結果,MPJPEの誤差は2次元ポーズを三角測量した3次元ポーズと比較して最大45%減少することがわかった。
論文 参考訳(メタデータ) (2024-08-20T12:55:14Z) - Multi-View Person Matching and 3D Pose Estimation with Arbitrary
Uncalibrated Camera Networks [36.49915280876899]
マルチカメラネットワークにおける人物マッチングと人物の3次元ポーズ推定は、カメラが外在的に校正されていない場合、困難である。
既存の取り組みでは、ニューラルネットワークや既知のカメラのトレーニングに大量の3Dデータが必要である。
どちらの情報も必要とせずに2つの課題を解く手法であるPMEを提案する。
論文 参考訳(メタデータ) (2023-12-04T01:28:38Z) - 3D Human Pose Estimation in Multi-View Operating Room Videos Using
Differentiable Camera Projections [2.486571221735935]
本稿では,3次元の損失に基づいて2次元CNNをエンドツーエンドにトレーニングすることで,3次元のローカライゼーションを直接最適化することを提案する。
MVORデータセットの動画を用いて、このエンドツーエンドアプローチが2次元空間での最適化より優れていることを示す。
論文 参考訳(メタデータ) (2022-10-21T09:00:02Z) - Shape-aware Multi-Person Pose Estimation from Multi-View Images [47.13919147134315]
提案した粗大なパイプラインは、まず複数のカメラビューからノイズの多い2次元の観測結果を3次元空間に集約する。
最終的なポーズ推定は、高信頼度多視点2次元観測と3次元関節候補をリンクする新しい最適化スキームから得られる。
論文 参考訳(メタデータ) (2021-10-05T20:04:21Z) - VoxelTrack: Multi-Person 3D Human Pose Estimation and Tracking in the
Wild [98.69191256693703]
本稿では,VoxelTrackを用いて,多人数の3次元ポーズ推定と,広義のベースラインで分離された少数のカメラからの追跡を行う。
マルチブランチネットワークを使用して、環境中のすべての人に3Dポーズと再識別機能(Re-ID)を共同で推定する。
これは、Shelf、Campus、CMU Panopticの3つの公開データセットに対して、最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2021-08-05T08:35:44Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - Fusing Wearable IMUs with Multi-View Images for Human Pose Estimation: A
Geometric Approach [76.10879433430466]
多視点画像と人手足に装着したIMUから3次元人間のポーズを推定する。
まず2つの信号から2Dのポーズを検出し、3D空間に持ち上げる。
単純な2段階のアプローチは、公開データセット上の大きなマージンによる最先端のエラーを低減する。
論文 参考訳(メタデータ) (2020-03-25T00:26:54Z) - Cross-View Tracking for Multi-Human 3D Pose Estimation at over 100 FPS [13.191601826570786]
マルチキャリブレーションカメラビューから複数人の3Dポーズを推定する新しい手法を提案する。
異なるカメラ座標の2Dポーズを入力として取り、グローバル座標の正確な3Dポーズを目指しています。
カメラビューが12から28の大規模マルチヒューマンデータセットを提案する。
論文 参考訳(メタデータ) (2020-03-09T08:54:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。