論文の概要: SMPLy Benchmarking 3D Human Pose Estimation in the Wild
- arxiv url: http://arxiv.org/abs/2012.02743v1
- Date: Fri, 4 Dec 2020 17:48:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-22 20:38:52.443518
- Title: SMPLy Benchmarking 3D Human Pose Estimation in the Wild
- Title(参考訳): SMPLyによる野生における3次元人物位置推定のベンチマーク
- Authors: Vincent Leroy, Philippe Weinzaepfel, Romain Br\'egier, Hadrien
Combaluzier, Gr\'egory Rogez
- Abstract要約: Mannequin Challengeのデータセットには、彫像のようなアクションで凍った人々の野生の映像が含まれている。
登録されたボディモデルを持つ合計24,428フレームは、ほぼ無償で567シーンから選択される。
我々は,このデータセット上で,最先端のSMPLに基づく人間のポーズ推定手法をベンチマークする。
- 参考スコア(独自算出の注目度): 14.323219585166573
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting 3D human pose from images has seen great recent improvements.
Novel approaches that can even predict both pose and shape from a single input
image have been introduced, often relying on a parametric model of the human
body such as SMPL. While qualitative results for such methods are often shown
for images captured in-the-wild, a proper benchmark in such conditions is still
missing, as it is cumbersome to obtain ground-truth 3D poses elsewhere than in
a motion capture room. This paper presents a pipeline to easily produce and
validate such a dataset with accurate ground-truth, with which we benchmark
recent 3D human pose estimation methods in-the-wild. We make use of the
recently introduced Mannequin Challenge dataset which contains in-the-wild
videos of people frozen in action like statues and leverage the fact that
people are static and the camera moving to accurately fit the SMPL model on the
sequences. A total of 24,428 frames with registered body models are then
selected from 567 scenes at almost no cost, using only online RGB videos. We
benchmark state-of-the-art SMPL-based human pose estimation methods on this
dataset. Our results highlight that challenges remain, in particular for
difficult poses or for scenes where the persons are partially truncated or
occluded.
- Abstract(参考訳): 画像から3d人間のポーズを予測することは、最近非常に改善されている。
単一の入力画像からポーズと形状の両方を予測できる新しいアプローチが導入されており、しばしばsmplのような人体のパラメトリックモデルに依存している。
このような方法の質的な結果はしばしば、撮影中の画像に対して示されるが、モーションキャプチャー室よりも地上の3Dポーズを得るのが難しいため、そのような条件下での適切なベンチマークはいまだに欠落している。
本稿では,これらのデータセットを正確な地上構造で容易に生成し,検証するためのパイプラインを提案する。
我々は、最近導入されたMannequin Challengeデータセットを利用して、彫像のようなアクションで凍った人々の野生のビデオを収録し、人々が静的であり、カメラがSMPLモデルに正確に適合するように動いているという事実を活用する。
登録されたボディモデルを持つ合計24,428フレームは、オンラインRGBビデオのみを使用して、ほぼ無償で567シーンから選択される。
我々は,このデータセット上で,最先端のSMPLに基づく人間のポーズ推定手法をベンチマークする。
以上の結果から,課題は,特に難易度の高いポーズや,人が部分的に行き詰まったり隠されたりした場面に残ることが示唆された。
関連論文リスト
- ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [54.86887812687023]
ほとんどの3D-HPE法は回帰モデルに依存しており、入力と出力の1対1のマッピングを前提としている。
提案するManiPoseは,2次元入力毎に複数の候補3次元ポーズを提案可能な,新しい多様体制約型マルチハイポテーシスモデルである。
従来のマルチハイブリッドアプローチとは異なり、我々のソリューションは完全に教師付きであり、複雑な生成モデルに依存しない。
論文 参考訳(メタデータ) (2023-12-11T13:50:10Z) - MPM: A Unified 2D-3D Human Pose Representation via Masked Pose Modeling [59.74064212110042]
mpmcanは、3D人間のポーズ推定、クラッドされた2Dポーズからの3Dポーズ推定、3Dポーズ完了をtextocbsingleフレームワークで処理する。
MPI-INF-3DHPにおいて、広く使われているポーズデータセットの広範な実験とアブレーション研究を行い、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-06-29T10:30:00Z) - Self-supervised 3D Human Pose Estimation from a Single Image [1.0878040851638]
本研究では,1枚の画像から3次元人体ポーズを予測する自己教師型手法を提案する。
予測ネットワークは、典型的なポーズの人物と、未ペアの2Dポーズのセットを描写した未ラベル画像のデータセットから訓練される。
論文 参考訳(メタデータ) (2023-04-05T10:26:21Z) - ElePose: Unsupervised 3D Human Pose Estimation by Predicting Camera
Elevation and Learning Normalizing Flows on 2D Poses [23.554957518485324]
本研究では、1つの画像から3次元人間のポーズを予測することを学ぶ教師なしのアプローチを提案する。
ランダムなプロジェクションに最も近い3次元ポーズを推定し、2次元ポーズの正規化フローを用いて推定する。
我々は,Human3.6M と MPI-INF-3DHP のベンチマークデータセット上で,最先端の教師なしポーズ推定手法を多くの指標で上回っている。
論文 参考訳(メタデータ) (2021-12-14T01:12:45Z) - Adversarial Parametric Pose Prior [106.12437086990853]
我々は、SMPLパラメータを現実的なポーズを生成する値に制限する事前学習を行う。
得られた先行学習は実データ分布の多様性をカバーし、2次元キーポイントからの3次元再構成の最適化を容易にし、画像からの回帰に使用する場合のポーズ推定精度を向上することを示す。
論文 参考訳(メタデータ) (2021-12-08T10:05:32Z) - Heuristic Weakly Supervised 3D Human Pose Estimation [13.82540778667711]
弱教師付き3D人間のポーズ(HW-HuP)ソリューションは、3Dのポーズデータが入手できない場合に3Dのポーズを推定する。
HW-HuPは,ヒトのベッドでのポーズと野生での幼児のポーズという,3次元のポーズデータが得られにくい2つの実践的な環境で,最先端のモデルにおいて有意義に改善されていることを示す。
論文 参考訳(メタデータ) (2021-05-23T18:40:29Z) - AGORA: Avatars in Geography Optimized for Regression Analysis [35.22486186509372]
AGORAは、高いリアリズムと高精度な地上真実を持つ合成データセットである。
SMPL-Xのボディモデル(顔と手)を3Dスキャンに合わせることで、参照3Dポーズと体形を作成する。
このデータセットを用いて既存の3次元ポーズ推定手法の評価を行い、ほとんどの手法が子供の画像に悪影響を及ぼすことを見出した。
論文 参考訳(メタデータ) (2021-04-29T20:33:25Z) - 3D Multi-bodies: Fitting Sets of Plausible 3D Human Models to Ambiguous
Image Data [77.57798334776353]
単眼・部分閉塞視からヒトの高密度3次元再構成を実現することの問題点を考察する。
身体の形状やポーズをパラメータ化することで、あいまいさをより効果的にモデル化できることを示唆する。
提案手法は, 3次元人間の標準ベンチマークにおいて, あいまいなポーズ回復において, 代替手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-02T13:55:31Z) - Towards Generalization of 3D Human Pose Estimation In The Wild [73.19542580408971]
3DBodyTex.Poseは、3Dの人間のポーズ推定のタスクに対処するデータセットである。
3DBodyTex.Poseは、さまざまな衣服やポーズで405種類の実際の被写体を含む高品質でリッチなデータを提供する。
論文 参考訳(メタデータ) (2020-04-21T13:31:58Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。