論文の概要: ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2312.06386v1
- Date: Mon, 11 Dec 2023 13:50:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 15:32:21.459302
- Title: ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation
- Title(参考訳): manipose:多様体に拘束されたマルチハイポテーゼ3次元ポーズ推定
- Authors: C\'edric Rommel, Victor Letzelter, Nermin Samet, Renaud Marlet,
Matthieu Cord, Patrick P\'erez and Eduardo Valle
- Abstract要約: ほとんどの3D-HPE法は回帰モデルに依存しており、入力と出力の1対1のマッピングを前提としている。
提案するManiPoseは,2次元入力毎に複数の候補3次元ポーズを提案可能な,新しい多様体制約型マルチハイポテーシスモデルである。
従来のマルチハイブリッドアプローチとは異なり、我々のソリューションは完全に教師付きであり、複雑な生成モデルに依存しない。
- 参考スコア(独自算出の注目度): 54.86887812687023
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular 3D human pose estimation (3D-HPE) is an inherently ambiguous task,
as a 2D pose in an image might originate from different possible 3D poses. Yet,
most 3D-HPE methods rely on regression models, which assume a one-to-one
mapping between inputs and outputs. In this work, we provide theoretical and
empirical evidence that, because of this ambiguity, common regression models
are bound to predict topologically inconsistent poses, and that traditional
evaluation metrics, such as the MPJPE, P-MPJPE and PCK, are insufficient to
assess this aspect. As a solution, we propose ManiPose, a novel
manifold-constrained multi-hypothesis model capable of proposing multiple
candidate 3D poses for each 2D input, together with their corresponding
plausibility. Unlike previous multi-hypothesis approaches, our solution is
completely supervised and does not rely on complex generative models, thus
greatly facilitating its training and usage. Furthermore, by constraining our
model to lie within the human pose manifold, we can guarantee the consistency
of all hypothetical poses predicted with our approach, which was not possible
in previous works. We illustrate the usefulness of ManiPose in a synthetic
1D-to-2D lifting setting and demonstrate on real-world datasets that it
outperforms state-of-the-art models in pose consistency by a large margin,
while still reaching competitive MPJPE performance.
- Abstract(参考訳): 単眼の3Dポーズ推定(3D-HPE)は本質的に曖昧な作業であり、画像中の2Dポーズは異なる可能な3Dポーズから生じる可能性がある。
しかし、ほとんどの3D-HPE法は回帰モデルに依存しており、入力と出力の1対1のマッピングを前提としている。
本研究では, この曖昧さのため, 共通回帰モデルでは位相的に矛盾するポーズを予測できないこと, 従来の評価指標であるMPJPE, P-MPJPE, PCKは, この側面を評価するには不十分であることを示す。
そこで本稿では,2次元入力毎に複数の候補3dポーズを提案できる,新しい多様体拘束型マルチハイポテーゼモデルであるmaniposeを提案する。
従来のマルチハイポテーゼアプローチとは異なり、ソリューションは完全に監督されており、複雑な生成モデルに依存しないため、トレーニングと使用が大幅に容易になる。
さらに,人間のポーズ多様体内に存在するようにモデルを拘束することにより,従来の研究では不可能であったアプローチで予測されるすべての仮説的ポーズの整合性を保証することができる。
本研究では,合成1次元から2次元の浮き上がり設定におけるマニポースの有用性を示し,実世界のデータセットにおいて,競争性のあるmpjpe性能を保ちながら,ポーズの一貫性において最先端のモデルを上回ることを実証する。
関連論文リスト
- DiffPose: Multi-hypothesis Human Pose Estimation using Diffusion models [5.908471365011943]
与えられた入力画像に対して複数の仮説を予測する条件拡散モデルであるemphDiffPoseを提案する。
DiffPoseは, 簡単なポーズの多面的ポーズを推定し, 極めてあいまいなポーズに対して大きなマージンで優れることを示す。
論文 参考訳(メタデータ) (2022-11-29T18:55:13Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Probabilistic Monocular 3D Human Pose Estimation with Normalizing Flows [24.0966076588569]
本稿では,不明瞭な逆2D-to-3D問題を解くために,決定論的3D-to-2Dマッピングを利用する正規化フローベース手法を提案する。
我々は、Human3.6MとMPI-INF-3DHPの2つのベンチマークデータセットに対するアプローチを評価し、ほとんどの指標において同等の手法を上回りました。
論文 参考訳(メタデータ) (2021-07-29T07:33:14Z) - 3D Multi-bodies: Fitting Sets of Plausible 3D Human Models to Ambiguous
Image Data [77.57798334776353]
単眼・部分閉塞視からヒトの高密度3次元再構成を実現することの問題点を考察する。
身体の形状やポーズをパラメータ化することで、あいまいさをより効果的にモデル化できることを示唆する。
提案手法は, 3次元人間の標準ベンチマークにおいて, あいまいなポーズ回復において, 代替手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-02T13:55:31Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。