論文の概要: Error Bounds of Projection Models in Weakly Supervised 3D Human Pose
Estimation
- arxiv url: http://arxiv.org/abs/2010.12317v1
- Date: Fri, 23 Oct 2020 11:48:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 23:20:45.861214
- Title: Error Bounds of Projection Models in Weakly Supervised 3D Human Pose
Estimation
- Title(参考訳): 弱教師付き3次元ポーズ推定における投影モデルの誤差境界
- Authors: Nikolas Klug, Moritz Einfalt, Stephan Brehm, Rainer Lienhart
- Abstract要約: 本稿では,最もよく用いられる簡易射影モデルの詳細な解析を行う。
我々は、この保証された最小誤差を避けるために、正規化された視点投影をどのように置き換えるかを示す。
以上の結果から,どちらの射影モデルも位置とスケールの整列後も,19.3mmから54.7mmの誤差が生じることがわかった。
- 参考スコア(独自算出の注目度): 27.289210415215067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The current state-of-the-art in monocular 3D human pose estimation is heavily
influenced by weakly supervised methods. These allow 2D labels to be used to
learn effective 3D human pose recovery either directly from images or via
2D-to-3D pose uplifting. In this paper we present a detailed analysis of the
most commonly used simplified projection models, which relate the estimated 3D
pose representation to 2D labels: normalized perspective and weak perspective
projections. Specifically, we derive theoretical lower bound errors for those
projection models under the commonly used mean per-joint position error
(MPJPE). Additionally, we show how the normalized perspective projection can be
replaced to avoid this guaranteed minimal error. We evaluate the derived lower
bounds on the most commonly used 3D human pose estimation benchmark datasets.
Our results show that both projection models lead to an inherent minimal error
between 19.3mm and 54.7mm, even after alignment in position and scale. This is
a considerable share when comparing with recent state-of-the-art results. Our
paper thus establishes a theoretical baseline that shows the importance of
suitable projection models in weakly supervised 3D human pose estimation.
- Abstract(参考訳): 単眼的3次元ポーズ推定における現在の最先端は, 弱教師あり手法の影響を強く受けている。
これにより、2Dラベルは、画像から直接または2Dから3Dのポーズアップリフトを介して、効果的な3Dポーズ回復を学習することができる。
本稿では,推定された3次元ポーズ表現を2次元ラベル(正規化視点と弱い視点投影)に関連付ける,最もよく用いられる簡易投影モデルの詳細解析を行う。
具体的には、一般的な平均結合位置誤差(mpjpe)の下での投影モデルの理論的下限誤差を導出する。
さらに、この保証された最小誤差を避けるために、正規化視点投影をどのように置き換えるかを示す。
最も一般的に使用される3次元ポーズ推定ベンチマークデータセットの導出下限を評価する。
以上の結果から,どちらの射影モデルも位置とスケールの整列後も,19.3mmから54.7mmの誤差が生じることがわかった。
最近の最新結果と比較すると、これはかなりのシェアを占める。
そこで本研究では,弱教師付き3次元ポーズ推定における適切な投影モデルの重要性を示す理論的ベースラインを確立する。
関連論文リスト
- TokenHMR: Advancing Human Mesh Recovery with a Tokenized Pose Representation [48.08156777874614]
現在の手法では3次元擬似地下構造(p-GT)と2次元鍵点を利用して、堅牢な性能を実現している。
このような手法により、3次元ポーズ精度のパラドックス的低下が観察され、2次元精度が増大する。
現行のカメラモデルによる誤差を定量化し、2Dキーポイントとp-GTの装着が正確な3Dポーズを引き起こすことを示す。
論文 参考訳(メタデータ) (2024-04-25T17:09:14Z) - Personalized 3D Human Pose and Shape Refinement [19.082329060985455]
回帰に基づく手法は3次元人間のポーズと形状推定の分野を支配してきた。
本稿では,初期人間のモデル推定値と対応する画像との密接な対応性を構築することを提案する。
提案手法は画像モデルアライメントの改善だけでなく,3次元精度の向上にも寄与する。
論文 参考訳(メタデータ) (2024-03-18T10:13:53Z) - ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [54.86887812687023]
ほとんどの3D-HPE法は回帰モデルに依存しており、入力と出力の1対1のマッピングを前提としている。
提案するManiPoseは,2次元入力毎に複数の候補3次元ポーズを提案可能な,新しい多様体制約型マルチハイポテーシスモデルである。
従来のマルチハイブリッドアプローチとは異なり、我々のソリューションは完全に教師付きであり、複雑な生成モデルに依存しない。
論文 参考訳(メタデータ) (2023-12-11T13:50:10Z) - SPGNet: Spatial Projection Guided 3D Human Pose Estimation in Low
Dimensional Space [14.81199315166042]
本研究では,多次元再投影と教師あり学習を混合した3次元人間のポーズ推定手法を提案する。
提案手法は,データセットHuman3.6Mの推定結果に基づいて,定性的にも定量的にも,多くの最先端手法より優れている。
論文 参考訳(メタデータ) (2022-06-04T00:51:00Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - PONet: Robust 3D Human Pose Estimation via Learning Orientations Only [116.1502793612437]
本稿では,学習向きのみを用いて3次元ポーズを頑健に推定できる新しいPose Orientation Net(PONet)を提案する。
PONetは、局所的な画像証拠を利用して、これらの手足の3D方向を推定し、3Dポーズを復元する。
我々は,Human3.6M,MPII,MPI-INF-3DHP,3DPWを含む複数のデータセットについて評価を行った。
論文 参考訳(メタデータ) (2021-12-21T12:48:48Z) - Probabilistic Monocular 3D Human Pose Estimation with Normalizing Flows [24.0966076588569]
本稿では,不明瞭な逆2D-to-3D問題を解くために,決定論的3D-to-2Dマッピングを利用する正規化フローベース手法を提案する。
我々は、Human3.6MとMPI-INF-3DHPの2つのベンチマークデータセットに対するアプローチを評価し、ほとんどの指標において同等の手法を上回りました。
論文 参考訳(メタデータ) (2021-07-29T07:33:14Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。