論文の概要: Context Modeling in 3D Human Pose Estimation: A Unified Perspective
- arxiv url: http://arxiv.org/abs/2103.15507v2
- Date: Tue, 30 Mar 2021 08:56:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-31 11:59:55.467861
- Title: Context Modeling in 3D Human Pose Estimation: A Unified Perspective
- Title(参考訳): 3次元人文推定におけるコンテキストモデリング:統一的視点
- Authors: Xiaoxuan Ma, Jiajun Su, Chunyu Wang, Hai Ci and Yizhou Wang
- Abstract要約: 本稿では, PSM と GNN が特殊ケースである文脈モデリングの一般公式を提案する。
両手法を比較して, GNN の終末訓練法と PSM の辺縁長制約が相補的要因であることを確認した。
深いネットワークでソフトな手足長の制約を強制できる注意メカニズムに基づいたContextPoseを提案します。
- 参考スコア(独自算出の注目度): 27.36648656930247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating 3D human pose from a single image suffers from severe ambiguity
since multiple 3D joint configurations may have the same 2D projection. The
state-of-the-art methods often rely on context modeling methods such as
pictorial structure model (PSM) or graph neural network (GNN) to reduce
ambiguity. However, there is no study that rigorously compares them side by
side. So we first present a general formula for context modeling in which both
PSM and GNN are its special cases. By comparing the two methods, we found that
the end-to-end training scheme in GNN and the limb length constraints in PSM
are two complementary factors to improve results. To combine their advantages,
we propose ContextPose based on attention mechanism that allows enforcing soft
limb length constraints in a deep network. The approach effectively reduces the
chance of getting absurd 3D pose estimates with incorrect limb lengths and
achieves state-of-the-art results on two benchmark datasets. More importantly,
the introduction of limb length constraints into deep networks enables the
approach to achieve much better generalization performance.
- Abstract(参考訳): 一つの画像から3Dのポーズを推定することは、複数の3D関節構成が同じ2D投影を持つため、深刻な曖昧さに悩まされる。
最先端の手法は、曖昧さを減らすために、画像構造モデル(PSM)やグラフニューラルネットワーク(GNN)のようなコンテキストモデリング手法に依存することが多い。
しかし、厳格に並べて比較する研究は行われていない。
そこで、まず、PSMとGNNの両方が特殊なケースであるコンテキストモデリングの一般的な公式を示す。
両手法を比較して, GNN の終末訓練法と PSM の辺縁長制約が相補的要因であることを確認した。
これらの利点を組み合わせるために,深層ネットワークにおける軟部肢長制約を強制する注意機構に基づくContextPoseを提案する。
このアプローチは、不条理な3dポーズ推定を不正確な四肢の長さで得る機会を効果的に削減し、2つのベンチマークデータセットで最先端の結果を得る。
さらに、深層ネットワークに四肢長制約を導入することにより、より優れた一般化性能を実現することができる。
関連論文リスト
- ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [54.86887812687023]
ほとんどの3D-HPE法は回帰モデルに依存しており、入力と出力の1対1のマッピングを前提としている。
提案するManiPoseは,2次元入力毎に複数の候補3次元ポーズを提案可能な,新しい多様体制約型マルチハイポテーシスモデルである。
従来のマルチハイブリッドアプローチとは異なり、我々のソリューションは完全に教師付きであり、複雑な生成モデルに依存しない。
論文 参考訳(メタデータ) (2023-12-11T13:50:10Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - PONet: Robust 3D Human Pose Estimation via Learning Orientations Only [116.1502793612437]
本稿では,学習向きのみを用いて3次元ポーズを頑健に推定できる新しいPose Orientation Net(PONet)を提案する。
PONetは、局所的な画像証拠を利用して、これらの手足の3D方向を推定し、3Dポーズを復元する。
我々は,Human3.6M,MPII,MPI-INF-3DHP,3DPWを含む複数のデータセットについて評価を行った。
論文 参考訳(メタデータ) (2021-12-21T12:48:48Z) - 3D Human Pose Estimation Based on 2D-3D Consistency with Synchronized
Adversarial Training [5.306053507202384]
本稿では,3次元ポーズから2次元ポーズへの分布のマッピングを学習するために,再投影ネットワークを用いた3次元ポーズ推定のためのGANモデルを提案する。
典型的なキネマティック連鎖空間(KCS)行列に着想を得て、重み付きKCS行列を導入し、関節角度と骨長の制約を課す判別器の入力の1つとする。
論文 参考訳(メタデータ) (2021-06-08T12:11:56Z) - A hybrid classification-regression approach for 3D hand pose estimation
using graph convolutional networks [1.0152838128195467]
目的ごとの関係制約を学習する2段階のGCNベースのフレームワークを提案する。
第1フェーズは2D/3D空間を量子化し、その局所性に基づいて関節を2D/3Dブロックに分類する。
第2段階ではGCNベースのモジュールを使用し、隣り合う適応アルゴリズムを用いて関節関係を決定する。
論文 参考訳(メタデータ) (2021-05-23T10:09:10Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z) - Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View
Geometry [62.29762409558553]
マルチパーソナライズされた3次元ポーズ推定手法における特徴マッチングと深さ推定のコアは、エピポーラ制約である。
スパサーの群衆シーンにおけるこの定式化の良好なパフォーマンスにもかかわらず、その効果はより密集した群衆の状況下でしばしば挑戦される。
本稿では,マルチパーソン3次元ポーズ推定式から脱却し,群衆ポーズ推定として再編成する。
論文 参考訳(メタデータ) (2020-07-21T17:59:36Z) - Monocular Human Pose and Shape Reconstruction using Part Differentiable
Rendering [53.16864661460889]
近年の研究では、3次元基底真理によって教師されるディープニューラルネットワークを介してパラメトリックモデルを直接推定する回帰に基づく手法が成功している。
本稿では,ボディセグメンテーションを重要な監視対象として紹介する。
部分分割による再構成を改善するために,部分分割により部分ベースモデルを制御可能な部分レベル微分可能部を提案する。
論文 参考訳(メタデータ) (2020-03-24T14:25:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。