Fugu-MT 論文翻訳(概要): Context Modeling in 3D Human Pose Estimation: A Unified Perspective

論文の概要: Context Modeling in 3D Human Pose Estimation: A Unified Perspective

arxiv url: http://arxiv.org/abs/2103.15507v2
Date: Tue, 30 Mar 2021 08:56:32 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-31 11:59:55.467861
Title: Context Modeling in 3D Human Pose Estimation: A Unified Perspective
Title（参考訳）: 3次元人文推定におけるコンテキストモデリング:統一的視点
Authors: Xiaoxuan Ma, Jiajun Su, Chunyu Wang, Hai Ci and Yizhou Wang
Abstract要約: 本稿では, PSM と GNN が特殊ケースである文脈モデリングの一般公式を提案する。両手法を比較して, GNN の終末訓練法と PSM の辺縁長制約が相補的要因であることを確認した。深いネットワークでソフトな手足長の制約を強制できる注意メカニズムに基づいたContextPoseを提案します。
参考スコア（独自算出の注目度）: 27.36648656930247
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Estimating 3D human pose from a single image suffers from severe ambiguity since multiple 3D joint configurations may have the same 2D projection. The state-of-the-art methods often rely on context modeling methods such as pictorial structure model (PSM) or graph neural network (GNN) to reduce ambiguity. However, there is no study that rigorously compares them side by side. So we first present a general formula for context modeling in which both PSM and GNN are its special cases. By comparing the two methods, we found that the end-to-end training scheme in GNN and the limb length constraints in PSM are two complementary factors to improve results. To combine their advantages, we propose ContextPose based on attention mechanism that allows enforcing soft limb length constraints in a deep network. The approach effectively reduces the chance of getting absurd 3D pose estimates with incorrect limb lengths and achieves state-of-the-art results on two benchmark datasets. More importantly, the introduction of limb length constraints into deep networks enables the approach to achieve much better generalization performance.
Abstract（参考訳）: 一つの画像から3Dのポーズを推定することは、複数の3D関節構成が同じ2D投影を持つため、深刻な曖昧さに悩まされる。最先端の手法は、曖昧さを減らすために、画像構造モデル(PSM)やグラフニューラルネットワーク(GNN)のようなコンテキストモデリング手法に依存することが多い。しかし、厳格に並べて比較する研究は行われていない。そこで、まず、PSMとGNNの両方が特殊なケースであるコンテキストモデリングの一般的な公式を示す。両手法を比較して, GNN の終末訓練法と PSM の辺縁長制約が相補的要因であることを確認した。これらの利点を組み合わせるために,深層ネットワークにおける軟部肢長制約を強制する注意機構に基づくContextPoseを提案する。このアプローチは、不条理な3dポーズ推定を不正確な四肢の長さで得る機会を効果的に削減し、2つのベンチマークデータセットで最先端の結果を得る。さらに、深層ネットワークに四肢長制約を導入することにより、より優れた一般化性能を実現することができる。

関連論文リスト

Adapting Human Mesh Recovery with Vision-Language Feedback [17.253535686451897]
視覚言語モデルを用いて対話的な身体部分記述を生成する。我々はテキストエンコーダとポーズVQ-VAEをトレーニングし、テキストを共有潜在空間内のボディポーズにアライメントする。モデルは正確な3D知覚と画像の一貫性を持ったポーズを生成することができる。
論文参考訳（メタデータ） (2025-02-06T07:42:00Z)
ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [54.86887812687023]
ほとんどの3D-HPE法は回帰モデルに依存しており、入力と出力の1対1のマッピングを前提としている。提案するManiPoseは,2次元入力毎に複数の候補3次元ポーズを提案可能な,新しい多様体制約型マルチハイポテーシスモデルである。従来のマルチハイブリッドアプローチとは異なり、我々のソリューションは完全に教師付きであり、複雑な生成モデルに依存しない。
論文参考訳（メタデータ） (2023-12-11T13:50:10Z)
Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文参考訳（メタデータ） (2022-03-29T07:14:58Z)
PONet: Robust 3D Human Pose Estimation via Learning Orientations Only [116.1502793612437]
本稿では,学習向きのみを用いて3次元ポーズを頑健に推定できる新しいPose Orientation Net(PONet)を提案する。 PONetは、局所的な画像証拠を利用して、これらの手足の3D方向を推定し、3Dポーズを復元する。我々は,Human3.6M,MPII,MPI-INF-3DHP,3DPWを含む複数のデータセットについて評価を行った。
論文参考訳（メタデータ） (2021-12-21T12:48:48Z)
3D Human Pose Estimation Based on 2D-3D Consistency with Synchronized Adversarial Training [5.306053507202384]
本稿では,3次元ポーズから2次元ポーズへの分布のマッピングを学習するために,再投影ネットワークを用いた3次元ポーズ推定のためのGANモデルを提案する。典型的なキネマティック連鎖空間(KCS)行列に着想を得て、重み付きKCS行列を導入し、関節角度と骨長の制約を課す判別器の入力の1つとする。
論文参考訳（メタデータ） (2021-06-08T12:11:56Z)
A hybrid classification-regression approach for 3D hand pose estimation using graph convolutional networks [1.0152838128195467]
目的ごとの関係制約を学習する2段階のGCNベースのフレームワークを提案する。第1フェーズは2D/3D空間を量子化し、その局所性に基づいて関節を2D/3Dブロックに分類する。第2段階ではGCNベースのモジュールを使用し、隣り合う適応アルゴリズムを用いて関節関係を決定する。
論文参考訳（メタデータ） (2021-05-23T10:09:10Z)
3D Multi-bodies: Fitting Sets of Plausible 3D Human Models to Ambiguous Image Data [77.57798334776353]
単眼・部分閉塞視からヒトの高密度3次元再構成を実現することの問題点を考察する。身体の形状やポーズをパラメータ化することで、あいまいさをより効果的にモデル化できることを示唆する。提案手法は, 3次元人間の標準ベンチマークにおいて, あいまいなポーズ回復において, 代替手法よりも優れていることを示す。
論文参考訳（メタデータ） (2020-11-02T13:55:31Z)
Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。本稿では,D2S(Deep-to-scale)投影法を提案する。
論文参考訳（メタデータ） (2020-10-27T03:31:35Z)
Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View Geometry [62.29762409558553]
マルチパーソナライズされた3次元ポーズ推定手法における特徴マッチングと深さ推定のコアは、エピポーラ制約である。スパサーの群衆シーンにおけるこの定式化の良好なパフォーマンスにもかかわらず、その効果はより密集した群衆の状況下でしばしば挑戦される。本稿では,マルチパーソン3次元ポーズ推定式から脱却し,群衆ポーズ推定として再編成する。
論文参考訳（メタデータ） (2020-07-21T17:59:36Z)
Monocular Human Pose and Shape Reconstruction using Part Differentiable Rendering [53.16864661460889]
近年の研究では、3次元基底真理によって教師されるディープニューラルネットワークを介してパラメトリックモデルを直接推定する回帰に基づく手法が成功している。本稿では,ボディセグメンテーションを重要な監視対象として紹介する。部分分割による再構成を改善するために,部分分割により部分ベースモデルを制御可能な部分レベル微分可能部を提案する。
論文参考訳（メタデータ） (2020-03-24T14:25:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。