論文の概要: Weakly Supervised Generative Network for Multiple 3D Human Pose
Hypotheses
- arxiv url: http://arxiv.org/abs/2008.05770v1
- Date: Thu, 13 Aug 2020 09:26:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 23:21:01.561446
- Title: Weakly Supervised Generative Network for Multiple 3D Human Pose
Hypotheses
- Title(参考訳): 複数の3次元ポーズ仮説に対する弱教師付き生成ネットワーク
- Authors: Chen Li and Gim Hee Lee
- Abstract要約: 単一画像からの3次元ポーズ推定は、欠落した深さのあいまいさに起因する逆問題である。
逆問題に対処するために,弱い教師付き深層生成ネットワークを提案する。
- 参考スコア(独自算出の注目度): 74.48263583706712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D human pose estimation from a single image is an inverse problem due to the
inherent ambiguity of the missing depth. Several previous works addressed the
inverse problem by generating multiple hypotheses. However, these works are
strongly supervised and require ground truth 2D-to-3D correspondences which can
be difficult to obtain. In this paper, we propose a weakly supervised deep
generative network to address the inverse problem and circumvent the need for
ground truth 2D-to-3D correspondences. To this end, we design our network to
model a proposal distribution which we use to approximate the unknown
multi-modal target posterior distribution. We achieve the approximation by
minimizing the KL divergence between the proposal and target distributions, and
this leads to a 2D reprojection error and a prior loss term that can be weakly
supervised. Furthermore, we determine the most probable solution as the
conditional mode of the samples using the mean-shift algorithm. We evaluate our
method on three benchmark datasets -- Human3.6M, MPII and MPI-INF-3DHP.
Experimental results show that our approach is capable of generating multiple
feasible hypotheses and achieves state-of-the-art results compared to existing
weakly supervised approaches. Our source code is available at the project
website.
- Abstract(参考訳): 単一画像からの3次元ポーズ推定は、欠落した深さのあいまいさに起因する逆問題である。
いくつかの先行研究は、複数の仮説を生成して逆問題に対処した。
しかし、これらの研究は強く監督されており、入手が困難な2D-to-3D対応を必要とする。
本稿では,逆問題に対処し,基底真理2dから3d対応の必要性を回避するために,弱い教師付き深層生成ネットワークを提案する。
そこで本研究では,未知のマルチモーダルターゲット後方分布を近似する提案分布をモデル化するために,ネットワークを設計する。
提案手法と目標分布のKL分散を最小化することにより近似を達成し、2次元再投影誤差と、弱制御が可能な事前損失項を導出する。
さらに, 平均シフトアルゴリズムを用いて, 最も可能性の高い解を試料の条件モードとして決定する。
我々は,Human3.6M,MPII,MPI-INF-3DHPの3つのベンチマークデータセットを用いて評価を行った。
実験の結果,提案手法は複数の実現可能な仮説を生成でき,既存の弱い教師付きアプローチと比較して最先端の結果が得られることがわかった。
ソースコードはプロジェクトのWebサイトから入手可能です。
関連論文リスト
- Utilizing Uncertainty in 2D Pose Detectors for Probabilistic 3D Human Mesh Recovery [23.473909489868454]
確率論的アプローチは 有望な3次元メッシュ上の分布を学習する
この目的関数だけでは、全分布を捉えるのに十分ではないことを示す。
トレーニング中,被験者のセグメンテーションマスクを利用することで,不正なサンプルの数を著しく削減できることを実証した。
論文 参考訳(メタデータ) (2024-11-25T11:13:12Z) - X as Supervision: Contending with Depth Ambiguity in Unsupervised Monocular 3D Pose Estimation [12.765995624408557]
マルチハイポテーシス検出と複数の調整済みプレテキストタスクを特徴とする教師なしフレームワークを提案する。
ローカルウィンドウ内のヒートマップから複数の仮説を抽出し、マルチソリューション問題を効果的に管理する。
プリテキストタスクは、SMPLモデルからの3D人間の事前情報を利用して、ポーズ推定の解空間を規則化し、それを3D人間の構造を経験的分布と整合させる。
論文 参考訳(メタデータ) (2024-11-20T04:18:11Z) - Diffusion-Based 3D Human Pose Estimation with Multi-Hypothesis
Aggregation [64.874000550443]
ジョイントワイズ・リジェクション・ベース・マルチハイブリッド・アグリゲーション(JPMA)を用いた拡散型3次元ポス推定法を提案する。
提案したJPMAは,D3DPが生成する複数の仮説を1つの3次元ポーズにまとめて実用的に利用する。
提案手法は, 最先端の決定論的アプローチと確率論的アプローチをそれぞれ1.5%, 8.9%上回った。
論文 参考訳(メタデータ) (2023-03-21T04:00:47Z) - DiffuPose: Monocular 3D Human Pose Estimation via Denoising Diffusion
Probabilistic Model [25.223801390996435]
本稿では,1つの2次元キーポイント検出から3次元ポーズを再構築することに焦点を当てた。
我々は,市販の2D検出器から多種多様な3Dポーズを効果的にサンプリングするための,拡散に基づく新しいフレームワークを構築した。
我々は,広く採用されているHuman3.6MとHumanEva-Iデータセットについて評価を行った。
論文 参考訳(メタデータ) (2022-12-06T07:22:20Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Multi-initialization Optimization Network for Accurate 3D Human Pose and
Shape Estimation [75.44912541912252]
我々はMulti-Initialization Optimization Network(MION)という3段階のフレームワークを提案する。
第1段階では,入力サンプルの2次元キーポイントに適合する粗い3次元再構成候補を戦略的に選択する。
第2段階では, メッシュ改質トランス (MRT) を設計し, 自己保持機構を用いて粗い再構成結果をそれぞれ洗練する。
最後に,RGB画像の視覚的証拠が与えられた3次元再構成と一致するかどうかを評価することで,複数の候補から最高の結果を得るために,一貫性推定ネットワーク(CEN)を提案する。
論文 参考訳(メタデータ) (2021-12-24T02:43:58Z) - Probabilistic Monocular 3D Human Pose Estimation with Normalizing Flows [24.0966076588569]
本稿では,不明瞭な逆2D-to-3D問題を解くために,決定論的3D-to-2Dマッピングを利用する正規化フローベース手法を提案する。
我々は、Human3.6MとMPI-INF-3DHPの2つのベンチマークデータセットに対するアプローチを評価し、ほとんどの指標において同等の手法を上回りました。
論文 参考訳(メタデータ) (2021-07-29T07:33:14Z) - 3D Multi-bodies: Fitting Sets of Plausible 3D Human Models to Ambiguous
Image Data [77.57798334776353]
単眼・部分閉塞視からヒトの高密度3次元再構成を実現することの問題点を考察する。
身体の形状やポーズをパラメータ化することで、あいまいさをより効果的にモデル化できることを示唆する。
提案手法は, 3次元人間の標準ベンチマークにおいて, あいまいなポーズ回復において, 代替手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-02T13:55:31Z) - Coherent Reconstruction of Multiple Humans from a Single Image [68.3319089392548]
本研究では,1枚の画像から多人数の3Dポーズ推定を行う問題に対処する。
この問題のトップダウン設定における典型的な回帰アプローチは、まずすべての人間を検出し、それぞれを独立して再構築する。
我々のゴールは、これらの問題を回避し、現場のすべての人間のコヒーレントな3D再構成を生成するために学習する単一のネットワークをトレーニングすることである。
論文 参考訳(メタデータ) (2020-06-15T17:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。