論文の概要: Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis
- arxiv url: http://arxiv.org/abs/2004.04400v1
- Date: Thu, 9 Apr 2020 07:55:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 03:04:23.345216
- Title: Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis
- Title(参考訳): 新規画像合成による自己監督型3次元人物位置推定
- Authors: Jogendra Nath Kundu, Siddharth Seth, Varun Jampani, Mugalodi Rakesh,
R. Venkatesh Babu, Anirban Chakraborty
- Abstract要約: ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
- 参考スコア(独自算出の注目度): 72.34794624243281
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Camera captured human pose is an outcome of several sources of variation.
Performance of supervised 3D pose estimation approaches comes at the cost of
dispensing with variations, such as shape and appearance, that may be useful
for solving other related tasks. As a result, the learned model not only
inculcates task-bias but also dataset-bias because of its strong reliance on
the annotated samples, which also holds true for weakly-supervised models.
Acknowledging this, we propose a self-supervised learning framework to
disentangle such variations from unlabeled video frames. We leverage the prior
knowledge on human skeleton and poses in the form of a single part-based 2D
puppet model, human pose articulation constraints, and a set of unpaired 3D
poses. Our differentiable formalization, bridging the representation gap
between the 3D pose and spatial part maps, not only facilitates discovery of
interpretable pose disentanglement but also allows us to operate on videos with
diverse camera movements. Qualitative results on unseen in-the-wild datasets
establish our superior generalization across multiple tasks beyond the primary
tasks of 3D pose estimation and part segmentation. Furthermore, we demonstrate
state-of-the-art weakly-supervised 3D pose estimation performance on both
Human3.6M and MPI-INF-3DHP datasets.
- Abstract(参考訳): カメラが捉えた人間のポーズは、いくつかの変化源の結果である。
教師付き3次元ポーズ推定手法の性能は、他の関連するタスクを解決するのに役立つ形状や外観などのバリエーションを不要にするコストがかかる。
結果として、学習されたモデルはタスクバイアスだけでなく、注釈付きサンプルに依存しており、弱い教師付きモデルにも当てはまります。
そこで本稿では,ラベルのないビデオフレームからこのようなバリエーションを分離する自己教師型学習フレームワークを提案する。
我々は、人間の骨格に関する以前の知識を活用し、単一のパートベースの2Dパペットモデル、人間のポーズの調音制約、不対の3Dポーズのセットの形式でポーズする。
我々の微分可能な形式化は、3Dポーズと空間部分マップの表現ギャップを埋めるだけでなく、解釈可能なポーズのゆがみの発見を促進するだけでなく、多様なカメラの動きを持つビデオでも操作できる。
in-the-wildデータセットの定性的な結果は、3dポーズ推定と部分セグメンテーションのプライマリタスクを超えて、複数のタスクにまたがる優れた一般化を確立します。
さらに,Human3.6MとMPI-INF-3DHPのデータセットを用いて,最先端の3Dポーズ推定性能を示す。
関連論文リスト
- ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [54.86887812687023]
ほとんどの3D-HPE法は回帰モデルに依存しており、入力と出力の1対1のマッピングを前提としている。
提案するManiPoseは,2次元入力毎に複数の候補3次元ポーズを提案可能な,新しい多様体制約型マルチハイポテーシスモデルである。
従来のマルチハイブリッドアプローチとは異なり、我々のソリューションは完全に教師付きであり、複雑な生成モデルに依存しない。
論文 参考訳(メタデータ) (2023-12-11T13:50:10Z) - Self-supervised 3D Human Pose Estimation from a Single Image [1.0878040851638]
本研究では,1枚の画像から3次元人体ポーズを予測する自己教師型手法を提案する。
予測ネットワークは、典型的なポーズの人物と、未ペアの2Dポーズのセットを描写した未ラベル画像のデータセットから訓練される。
論文 参考訳(メタデータ) (2023-04-05T10:26:21Z) - MetaPose: Fast 3D Pose from Multiple Views without 3D Supervision [72.5863451123577]
正確な3Dポーズとカメラ推定が可能なニューラルモデルをトレーニングする方法を示す。
本手法は,古典的バンドル調整と弱教師付き単分子3Dベースラインの両方に優れる。
論文 参考訳(メタデータ) (2021-08-10T18:39:56Z) - View-Invariant, Occlusion-Robust Probabilistic Embedding for Human Pose [36.384824115033304]
本研究では,3次元のポーズを明示的に予測することなく,2次元のボディジョイントキーポイントからコンパクトなビュー不変埋め込み空間を学習する手法を提案する。
実験の結果,異なるカメラビューで類似のポーズを検索すると,埋め込みモデルの精度が向上することがわかった。
論文 参考訳(メタデータ) (2020-10-23T17:58:35Z) - Unsupervised Cross-Modal Alignment for Multi-Person 3D Pose Estimation [52.94078950641959]
マルチパーソン・ヒューマン・ポーズ推定のためのデプロイフレンドリーで高速なボトムアップ・フレームワークを提案する。
我々は,人物の位置を対応する3Dポーズ表現と統一する,多人数の3Dポーズのニューラル表現を採用する。
ペア化された2Dまたは3Dポーズアノテーションが利用できない実用的な配置パラダイムを提案する。
論文 参考訳(メタデータ) (2020-08-04T07:54:25Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z) - Weakly-Supervised 3D Human Pose Learning via Multi-view Images in the
Wild [101.70320427145388]
本稿では、3Dアノテーションを必要としない弱教師付きアプローチを提案し、ラベルのないマルチビューデータから3Dポーズを推定する。
提案手法を2つの大規模データセット上で評価する。
論文 参考訳(メタデータ) (2020-03-17T08:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。