論文の概要: Weakly Supervised 3D Human Pose and Shape Reconstruction with
Normalizing Flows
- arxiv url: http://arxiv.org/abs/2003.10350v2
- Date: Sat, 22 Aug 2020 14:46:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 00:25:47.401209
- Title: Weakly Supervised 3D Human Pose and Shape Reconstruction with
Normalizing Flows
- Title(参考訳): 正規化流を用いた3次元人物姿勢と形状再構成
- Authors: Andrei Zanfir, Eduard Gabriel Bazavan, Hongyi Xu, Bill Freeman, Rahul
Sukthankar and Cristian Sminchisescu
- Abstract要約: 実世界の画像やビデオのトレーニングと優れた一般化を支援する半教師付き自己教師型モデルを提案する。
我々の定式化は、運動論的潜在正規化フロー表現と力学、および微分可能セマンティックボディ部分アライメント損失関数に基づく。
CMU,Human3.6M,3DPW,AMASSといった3Dモーションキャプチャーデータセットを用いた大規模な実験では,提案手法が最先端の手法であることを示す。
- 参考スコア(独自算出の注目度): 43.89097619822221
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular 3D human pose and shape estimation is challenging due to the many
degrees of freedom of the human body and thedifficulty to acquire training data
for large-scale supervised learning in complex visual scenes. In this paper we
present practical semi-supervised and self-supervised models that support
training and good generalization in real-world images and video. Our
formulation is based on kinematic latent normalizing flow representations and
dynamics, as well as differentiable, semantic body part alignment loss
functions that support self-supervised learning. In extensive experiments using
3D motion capture datasets like CMU, Human3.6M, 3DPW, or AMASS, as well as
image repositories like COCO, we show that the proposed methods outperform the
state of the art, supporting the practical construction of an accurate family
of models based on large-scale training with diverse and incompletely labeled
image and video data.
- Abstract(参考訳): 複雑な視覚場面における大規模教師付き学習のための訓練データを取得するため、身体の自由度やディフューチャの多さから、単眼的3次元人間のポーズや形状推定は困難である。
本稿では,実世界の映像と映像の訓練と一般化を支援する実践的な半教師付きモデルと自己教師付きモデルを提案する。
我々の定式化は、運動論的潜在正規化フロー表現と力学、および自己教師付き学習をサポートする意味的身体部分アライメント損失関数に基づく。
CMU,Human3.6M,3DPW,AMASSなどの3DモーションキャプチャデータセットとCOCOなどのイメージリポジトリを用いた広範な実験において,提案手法は,多種多様かつ不完全なラベル付き画像と映像データを用いた大規模トレーニングに基づく,正確なモデルのファミリの構築を支援するとともに,技術状況よりも優れていることを示す。
関連論文リスト
- Champ: Controllable and Consistent Human Image Animation with 3D Parametric Guidance [25.346255905155424]
本稿では,潜伏拡散フレームワーク内での3次元人間のパラメトリックモデルを活用することで,人間の画像アニメーションの方法論を提案する。
人間の3次元パラメトリックモデルを動作誘導として表現することにより、基準画像と音源映像の動きの間に人体のパラメトリック形状アライメントを行うことができる。
提案手法は,提案した組込みデータセットに対して,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-03-21T18:52:58Z) - LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human
Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。
完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。
我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文 参考訳(メタデータ) (2021-11-30T04:10:57Z) - Human Performance Capture from Monocular Video in the Wild [50.34917313325813]
本研究では,挑戦的な身体ポーズを特徴とするモノクロ映像から動的3次元人体形状をキャプチャする手法を提案する。
本手法は,現在開発中の3DPWビデオデータセットにおいて,最先端の手法よりも優れる。
論文 参考訳(メタデータ) (2021-11-29T16:32:41Z) - Self-Supervised Human Depth Estimation from Monocular Videos [99.39414134919117]
人間の深度を推定する従来の方法は、しばしば地上の真実の深度データを用いた教師あり訓練を必要とする。
本稿では,YouTubeビデオの奥行きを知ることなく,自己指導型手法を提案する。
実験により,本手法はより一般化され,野生のデータに対してより優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-05-07T09:45:11Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z) - Weakly-Supervised 3D Human Pose Learning via Multi-view Images in the
Wild [101.70320427145388]
本稿では、3Dアノテーションを必要としない弱教師付きアプローチを提案し、ラベルのないマルチビューデータから3Dポーズを推定する。
提案手法を2つの大規模データセット上で評価する。
論文 参考訳(メタデータ) (2020-03-17T08:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。