論文の概要: Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation
- arxiv url: http://arxiv.org/abs/2006.14107v1
- Date: Wed, 24 Jun 2020 23:56:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 13:08:30.248467
- Title: Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation
- Title(参考訳): 教師なし3次元姿勢推定のための運動構造保存表現
- Authors: Jogendra Nath Kundu, Siddharth Seth, Rahul M V, Mugalodi Rakesh, R.
Venkatesh Babu, Anirban Chakraborty
- Abstract要約: 大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
- 参考スコア(独自算出の注目度): 58.72192168935338
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimation of 3D human pose from monocular image has gained considerable
attention, as a key step to several human-centric applications. However,
generalizability of human pose estimation models developed using supervision on
large-scale in-studio datasets remains questionable, as these models often
perform unsatisfactorily on unseen in-the-wild environments. Though
weakly-supervised models have been proposed to address this shortcoming,
performance of such models relies on availability of paired supervision on some
related tasks, such as 2D pose or multi-view image pairs. In contrast, we
propose a novel kinematic-structure-preserved unsupervised 3D pose estimation
framework, which is not restrained by any paired or unpaired weak supervisions.
Our pose estimation framework relies on a minimal set of prior knowledge that
defines the underlying kinematic 3D structure, such as skeletal joint
connectivity information with bone-length ratios in a fixed canonical scale.
The proposed model employs three consecutive differentiable transformations
named as forward-kinematics, camera-projection and spatial-map transformation.
This design not only acts as a suitable bottleneck stimulating effective pose
disentanglement but also yields interpretable latent pose representations
avoiding training of an explicit latent embedding to pose mapper. Furthermore,
devoid of unstable adversarial setup, we re-utilize the decoder to formalize an
energy-based loss, which enables us to learn from in-the-wild videos, beyond
laboratory settings. Comprehensive experiments demonstrate our state-of-the-art
unsupervised and weakly-supervised pose estimation performance on both
Human3.6M and MPI-INF-3DHP datasets. Qualitative results on unseen environments
further establish our superior generalization ability.
- Abstract(参考訳): モノクル画像からの3次元人間のポーズの推定は、いくつかの人間中心の応用の鍵となるステップとして注目されている。
しかし,大規模in-studioデータセットの監視を用いて開発されたポーズ推定モデルの一般化性は疑問視されている。
この欠点に対処するために弱い教師付きモデルが提案されているが、そのようなモデルの性能は2Dポーズやマルチビューイメージペアのような関連するタスクにおいてペアによる監督が可能であることに依存している。
対照的に, 2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
我々のポーズ推定フレームワークは,骨長比が固定された骨格関節接続情報など,基礎となる3次元構造を定義する,最小限の事前知識に依存している。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
この設計は、効果的なポーズの不連続を刺激する適切なボトルネックとして機能するだけでなく、ポーズマッパーへの明示的な潜在埋め込みの訓練を避けるための解釈可能な潜在的なポーズ表現をもたらす。
さらに、不安定な対向的な設定を欠いたデコーダを再利用してエネルギーベースの損失を形式化し、実験室の設定を超えて、現場のビデオから学ぶことができる。
ヒト3.6MとMPI-INF-3DHPデータセットの両方で、最先端の教師なし、弱教師付きポーズ推定性能を示す。
未知の環境における定性的な結果により、より優れた一般化能力が確立される。
関連論文リスト
- Non-Local Latent Relation Distillation for Self-Adaptive 3D Human Pose
Estimation [63.199549837604444]
3次元ポーズ推定アプローチは、強い(2D/3Dポーズ)または弱い(複数ビューまたは深さ)ペアによる監督の異なる形態を利用する。
我々は3Dポーズ学習を,ラベル付きソースドメインから完全に損なわれないターゲットへのタスク知識の転送を目的とした,自己指導型適応問題として捉えた。
我々は、異なる自己適応設定を評価し、標準ベンチマークで最先端の3Dポーズ推定性能を示す。
論文 参考訳(メタデータ) (2022-04-05T03:52:57Z) - Aligning Silhouette Topology for Self-Adaptive 3D Human Pose Recovery [70.66865453410958]
アーティキュレーション中心の2D/3Dポーズ監視は、既存の多くの人間のポーズ推定技術においてコアトレーニング目標を形成する。
本稿では,ソース学習モデルベース回帰器を適応させるために,シルエット監視のみに依存する新しいフレームワークを提案する。
我々は、トポロジカル・スケルトン表現を生シルエットから切り離すために、一連の畳み込みに優しい空間変換を開発する。
論文 参考訳(メタデータ) (2022-04-04T06:58:15Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Higher-Order Implicit Fairing Networks for 3D Human Pose Estimation [1.1501261942096426]
2次元から3次元のポーズ推定のための初期残差接続を持つ高階グラフ畳み込みフレームワークを提案する。
我々のモデルは、体節間の長距離依存関係を捉えることができる。
2つの標準ベンチマークで行った実験と改善研究は、我々のモデルの有効性を実証した。
論文 参考訳(メタデータ) (2021-11-01T13:48:55Z) - Unsupervised Cross-Modal Alignment for Multi-Person 3D Pose Estimation [52.94078950641959]
マルチパーソン・ヒューマン・ポーズ推定のためのデプロイフレンドリーで高速なボトムアップ・フレームワークを提案する。
我々は,人物の位置を対応する3Dポーズ表現と統一する,多人数の3Dポーズのニューラル表現を採用する。
ペア化された2Dまたは3Dポーズアノテーションが利用できない実用的な配置パラダイムを提案する。
論文 参考訳(メタデータ) (2020-08-04T07:54:25Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。