論文の概要: EVOPOSE: A Recursive Transformer For 3D Human Pose Estimation With
Kinematic Structure Priors
- arxiv url: http://arxiv.org/abs/2306.09615v1
- Date: Fri, 16 Jun 2023 04:09:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-19 15:10:10.273066
- Title: EVOPOSE: A Recursive Transformer For 3D Human Pose Estimation With
Kinematic Structure Priors
- Title(参考訳): EVOPOSE:キネマティック構造を用いた3次元人物位置推定のための再帰変換器
- Authors: Yaqi Zhang, Yan Lu, Bin Liu, Zhiwei Zhao, Qi Chu, Nenghai Yu
- Abstract要約: 本研究では,3次元ポーズ推定を効果的に行うために,トランスフォーマーを用いたモデルEvoPoseを提案する。
構造的優先表現(Structure Priors Representation, SPR)モジュールは、人体パターンの豊富な構造的特徴として、人間の先行を表現している。
推定結果を利用して3Dポーズ出力にRecursive Refinement(RR)モジュールを印加し、同時に人間を注入する。
- 参考スコア(独自算出の注目度): 72.33767389878473
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Transformer is popular in recent 3D human pose estimation, which utilizes
long-term modeling to lift 2D keypoints into the 3D space. However, current
transformer-based methods do not fully exploit the prior knowledge of the human
skeleton provided by the kinematic structure. In this paper, we propose a novel
transformer-based model EvoPose to introduce the human body prior knowledge for
3D human pose estimation effectively. Specifically, a Structural Priors
Representation (SPR) module represents human priors as structural features
carrying rich body patterns, e.g. joint relationships. The structural features
are interacted with 2D pose sequences and help the model to achieve more
informative spatiotemporal features. Moreover, a Recursive Refinement (RR)
module is applied to refine the 3D pose outputs by utilizing estimated results
and further injects human priors simultaneously. Extensive experiments
demonstrate the effectiveness of EvoPose which achieves a new state of the art
on two most popular benchmarks, Human3.6M and MPI-INF-3DHP.
- Abstract(参考訳): トランスフォーマーは、3D空間に2Dキーポイントを持ち上げるために長期モデリングを利用する最近の3D人間のポーズ推定で人気がある。
しかし、現在のトランスフォーマーに基づく手法では、キネマティック構造によって提供される人間の骨格の事前知識を十分に活用していない。
本稿では,3次元ポーズ推定のための人体事前知識を効果的に導入するためのトランスフォーマーモデルを提案する。
具体的には、構造優先表現(Structure Priors Representation, SPR)モジュールは、例えば関節関係のようなリッチな身体パターンを持つ構造的特徴として、人間の先行を表現している。
構造的特徴は2次元ポーズシーケンスと相互作用し、モデルがより情報的な時空間的特徴を達成するのに役立つ。
さらに、推定結果を利用して3次元ポーズ出力を洗練するために再帰的再閉じ込め(RR)モジュールを適用し、同時にヒトの事前を注入する。
広範な実験は、最も人気のある2つのベンチマーク、human3.6mとmpi-inf-3dhpで新しい状態を達成するevoposeの有効性を示す。
関連論文リスト
- Graph and Skipped Transformer: Exploiting Spatial and Temporal Modeling Capacities for Efficient 3D Human Pose Estimation [36.93661496405653]
我々は、簡潔なグラフとSkipped Transformerアーキテクチャを用いて、Transformer-temporal情報を活用するためのグローバルなアプローチを採っている。
具体的には、3Dポーズの段階では、粗粒の体部が展開され、完全なデータ駆動適応モデルが構築される。
実験はHuman3.6M、MPI-INF-3DHP、Human-Evaベンチマークで行われた。
論文 参考訳(メタデータ) (2024-07-03T10:42:09Z) - Unsupervised 3D Pose Estimation with Non-Rigid Structure-from-Motion
Modeling [83.76377808476039]
本研究では,人間のポーズの変形をモデル化し,それに伴う拡散に基づく動きを事前に設計する手法を提案する。
動作中の3次元人間の骨格を復元する作業は3次元基準骨格の推定に分割する。
混合時空間NASfMformerを用いて、各フレームの3次元基準骨格と骨格変形を2次元観測シーケンスから同時に推定する。
論文 参考訳(メタデータ) (2023-08-18T16:41:57Z) - Get3DHuman: Lifting StyleGAN-Human into a 3D Generative Model using
Pixel-aligned Reconstruction Priors [56.192682114114724]
Get3DHumanは、生成された結果のリアリズムと多様性を大幅に向上させる、新しい3Dヒューマンフレームワークである。
我々のキーとなる観察は、この3Dジェネレータは、人間の2Dジェネレータと3Dコンストラクタを通して学んだ、人間関係の先行技術から利益を得ることができるということだ。
論文 参考訳(メタデータ) (2023-02-02T15:37:46Z) - Advanced Baseline for 3D Human Pose Estimation: A Two-Stage Approach [1.52292571922932]
本稿では,2段階法における2次元から3次元への昇降過程に着目し,より高度な3次元ポーズ推定ベースラインモデルを提案する。
私たちの改善点は、機械学習モデルと複数のパラメータの最適化と、トレーニングモデルへの重み付き損失の導入です。
論文 参考訳(メタデータ) (2022-12-21T20:31:39Z) - 3D Pose Estimation and Future Motion Prediction from 2D Images [26.28886209268217]
本稿では,3次元人物のポーズを推定し,RGB画像列から将来の3次元動作を予測するという,高相関な課題に共同で取り組むことを検討する。
リー代数のポーズ表現に基づいて、人間の運動キネマティクスを自然に保存する新しい自己投射機構が提案されている。
論文 参考訳(メタデータ) (2021-11-26T01:02:00Z) - THUNDR: Transformer-based 3D HUmaN Reconstruction with Markers [67.8628917474705]
THUNDRは、人の3Dポーズと形状を再構築するトランスフォーマーベースのディープニューラルネットワーク手法である。
完全教師付きモデルと自己教師型モデルの両方に対して,Human3.6Mと3DPWの最先端結果を示す。
野生で収集された難易度の高い人間のポーズに対して, 非常に堅固な3次元再構成性能を観察した。
論文 参考訳(メタデータ) (2021-06-17T09:09:24Z) - 3D Human Pose Estimation with Spatial and Temporal Transformers [59.433208652418976]
PoseFormerは、3D人間のポーズ推定のための純粋にトランスフォーマーベースのアプローチです。
近年の視覚変換器の発展に触発されて,空間時間変換器構造を設計する。
提案手法を2つの人気ベンチマークと標準ベンチマークで定量的に定性的に評価する。
論文 参考訳(メタデータ) (2021-03-18T18:14:37Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。