論文の概要: FastDDHPose: Towards Unified, Efficient, and Disentangled 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2512.14162v1
- Date: Tue, 16 Dec 2025 07:47:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.62738
- Title: FastDDHPose: Towards Unified, Efficient, and Disentangled 3D Human Pose Estimation
- Title(参考訳): FastDDHPose: 統一された、効率的で、絡み合った3次元人物の姿勢推定を目指して
- Authors: Qingyuan Cai, Linxin Zhang, Xuecai Hu, Saihui Hou, Yongzhen Huang,
- Abstract要約: 我々は,新しい手法の迅速な再現と柔軟な開発を容易にするモジュール型フレームワークであるFast3DHPEを提案する。
トレーニングプロトコルと評価プロトコルの標準化により、Fast3DHPEは3次元のポーズ推定手法を公平に比較することができる。
本稿では,拡散型3次元人物姿勢推定法であるFastDDHPoseを紹介する。
- 参考スコア(独自算出の注目度): 32.94049816382114
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent approaches for monocular 3D human pose estimation (3D HPE) have achieved leading performance by directly regressing 3D poses from 2D keypoint sequences. Despite the rapid progress in 3D HPE, existing methods are typically trained and evaluated under disparate frameworks, lacking a unified framework for fair comparison. To address these limitations, we propose Fast3DHPE, a modular framework that facilitates rapid reproduction and flexible development of new methods. By standardizing training and evaluation protocols, Fast3DHPE enables fair comparison across 3D human pose estimation methods while significantly improving training efficiency. Within this framework, we introduce FastDDHPose, a Disentangled Diffusion-based 3D Human Pose Estimation method which leverages the strong latent distribution modeling capability of diffusion models to explicitly model the distributions of bone length and bone direction while avoiding further amplification of hierarchical error accumulation. Moreover, we design an efficient Kinematic-Hierarchical Spatial and Temporal Denoiser that encourages the model to focus on kinematic joint hierarchies while avoiding unnecessary modeling of overly complex joint topologies. Extensive experiments on Human3.6M and MPI-INF-3DHP show that the Fast3DHPE framework enables fair comparison of all methods while significantly improving training efficiency. Within this unified framework, FastDDHPose achieves state-of-the-art performance with strong generalization and robustness in in-the-wild scenarios. The framework and models will be released at: https://github.com/Andyen512/Fast3DHPE
- Abstract(参考訳): 近年のモノラルな3次元人間のポーズ推定(3D HPE)は、2Dキーポイントシーケンスから直接3Dポーズを退避させることで先進的なパフォーマンスを実現している。
3D HPEの急速な進歩にもかかわらず、既存の手法は通常、異なるフレームワークの下で訓練され評価され、公正な比較のための統一されたフレームワークが欠如している。
これらの制約に対処するため,新しい手法の迅速な再現と柔軟な開発を容易にするモジュール型フレームワークであるFast3DHPEを提案する。
トレーニングプロトコルと評価プロトコルの標準化により、Fast3DHPEは、トレーニング効率を大幅に向上しつつ、3次元のポーズ推定手法を公平に比較することができる。
本フレームワークでは,骨長と骨方向の分布を明示的にモデル化し,階層的誤差蓄積のさらなる増幅を回避しつつ,拡散モデルの強力な潜伏分布モデリング機能を活用する,拡散拡散に基づく3次元人文推定手法であるFastDDHPoseを導入する。
さらに,過度に複雑な関節トポロジの不要なモデリングを回避しつつ,運動的関節階層に焦点を絞ることを奨励する効率的な運動的・階層的空間的・時間的デノイザを設計する。
Human3.6MとMPI-INF-3DHPの大規模な実験により、Fast3DHPEフレームワークは訓練効率を大幅に向上しつつ、全ての手法を公平に比較できることを示した。
この統合フレームワーク内では、FastDDHPoseは高度な一般化と堅牢性を備えた最先端のパフォーマンスを実現している。
フレームワークとモデルは次の通りリリースされる。 https://github.com/Andyen512/Fast3DHPE
関連論文リスト
- Efficient Diffusion-Based 3D Human Pose Estimation with Hierarchical Temporal Pruning [34.116532190562815]
本稿では,時間計画(HTP)戦略を用いた効率的な拡散に基づく3次元人文推定フレームワークを提案する。
HTPは、フレームレベルとセマンティックレベルの両方にわたって冗長なポーズトークンを持ち、クリティカルモーションダイナミクスを保存する。
Human3.6MとMPI-INF-3DHPの実験では、HTPはトレーニングMACを38.5%減らし、推論MACを56.8%減らし、従来の拡散ベースの手法と比較して推論速度を平均81.1%改善している。
論文 参考訳(メタデータ) (2025-08-29T07:08:07Z) - HyperDiff: Hypergraph Guided Diffusion Model for 3D Human Pose Estimation [15.321095223060768]
本稿では,HyperGCNと拡散モデルを統合した新しい3次元ポーズ推定手法HyperDiffを提案する。
結果はHyperDiffがHuman3.6MとMPI-INF-3DHPデータセット上で最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-08-20T05:03:55Z) - UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - DiffHPE: Robust, Coherent 3D Human Pose Lifting with Diffusion [54.0238087499699]
拡散モデルにより,人間のポーズ推定精度,ロバスト性,コヒーレンス性が向上することを示す。
3D-HPEにおける拡散モデルを利用する新しい戦略であるDiffHPEを紹介する。
以上の結果から, 独立拡散モデルにより, 予測可能な性能が得られる一方で, 教師付きモデルと組み合わせて精度が向上することが示唆された。
論文 参考訳(メタデータ) (2023-09-04T12:54:10Z) - Unsupervised 3D Pose Estimation with Non-Rigid Structure-from-Motion
Modeling [83.76377808476039]
本研究では,人間のポーズの変形をモデル化し,それに伴う拡散に基づく動きを事前に設計する手法を提案する。
動作中の3次元人間の骨格を復元する作業は3次元基準骨格の推定に分割する。
混合時空間NASfMformerを用いて、各フレームの3次元基準骨格と骨格変形を2次元観測シーケンスから同時に推定する。
論文 参考訳(メタデータ) (2023-08-18T16:41:57Z) - Learned Vertex Descent: A New Direction for 3D Human Model Fitting [64.04726230507258]
画像やスキャンに適合する3次元人体モデルのための新しい最適化手法を提案する。
われわれのアプローチは、非常に異なる体型を持つ服を着た人々の基盤となる身体を捉えることができ、最先端技術と比べて大きな改善を達成できる。
LVDはまた、人間と手の3次元モデル適合にも適用でき、よりシンプルで高速な方法でSOTAに大きな改善が示される。
論文 参考訳(メタデータ) (2022-05-12T17:55:51Z) - Distribution-Aware Single-Stage Models for Multi-Person 3D Pose
Estimation [29.430404703883084]
本稿では,多人数の3Dポーズ推定問題に対処する新しいDASモデルを提案する。
提案するDASモデルでは,3次元カメラ空間における人物位置と人体関節をワンパスで同時に位置決めする。
CMU Panoptic と MuPoTS-3D のベンチマークに関する総合的な実験は、提案したDASモデルの優れた効率を実証している。
論文 参考訳(メタデータ) (2022-03-15T07:30:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。