論文の概要: Diffusion-based Pose Refinement and Muti-hypothesis Generation for 3D
Human Pose Estimaiton
- arxiv url: http://arxiv.org/abs/2401.04921v1
- Date: Wed, 10 Jan 2024 04:07:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-11 15:28:21.763021
- Title: Diffusion-based Pose Refinement and Muti-hypothesis Generation for 3D
Human Pose Estimaiton
- Title(参考訳): 拡散型ポスリファインメントと3次元ヒトポスエスティマイトンのためのムチヒスリセシス生成
- Authors: Hongbo Kang, Yong Wang, Mengyuan Liu, Doudou Wu, Peng Liu, Xinlin
Yuan, Wenming Yang
- Abstract要約: 従来の3次元人物姿勢推定モデル(3DHPE)は、複数の仮説を生成することで、ポーズの精度を高めることを目的としていた。
ほとんどの仮説は真のポーズから大きく逸脱した。
決定論的モデルと比較すると、確率論的モデルにおける過剰な不確実性は、単一仮説予測においてより弱い性能をもたらす。
本稿では,逆拡散による決定論的モデルの出力を改良する拡散に基づく DRPose というフレームワークを提案する。
- 参考スコア(独自算出の注目度): 27.708016152889787
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous probabilistic models for 3D Human Pose Estimation (3DHPE) aimed to
enhance pose accuracy by generating multiple hypotheses. However, most of the
hypotheses generated deviate substantially from the true pose. Compared to
deterministic models, the excessive uncertainty in probabilistic models leads
to weaker performance in single-hypothesis prediction. To address these two
challenges, we propose a diffusion-based refinement framework called DRPose,
which refines the output of deterministic models by reverse diffusion and
achieves more suitable multi-hypothesis prediction for the current pose
benchmark by multi-step refinement with multiple noises. To this end, we
propose a Scalable Graph Convolution Transformer (SGCT) and a Pose Refinement
Module (PRM) for denoising and refining. Extensive experiments on Human3.6M and
MPI-INF-3DHP datasets demonstrate that our method achieves state-of-the-art
performance on both single and multi-hypothesis 3DHPE. Code is available at
https://github.com/KHB1698/DRPose.
- Abstract(参考訳): 従来の3次元人物姿勢推定モデル(3DHPE)は、複数の仮説を生成することでポーズの精度を高めることを目的としていた。
しかし、ほとんどの仮説は実際のポーズから実質的に逸脱している。
決定論的モデルと比較すると、確率的モデルの過度な不確実性は単一仮説予測の性能を低下させる。
そこで本研究では,この2つの課題を解決するために,逆拡散により決定論的モデルの出力を洗練し,複数のノイズを伴うマルチステップリファインメントにより,現在のポーズベンチマークにおいてより適切なマルチハイポテーゼ予測を実現する,drposeと呼ばれる拡散ベースリファインメントフレームワークを提案する。
そこで本稿では,SGCT (Scalable Graph Convolution Transformer) とPRM (Pose Refinement Module) を提案する。
Human3.6M と MPI-INF-3DHP データセットの大規模な実験により,本手法は単相・多相両方の3DHPEにおける最先端性能を実現することが示された。
コードはhttps://github.com/KHB1698/DRPoseで入手できる。
関連論文リスト
- CHAMP: Conformalized 3D Human Multi-Hypothesis Pose Estimators [20.476154502171696]
CHAMPは2次元キーポイントからシーケンス・ツー・シーケンス・マルチ・ハイプセシスの人間のポーズを学習する新しい方法である。
この結果から, 共形予測フィルタによる仮説に対する単純な平均アグリゲーションを用いることで, 競合する結果が得られることが示唆された。
論文 参考訳(メタデータ) (2024-05-27T02:42:38Z) - Probablistic Restoration with Adaptive Noise Sampling for 3D Human Pose Estimation [2.855838363978158]
3次元ポーズ推定(HPE)の精度とロバスト性は2次元ポーズ検出誤差と2次元から3次元までの不適切な課題によって制限される。
本稿では,任意の軽量な単一仮説モデルと統合可能な確率的復元3Dヒューマンポース推定フレームワーク(PRPose)を提案する。
論文 参考訳(メタデータ) (2024-05-03T14:14:27Z) - ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [54.86887812687023]
ほとんどの3D-HPE法は回帰モデルに依存しており、入力と出力の1対1のマッピングを前提としている。
提案するManiPoseは,2次元入力毎に複数の候補3次元ポーズを提案可能な,新しい多様体制約型マルチハイポテーシスモデルである。
従来のマルチハイブリッドアプローチとは異なり、我々のソリューションは完全に教師付きであり、複雑な生成モデルに依存しない。
論文 参考訳(メタデータ) (2023-12-11T13:50:10Z) - Diffusion-Based 3D Human Pose Estimation with Multi-Hypothesis
Aggregation [64.874000550443]
ジョイントワイズ・リジェクション・ベース・マルチハイブリッド・アグリゲーション(JPMA)を用いた拡散型3次元ポス推定法を提案する。
提案したJPMAは,D3DPが生成する複数の仮説を1つの3次元ポーズにまとめて実用的に利用する。
提案手法は, 最先端の決定論的アプローチと確率論的アプローチをそれぞれ1.5%, 8.9%上回った。
論文 参考訳(メタデータ) (2023-03-21T04:00:47Z) - DiffPose: Multi-hypothesis Human Pose Estimation using Diffusion models [5.908471365011943]
与えられた入力画像に対して複数の仮説を予測する条件拡散モデルであるemphDiffPoseを提案する。
DiffPoseは, 簡単なポーズの多面的ポーズを推定し, 極めてあいまいなポーズに対して大きなマージンで優れることを示す。
論文 参考訳(メタデータ) (2022-11-29T18:55:13Z) - A generic diffusion-based approach for 3D human pose prediction in the
wild [68.00961210467479]
3D人間のポーズ予測、すなわち、過去の観察されたポーズのシーケンスが与えられた後の人間の3Dポーズのシーケンスを予測することは、困難な時間課題である。
本稿では,不完全な要素(予測や観測に関係しない)をノイズとして扱える統一的な定式化法を提案し,それらを認知し,妥当なポーズを予測する条件拡散モデルを提案する。
本研究は,4つの標準データセットについて検討し,現状よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-10-11T17:59:54Z) - Distribution-Aware Single-Stage Models for Multi-Person 3D Pose
Estimation [29.430404703883084]
本稿では,多人数の3Dポーズ推定問題に対処する新しいDASモデルを提案する。
提案するDASモデルでは,3次元カメラ空間における人物位置と人体関節をワンパスで同時に位置決めする。
CMU Panoptic と MuPoTS-3D のベンチマークに関する総合的な実験は、提案したDASモデルの優れた効率を実証している。
論文 参考訳(メタデータ) (2022-03-15T07:30:27Z) - Probabilistic Modeling for Human Mesh Recovery [73.11532990173441]
本稿では,2次元の証拠から3次元の人体復元の問題に焦点を当てた。
我々は,この問題を,入力から3Dポーズの分布へのマッピング学習として再考した。
論文 参考訳(メタデータ) (2021-08-26T17:55:11Z) - 3D Multi-bodies: Fitting Sets of Plausible 3D Human Models to Ambiguous
Image Data [77.57798334776353]
単眼・部分閉塞視からヒトの高密度3次元再構成を実現することの問題点を考察する。
身体の形状やポーズをパラメータ化することで、あいまいさをより効果的にモデル化できることを示唆する。
提案手法は, 3次元人間の標準ベンチマークにおいて, あいまいなポーズ回復において, 代替手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-02T13:55:31Z) - Weakly Supervised Generative Network for Multiple 3D Human Pose
Hypotheses [74.48263583706712]
単一画像からの3次元ポーズ推定は、欠落した深さのあいまいさに起因する逆問題である。
逆問題に対処するために,弱い教師付き深層生成ネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T09:26:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。