論文の概要: HyperDiff: Hypergraph Guided Diffusion Model for 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2508.14431v1
- Date: Wed, 20 Aug 2025 05:03:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.347865
- Title: HyperDiff: Hypergraph Guided Diffusion Model for 3D Human Pose Estimation
- Title(参考訳): HyperDiff:3次元人文推定のためのハイパーグラフガイド拡散モデル
- Authors: Bing Han, Yuhua Huang, Pan Gao,
- Abstract要約: 本稿では,HyperGCNと拡散モデルを統合した新しい3次元ポーズ推定手法HyperDiffを提案する。
結果はHyperDiffがHuman3.6MとMPI-INF-3DHPデータセット上で最先端のパフォーマンスを達成することを示した。
- 参考スコア(独自算出の注目度): 15.321095223060768
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular 3D human pose estimation (HPE) often encounters challenges such as depth ambiguity and occlusion during the 2D-to-3D lifting process. Additionally, traditional methods may overlook multi-scale skeleton features when utilizing skeleton structure information, which can negatively impact the accuracy of pose estimation. To address these challenges, this paper introduces a novel 3D pose estimation method, HyperDiff, which integrates diffusion models with HyperGCN. The diffusion model effectively captures data uncertainty, alleviating depth ambiguity and occlusion. Meanwhile, HyperGCN, serving as a denoiser, employs multi-granularity structures to accurately model high-order correlations between joints. This improves the model's denoising capability especially for complex poses. Experimental results demonstrate that HyperDiff achieves state-of-the-art performance on the Human3.6M and MPI-INF-3DHP datasets and can flexibly adapt to varying computational resources to balance performance and efficiency.
- Abstract(参考訳): 単眼の3次元ポーズ推定(HPE)は、2次元から3次元の浮揚過程において、深さのあいまいさや閉塞といった問題に遭遇することが多い。
さらに、従来の方法では、スケルトン構造情報を利用する場合のマルチスケールスケルトンの特徴を見落とし、ポーズ推定の精度に悪影響を及ぼす可能性がある。
これらの課題に対処するために,HyperGCNと拡散モデルを統合した新しい3次元ポーズ推定手法HyperDiffを提案する。
拡散モデルはデータの不確実性を効果的に捉え、深さのあいまいさと閉塞を緩和する。
一方、HyperGCNは、関節間の高次相関を正確にモデル化するために、多粒度構造を用いる。
これにより、特に複雑なポーズに対するモデルの認知能力が向上する。
実験の結果、HyperDiffはHuman3.6MとMPI-INF-3DHPのデータセット上で最先端の性能を達成し、様々な計算資源に柔軟に適応して性能と効率のバランスをとることができた。
関連論文リスト
- HDiffTG: A Lightweight Hybrid Diffusion-Transformer-GCN Architecture for 3D Human Pose Estimation [21.823965837699166]
HDiffTGは、Transformer、Graph Convolutional Network(GCN)、拡散モデルを統一されたフレームワークに統合する、新しい3Dヒューマンポース(3DHCN)メソッドである。
軽量な設計を維持しながら,HDiffTGはポーズ推定精度とロバスト性を大幅に向上することを示す。
論文 参考訳(メタデータ) (2025-05-07T09:26:37Z) - DeProPose: Deficiency-Proof 3D Human Pose Estimation via Adaptive Multi-View Fusion [57.83515140886807]
欠陥認識型3Dポーズ推定の課題について紹介する。
DeProPoseは、トレーニングの複雑さを減らすために、ネットワークアーキテクチャをシンプルにするためのフレキシブルなメソッドである。
我々は,新しい3次元ポーズ推定データセットを開発した。
論文 参考訳(メタデータ) (2025-02-23T03:22:54Z) - A Lesson in Splats: Teacher-Guided Diffusion for 3D Gaussian Splats Generation with 2D Supervision [65.33043028101471]
本稿では,2次元監視のみを用いた3次元画像調和拡散モデルの学習フレームワークを提案する。
既存の3D生成モデルは、大規模な3Dデータセットが不足しているため、完全に3Dの監視に依存している。
論文 参考訳(メタデータ) (2024-12-01T00:29:57Z) - $\text{Di}^2\text{Pose}$: Discrete Diffusion Model for Occluded 3D Human Pose Estimation [17.281031933210762]
本稿では,3次元ポーズ推定のための新しいフレームワークであるDigital Diffusion Pose(textDi2textPose$)を紹介する。
$textDi2textPose$は2段階のプロセスを採用している。
この方法論的な革新は、物理的に実行可能な構成への探索空間を限定的に制限する。
論文 参考訳(メタデータ) (2024-05-27T10:01:36Z) - DiffHPE: Robust, Coherent 3D Human Pose Lifting with Diffusion [54.0238087499699]
拡散モデルにより,人間のポーズ推定精度,ロバスト性,コヒーレンス性が向上することを示す。
3D-HPEにおける拡散モデルを利用する新しい戦略であるDiffHPEを紹介する。
以上の結果から, 独立拡散モデルにより, 予測可能な性能が得られる一方で, 教師付きモデルと組み合わせて精度が向上することが示唆された。
論文 参考訳(メタデータ) (2023-09-04T12:54:10Z) - Unsupervised 3D Pose Estimation with Non-Rigid Structure-from-Motion
Modeling [83.76377808476039]
本研究では,人間のポーズの変形をモデル化し,それに伴う拡散に基づく動きを事前に設計する手法を提案する。
動作中の3次元人間の骨格を復元する作業は3次元基準骨格の推定に分割する。
混合時空間NASfMformerを用いて、各フレームの3次元基準骨格と骨格変形を2次元観測シーケンスから同時に推定する。
論文 参考訳(メタデータ) (2023-08-18T16:41:57Z) - DiffuPose: Monocular 3D Human Pose Estimation via Denoising Diffusion
Probabilistic Model [25.223801390996435]
本稿では,1つの2次元キーポイント検出から3次元ポーズを再構築することに焦点を当てた。
我々は,市販の2D検出器から多種多様な3Dポーズを効果的にサンプリングするための,拡散に基づく新しいフレームワークを構築した。
我々は,広く採用されているHuman3.6MとHumanEva-Iデータセットについて評価を行った。
論文 参考訳(メタデータ) (2022-12-06T07:22:20Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。