論文の概要: SnapPose3D: Diffusion-Based Single-Frame 2D-to-3D Lifting of Human Poses
- arxiv url: http://arxiv.org/abs/2604.26620v1
- Date: Wed, 29 Apr 2026 12:45:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.399781
- Title: SnapPose3D: Diffusion-Based Single-Frame 2D-to-3D Lifting of Human Poses
- Title(参考訳): SnapPose3D: 拡散型単一フレーム2D-to-3Dリフティング
- Authors: Alessandro Simoni, Riccardo Catalini, Davide Di Nucci, Guido Borghi, Davide Davoli, Lorenzo Garattoni, Gianpiero Francesca, Yuki Kawana, Roberto Vezzani,
- Abstract要約: SnapPose3Dは、視覚的コンテキストと2Dポーズの両方で条件付けられた3Dポーズを識別するために、決定論的に訓練されたポーズリフトフレームワークである。
本研究では,SnapPose3Dを3次元ポーズ推定タスクのよく知られたベンチマークで広く評価する。
- 参考スコア(独自算出の注目度): 46.076819133044076
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Depth ambiguity and joint uncertainty are the two main obstacles in obtaining accurate human pose predictions by 2D-to-3D lifting methods proposed in the literature. In particular, these issues are caused by 2D joint locations that can be mapped to multiple 3D positions, inducing multiple possible final poses. Following these considerations, we propose leveraging diffusion-based models generation capability to predict multiple hypotheses and aggregate them in a final accurate pose. Therefore, we introduce SnapPose3D, a pose-lifting framework trained deterministically to denoise 3D poses conditioned on both visual context and 2D pose features. SnapPose3D adopts a probabilistic approach during inference, generating multiple hypotheses through random sampling from a unit Gaussian distribution. Unlike most previous methods that address pose ambiguity by processing temporal sequences, SnapPose3D uses single frames as input, avoiding tracking and limiting computational cost, data acquisition complexity, and the need for online, real-time applications. We extensively evaluate SnapPose3D on well-known benchmarks for the 3D human pose estimation task showing its ability to generate and aggregate accurate hypotheses that lead to state-of-the-art results.
- Abstract(参考訳): 文献で提案されている2D-to-3Dリフト法により, 人間のポーズ予測の精度を高める上で, 奥行きの曖昧さと関節の不確実性は2つの主要な障害である。
特に、これらの問題は複数の3D位置にマッピング可能な2次元関節位置によって引き起こされ、複数の最終的なポーズが引き起こされる。
これらの考察に続いて、拡散モデル生成機能を利用して複数の仮説を予測し、最終的な正確なポーズでそれらを集約する手法を提案する。
そこで我々は,視覚的コンテキストと2Dポーズの両方で条件付けられた3Dポーズを識別するために,決定論的に訓練されたポーズリフトフレームワークであるSnapPose3Dを紹介した。
SnapPose3Dは推論中に確率的アプローチを採用し、単位ガウス分布からランダムサンプリングによって複数の仮説を生成する。
SnapPose3Dは、時間的シーケンスを処理することであいまいさに対処する従来の方法とは異なり、単一のフレームを入力として使用し、追跡と計算コストの制限、データ取得の複雑さ、オンラインリアルタイムアプリケーションの必要性を回避している。
本研究では,SnapPose3Dを3次元ポーズ推定タスクのよく知られたベンチマークで評価し,精度の高い仮説を生成・集約し,その結果を得た。
関連論文リスト
- FMPose3D: monocular 3D pose estimation via flow matching [3.599033387924161]
正規微分方程式(ODE)で定義される速度場をフローマッチングを用いて学習する。
本稿では3次元ポーズ推定を条件分布輸送問題として定式化する新しい生成的ポーズ推定フレームワークFMPose3Dを提案する。
FMPose3Dは、広く使われているヒトのポーズ推定ベンチマークであるHuman3.6MとMPI-INF-3DHPの既存の手法を超越し、3D動物のポーズデータセットであるAnimal3DとCtrlAni3Dの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-02-05T15:25:35Z) - Flexible Geometric Guidance for Probabilistic Human Pose Estimation with Diffusion Models [38.64509144392513]
拡散モデルを用いたポーズ推定のためのフレームワークを提案する。
提案手法をHuman 3.6Mデータセット上で評価する。
さらに,MPI-INF-3DHPと3DPWデータセットを用いた一般化能力の評価を行い,競争性能を実証した。
論文 参考訳(メタデータ) (2026-02-03T05:35:37Z) - PandaPose: 3D Human Pose Lifting from a Single Image via Propagating 2D Pose Prior to 3D Anchor Space [62.10630827126755]
PandaPoseは3次元アンカー空間の前に2次元ポーズを伝播させることによって3次元のポーズリフトアプローチである。
われわれの3Dアンカー空間は、(1)標準座標系における関節回りの3Dアンカーから成り、2Dポーズ推定の不正確さを軽減するための正確で堅牢な事前情報を提供する。
論文 参考訳(メタデータ) (2026-02-01T08:20:40Z) - UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - D3PRefiner: A Diffusion-based Denoise Method for 3D Human Pose
Refinement [3.514184876338779]
拡散型3次元ポース・リファイナは既存の3次元ポーズ推定器の出力を改良するために提案される。
現在の拡散モデルのアーキテクチャを利用して、ノイズの多い3Dポーズの分布を3Dポーズに変換する。
実験により,提案アーキテクチャは,現在の3次元ポーズ推定器の性能を大幅に向上させることができることを示した。
論文 参考訳(メタデータ) (2024-01-08T14:21:02Z) - Diffusion-Based 3D Human Pose Estimation with Multi-Hypothesis
Aggregation [64.874000550443]
ジョイントワイズ・リジェクション・ベース・マルチハイブリッド・アグリゲーション(JPMA)を用いた拡散型3次元ポス推定法を提案する。
提案したJPMAは,D3DPが生成する複数の仮説を1つの3次元ポーズにまとめて実用的に利用する。
提案手法は, 最先端の決定論的アプローチと確率論的アプローチをそれぞれ1.5%, 8.9%上回った。
論文 参考訳(メタデータ) (2023-03-21T04:00:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。