論文の概要: Cascaded Diffusion Framework for Probabilistic Coarse-to-Fine Hand Pose Estimation
- arxiv url: http://arxiv.org/abs/2510.00527v1
- Date: Wed, 01 Oct 2025 05:19:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.397269
- Title: Cascaded Diffusion Framework for Probabilistic Coarse-to-Fine Hand Pose Estimation
- Title(参考訳): 確率的粗い手の位置推定のためのカスケード拡散フレームワーク
- Authors: Taeyun Woo, Jinah Park, Tae-Kyun Kim,
- Abstract要約: 本稿では,確率的モデリングとカスケード改良を組み合わせた粗大なカスケード拡散フレームワークを提案する。
学習空間における多種多様な共同仮説を用いたメッシュ LDM の学習により,我々のフレームワークは配電・配電・連成関係を学習する。
FreiHAND と HO3Dv2 の実験により,提案手法はポーズ分布を効果的にモデル化しながら,最先端の性能を実現することを示した。
- 参考スコア(独自算出の注目度): 11.992963268744438
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Deterministic models for 3D hand pose reconstruction, whether single-staged or cascaded, struggle with pose ambiguities caused by self-occlusions and complex hand articulations. Existing cascaded approaches refine predictions in a coarse-to-fine manner but remain deterministic and cannot capture pose uncertainties. Recent probabilistic methods model pose distributions yet are restricted to single-stage estimation, which often fails to produce accurate 3D reconstructions without refinement. To address these limitations, we propose a coarse-to-fine cascaded diffusion framework that combines probabilistic modeling with cascaded refinement. The first stage is a joint diffusion model that samples diverse 3D joint hypotheses, and the second stage is a Mesh Latent Diffusion Model (Mesh LDM) that reconstructs a 3D hand mesh conditioned on a joint sample. By training Mesh LDM with diverse joint hypotheses in a learned latent space, our framework learns distribution-aware joint-mesh relationships and robust hand priors. Furthermore, the cascaded design mitigates the difficulty of directly mapping 2D images to dense 3D poses, enhancing accuracy through sequential refinement. Experiments on FreiHAND and HO3Dv2 demonstrate that our method achieves state-of-the-art performance while effectively modeling pose distributions.
- Abstract(参考訳): 3次元手品の決定論的モデルでは, 単段手品とカスケード手品のいずれにおいても, 自己閉塞や複雑な手品の構図によって引き起こされるあいまいさに苦慮する。
既存のカスケードは粗い方法で予測を洗練させるが、決定論的であり、不確実性を捉えることはできない。
近年の確率論的手法では, 分布は単一段推定に制限されているが, 精度の低い3次元再構成では精度が低い場合が多い。
これらの制約に対処するために,確率的モデリングとカスケード的改善を組み合わせた粗大なカスケード拡散フレームワークを提案する。
第1段階は多種多様な3次元関節仮説をサンプリングする関節拡散モデルであり、第2段階はMesh Latent Diffusion Model (Mesh LDM)であり、関節標本に条件付き3次元手メッシュを再構成する。
学習した潜在空間における様々な関節仮説を用いたメッシュ LDM の訓練により,我々のフレームワークは,分布を考慮した関節・メッシュ関係と頑健な手先関係を学習する。
さらに、ケースドデザインは、2D画像を濃密な3Dポーズに直接マッピングする難しさを軽減し、逐次精細化による精度の向上を図る。
FreiHAND と HO3Dv2 の実験により,提案手法はポーズ分布を効果的にモデル化しながら,最先端の性能を実現することを示した。
関連論文リスト
- LieHMR: Autoregressive Human Mesh Recovery with $SO(3)$ Diffusion [29.608043710963162]
単一のRGB画像からHuman Meshリカバリの問題に取り組む。
2次元観察から3次元の人間のポーズを復元することは本質的に曖昧であるが、既存のアプローチのほとんどは単一の決定論的出力を後退させている。
本稿では,2次元観察に適合した分布をモデル化する手法を提案する。
論文 参考訳(メタデータ) (2025-09-30T03:50:56Z) - Learning Correlation-aware Aleatoric Uncertainty for 3D Hand Pose Estimation [29.05126213133674]
本稿では3次元ポーズ推定フレームワークにアレータリック不確実性モデリングを導入する。
本稿では,手関節の内在的相関を捉えるために,単一の線形層を利用する新しいパラメータ化を提案する。
実験により,不確実性モデリングのパラメータ化が既存手法より優れていることが示された。
論文 参考訳(メタデータ) (2025-09-01T08:31:01Z) - HandDiff: 3D Hand Pose Estimation with Diffusion on Image-Point Cloud [60.47544798202017]
ハンドポーズ推定は、様々な人間とコンピュータの相互作用アプリケーションにおいて重要なタスクである。
本論文は,手形画像点雲上での正確な手ポーズを反復的に認知する拡散型手ポーズ推定モデルであるHandDiffを提案する。
実験の結果,提案したHandDiffは,4つの挑戦的なハンドポーズベンチマークデータセットにおいて,既存のアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-04-04T02:15:16Z) - D-SCo: Dual-Stream Conditional Diffusion for Monocular Hand-Held Object Reconstruction [74.49121940466675]
モノクローナルハンドヘルドオブジェクト再構成のためのCentroid-fixed dual-stream conditionalfusionを導入する。
まず、対象のセントロイドがずれることを避けるために、手動制約付きセントロイド固定パラダイムを用いる。
第2に、意味的および幾何学的に手動物体の相互作用をモデル化するための二重ストリームデノイザを導入する。
論文 参考訳(メタデータ) (2023-11-23T20:14:50Z) - A Probabilistic Attention Model with Occlusion-aware Texture Regression
for 3D Hand Reconstruction from a Single RGB Image [5.725477071353354]
深層学習のアプローチは、1枚のRGB画像から3Dの手の再構築に有望な結果を示している。
本稿では,モデルに基づくアプローチの堅牢性を実現するための新しい確率モデルを提案する。
本稿では,教師付きシナリオと弱教師付きシナリオの両方において,提案する確率モデルの柔軟性を実証する。
論文 参考訳(メタデータ) (2023-04-27T16:02:32Z) - DiffPose: Multi-hypothesis Human Pose Estimation using Diffusion models [5.908471365011943]
与えられた入力画像に対して複数の仮説を予測する条件拡散モデルであるemphDiffPoseを提案する。
DiffPoseは, 簡単なポーズの多面的ポーズを推定し, 極めてあいまいなポーズに対して大きなマージンで優れることを示す。
論文 参考訳(メタデータ) (2022-11-29T18:55:13Z) - HandFlow: Quantifying View-Dependent 3D Ambiguity in Two-Hand
Reconstruction with Normalizing Flow [73.7895717883622]
条件付き正規化フローフレームワークにおける可塑性再構成の分布を明示的にモデル化する。
この課題に対して,明示的な曖昧さモデリングが適していることを示す。
論文 参考訳(メタデータ) (2022-10-04T15:42:22Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。