論文の概要: LieHMR: Autoregressive Human Mesh Recovery with $SO(3)$ Diffusion
- arxiv url: http://arxiv.org/abs/2509.25739v1
- Date: Tue, 30 Sep 2025 03:50:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 14:45:00.007065
- Title: LieHMR: Autoregressive Human Mesh Recovery with $SO(3)$ Diffusion
- Title(参考訳): LieHMR:$SO(3)$ Diffusionによる自己回帰型ヒューマンメッシュのリカバリ
- Authors: Donghwan Kim, Tae-Kyun Kim,
- Abstract要約: 単一のRGB画像からHuman Meshリカバリの問題に取り組む。
2次元観察から3次元の人間のポーズを復元することは本質的に曖昧であるが、既存のアプローチのほとんどは単一の決定論的出力を後退させている。
本稿では,2次元観察に適合した分布をモデル化する手法を提案する。
- 参考スコア(独自算出の注目度): 29.608043710963162
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We tackle the problem of Human Mesh Recovery (HMR) from a single RGB image, formulating it as an image-conditioned human pose and shape generation. While recovering 3D human pose from 2D observations is inherently ambiguous, most existing approaches have regressed a single deterministic output. Probabilistic methods attempt to address this by generating multiple plausible outputs to model the ambiguity. However, these methods often exhibit a trade-off between accuracy and sample diversity, and their single predictions are not competitive with state-of-the-art deterministic models. To overcome these limitations, we propose a novel approach that models well-aligned distribution to 2D observations. In particular, we introduce $SO(3)$ diffusion model, which generates the distribution of pose parameters represented as 3D rotations unconditional and conditional to image observations via conditioning dropout. Our model learns the hierarchical structure of human body joints using the transformer. Instead of using transformer as a denoising model, the time-independent transformer extracts latent vectors for the joints and a small MLP-based denoising model learns the per-joint distribution conditioned on the latent vector. We experimentally demonstrate and analyze that our model predicts accurate pose probability distribution effectively.
- Abstract(参考訳): 我々は、単一のRGB画像からHuman Mesh Recovery(HMR)の問題に取り組み、それを画像条件付き人間のポーズと形状生成として定式化する。
2次元観察から3次元の人間のポーズを復元することは本質的に曖昧であるが、既存のアプローチのほとんどは単一の決定論的出力を後退させている。
確率的手法は、曖昧さをモデル化するために複数の可算出力を生成することによってこの問題に対処しようとする。
しかしながら、これらの手法はしばしば精度とサンプルの多様性のトレードオフを示し、それらの単一の予測は最先端の決定論的モデルと競合しない。
これらの制約を克服するために,2次元観察に適合した分布をモデル化する新しい手法を提案する。
特に,3次元回転に代表されるポーズパラメータの分布を条件付きドロップアウトにより条件付き・条件付きで生成する$SO(3)$拡散モデルを提案する。
本モデルはトランスを用いて人体関節の階層構造を学習する。
変圧器を復調モデルとして使用する代わりに、時間非依存の変圧器は関節の潜時ベクトルを抽出し、小型のMLPベースの復調モデルは潜時ベクトルに条件付される随伴分布を学習する。
本研究では,提案モデルが精度の高いポーズ確率分布を効果的に予測できることを実験的に実証し,解析する。
関連論文リスト
- ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [71.2556016049579]
ManiPoseは、人為的な2D-to-3Dリフトのための多様体拘束型マルチハイブリッドモデルである。
人間のポーズ多様体上の出力を制約することにより、ManiPoseはすべての仮説的なポーズの一貫性を保証する。
実世界のデータセット上でのManiPoseのパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-12-11T13:50:10Z) - Generative Approach for Probabilistic Human Mesh Recovery using
Diffusion Models [33.2565018922113]
本研究は、与えられた2次元画像から3次元人体メッシュを再構築する問題に焦点を当てる。
拡散に基づくヒューマンメッシュ回復(Diff-HMR)と呼ばれる生成的アプローチフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-05T22:23:04Z) - Diffusion with Forward Models: Solving Stochastic Inverse Problems
Without Direct Supervision [76.32860119056964]
本稿では,直接観測されない信号の分布からサンプルを学習する拡散確率モデルを提案する。
コンピュータビジョンの課題3つの課題に対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2023-06-20T17:53:00Z) - HuManiFlow: Ancestor-Conditioned Normalising Flows on SO(3) Manifolds
for Human Pose and Shape Distribution Estimation [27.14060158187953]
近年のアプローチでは、画像上に条件付き3次元ポーズと形状パラメータの確率分布が予測されている。
これらの手法が3つの重要な特性のトレードオフを示すことを示す。
我々の手法であるHuManiFlowは、同時に正確で一貫性があり多様な分布を予測する。
論文 参考訳(メタデータ) (2023-05-11T16:49:19Z) - DiffPose: Multi-hypothesis Human Pose Estimation using Diffusion models [5.908471365011943]
与えられた入力画像に対して複数の仮説を予測する条件拡散モデルであるemphDiffPoseを提案する。
DiffPoseは, 簡単なポーズの多面的ポーズを推定し, 極めてあいまいなポーズに対して大きなマージンで優れることを示す。
論文 参考訳(メタデータ) (2022-11-29T18:55:13Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Probabilistic Modeling for Human Mesh Recovery [73.11532990173441]
本稿では,2次元の証拠から3次元の人体復元の問題に焦点を当てた。
我々は,この問題を,入力から3Dポーズの分布へのマッピング学習として再考した。
論文 参考訳(メタデータ) (2021-08-26T17:55:11Z) - 3D Multi-bodies: Fitting Sets of Plausible 3D Human Models to Ambiguous
Image Data [77.57798334776353]
単眼・部分閉塞視からヒトの高密度3次元再構成を実現することの問題点を考察する。
身体の形状やポーズをパラメータ化することで、あいまいさをより効果的にモデル化できることを示唆する。
提案手法は, 3次元人間の標準ベンチマークにおいて, あいまいなポーズ回復において, 代替手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-02T13:55:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。