論文の概要: DanceHMR: Hand-Aware Whole-Body Human Mesh Recovery from Monocular Videos
- arxiv url: http://arxiv.org/abs/2605.18102v2
- Date: Thu, 21 May 2026 02:30:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 20:14:18.431662
- Title: DanceHMR: Hand-Aware Whole-Body Human Mesh Recovery from Monocular Videos
- Title(参考訳): DanceHMR:モノクロ映像から人間のメッシュを復元するハンズオン
- Authors: Wenhao Shen, Ming Zhou, Hengyuan Zhang, Siyuan Bian, Youjiang Xu, Xi Lin,
- Abstract要約: 本報告では,一眼レフビデオに挑戦するための時間的コヒーレントな全身HMRフレームワークを提案する。
本モデルでは,残体-手関節融合による身体コンテキストと部分特異的手指観察を統一する。
全身および身体のみのベンチマーク実験では、手再建と身体の競争精度が向上した。
- 参考スコア(独自算出の注目度): 13.9470655812816
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular video human mesh recovery is essential for digital humans, avatar animation, and embodied simulation, where both temporal stability and expressive whole-body motion are required. Existing video HMR methods produce coherent body motion but often overlook detailed hand articulation, while image-based whole-body methods recover SMPL-X meshes independently per frame, often leading to jittery and inaccurate hand motion. We present a temporally coherent whole-body HMR framework for challenging in-the-wild monocular videos. Our model unifies body context and part-specific hand observations through residual body-hand fusion, enabling stable body motion and detailed hand recovery within a single temporal architecture. We further introduce close-up-aware augmentation to improve robustness under upper-body framing. Experiments on whole-body and body-only benchmarks demonstrate improved hand reconstruction and competitive body accuracy. Our method also produces temporally stable and 2D-consistent SMPL-X motion in challenging real-world videos.
- Abstract(参考訳): デジタル人間、アバターアニメーション、そして時間的安定性と表現力のある全身運動の両方を必要とする身体シミュレーションには、モノクロビデオヒューマンメッシュリカバリが不可欠である。
既存のビデオHMR法はコヒーレントな身体の動きを生成するが、細かな手の動きを見落とし、画像ベースの全身法はフレームごとに独立してSMPL-Xメッシュを復元し、しばしばジッタリで不正確な手の動きを引き起こす。
本報告では,一眼レフビデオに挑戦するための時間的コヒーレントな全身HMRフレームワークを提案する。
本モデルでは, 身体コンテキストと部分特異的手指観察を残像融合により統合し, 安定した身体動作と1つの時間的構造内での詳細な手指回復を可能にする。
また,上半身フレーミング時の堅牢性向上のために,クローズアップ・アウェアの強化も導入した。
全身および身体のみのベンチマーク実験では、手再建と身体の競争精度が向上した。
また,本手法は,リアルタイムビデオにおける時間的安定かつ2次元一貫性を持つSMPL-X運動も生成する。
関連論文リスト
- World-Coordinate Human Motion Retargeting via SAM 3D Body [0.3735787582927221]
本稿では,SAM 3D Bodyを凍結した知覚バックボーンとして活用するフレームワークを提案する。
再建された動きを、キネマティクスを意識した2段逆キネマティクスパイプラインを用いて、ユニツリーG1ヒューマノイドに再ターゲティングする。
その結果,本手法は安定な世界軌道と信頼性のあるロボット表現を有することが明らかとなった。
論文 参考訳(メタデータ) (2025-12-25T08:30:04Z) - SAM-Body4D: Training-Free 4D Human Body Mesh Recovery from Videos [53.227781131348856]
Human Mesh Recoveryは、2Dの観察から3Dのポーズと形状を再構築することを目的としている。
近年のSAM 3D Bodyのような画像ベースHMR法は,線内画像に対して強靭性を実現している。
ビデオからの時間的一貫した閉塞性HMRのためのトレーニングフリーフレームワークSAM-Body4Dを提案する。
論文 参考訳(メタデータ) (2025-12-09T09:37:31Z) - MonoMSK: Monocular 3D Musculoskeletal Dynamics Estimation [9.3102957142944]
データ駆動学習と物理に基づくシミュレーションを橋渡しするハイブリッドフレームワークであるMonoMSKを紹介する。
MonoMSKは解剖学的に正確な筋骨格モデルにより運動学(運動)と運動学(力とトルク)の両方を共同で回復させる。
BML-MoVi、BEDLAM、OpenCapの実験では、MonoMSKはキネマティックな精度で最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2025-11-24T17:20:17Z) - Dyn-HaMR: Recovering 4D Interacting Hand Motion from a Dynamic Camera [49.82535393220003]
Dyn-HaMRは、野生のダイナミックカメラで撮影されたモノクロビデオから4Dグローバルハンドモーションを再構築する最初のアプローチである。
提案手法は,4次元メッシュ・リカバリにおいて最先端の手法を著しく上回ることを示す。
これにより、動くカメラでモノクロビデオから手の動きを復元するための新しいベンチマークが確立される。
論文 参考訳(メタデータ) (2024-12-17T12:43:10Z) - Motion Diffusion-Guided 3D Global HMR from a Dynamic Camera [3.6948631725065355]
拡散最適化を用いた新しい3次元大域HMR法DiffOptを提案する。
我々の重要な洞察は、動き拡散モデル(MDM)のような人間の動き生成の最近の進歩は、コヒーレントな人間の動きの強い先行を含むことである。
我々はDiffOptをGlobal 3D Human Pose and Shape in the Wildの電磁データベースからビデオシーケンスで検証した。
論文 参考訳(メタデータ) (2024-11-15T21:09:40Z) - Enhanced Spatio-Temporal Context for Temporally Consistent Robust 3D
Human Motion Recovery from Monocular Videos [5.258814754543826]
本稿では,モノクロ映像からの時間的一貫した動き推定手法を提案する。
汎用的なResNetのような機能を使う代わりに、本手法ではボディ認識機能表現と独立したフレーム単位のポーズを使用する。
提案手法は, 高速化誤差を著しく低減し, 既存の最先端手法よりも優れる。
論文 参考訳(メタデータ) (2023-11-20T10:53:59Z) - Imposing Temporal Consistency on Deep Monocular Body Shape and Pose
Estimation [67.23327074124855]
本稿では,適合過程における時間的制約の統合に対するエレガントな解法を提案する。
我々は、顎ポーズ、表情、指ポーズを含む人物の形状と動きを表す一連の身体モデルのパラメーターを導出する。
本手法は,表情や手話を含む画像系列からリアルな3次元体モデルの導出を可能にする。
論文 参考訳(メタデータ) (2022-02-07T11:11:55Z) - FrankMocap: Fast Monocular 3D Hand and Body Motion Capture by Regression
and Integration [40.77575192866039]
フランクモキャップ(FrankMocap)は、高速(9.5 fps)で、幅内モノクル入力から3次元の手と体の動きを推定できるモーションキャプチャシステムである。
提案手法は, ほぼリアルタイム(9.5fps)で動作し, 統一パラメトリックモデル構造として3次元体と手の動きキャプチャ出力を生成する。
論文 参考訳(メタデータ) (2020-08-19T08:22:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。