論文の概要: MoPO: Incorporating Motion Prior for Occluded Human Mesh Recovery
- arxiv url: http://arxiv.org/abs/2605.09856v1
- Date: Mon, 11 May 2026 01:25:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.455737
- Title: MoPO: Incorporating Motion Prior for Occluded Human Mesh Recovery
- Title(参考訳): MoPO:人間メッシュの回収に先立って動きを取り入れる
- Authors: Tao Tang, Hong Liu, Xinshun Wang, Wanruo Zhang,
- Abstract要約: そこで我々は,MoPOと呼ばれる人体メッシュ回復のための動き優先手法を提案する。
本研究のMoPOは2つのコンポーネントから構成される: 1) 運動非閉塞モジュール, そして, 閉塞した身体部分を完成させるための軽量な運動予測器を提案する。
私たちのコードとデモは補足資料で確認できます。
- 参考スコア(独自算出の注目度): 13.01302841537282
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although recent studies have made remarkable progress in human mesh recovery, they still exhibit limited robustness to occlusions and often produce inaccurate poses and severe motion jitter due to the insufficient spatial features for occluded body parts. Inspired by the rapid advancements in human motion prediction, we discover that compared to occluded image features, pose sequence inherently contains reliable motion prior for estimating occluded body parts. In this paper, we incorporate Motion Prior for Occluded human mesh recovery, called MoPO. Our MoPO mainly consists of two components: 1) The motion de-occlusion module, where we propose a spatial-temporal occlusion detector to detect joint visibility, and then we propose a lightweight motion predictor to complete the occluded body parts by predicting the most plausible joint positions based on history poses. 2) The motion-aware fusion and refinement module, which fuses the completed joint sequence with image features to estimate human shape and initial human pose. Moreover, the completed joint sequence is further used to refine the final human pose through inverse kinematics, which provides the occlusion-free motion prior for regressing human poses. Extensive experiments demonstrate that MoPO achieves state-of-the-art performance on both occlusion-specific and standard benchmarks, significantly enhancing the accuracy and temporal consistency of occluded human mesh recovery. Our code and demo can be found in the supplementary material.
- Abstract(参考訳): 近年の研究は、人間のメッシュ回復において顕著な進歩を遂げているが、それでもオクルージョンに対する頑丈さは限られており、隠蔽された身体部分の空間的特徴が不十分なため、しばしば不正確なポーズや激しい動きのジッタを生じる。
ヒトの動作予測の急速な進歩に触発されて、閉鎖された画像の特徴と比較すると、ポーズシーケンスは、隠された身体部分の推定に先立って、本質的に信頼できる動きを含むことが判明した。
本稿では,MoPO(Motion Prior for Occluded Human Mesh recovery)を組み込んだ。
私たちのMOPOは主に2つのコンポーネントで構成されています。
1) 関節の視認性を検出するための空間的時間的閉塞検出モジュールを提案するとともに, 歴史的ポーズに基づいて最も確実な関節位置を予測し, 閉塞した身体部分を完成させるための軽量な運動予測器を提案する。
2) 画像特徴を融合させて人間の形状と初期人間のポーズを推定する動き認識融合・改良モジュール。
さらに、完了した関節配列は、逆運動学により最終ヒトのポーズを洗練するためにさらに使用され、ヒトのポーズを後退させる前に閉塞のない動きを与える。
大規模な実験により、MoPOは閉塞特異的および標準ベンチマークの両方で最先端のパフォーマンスを達成し、閉塞された人間のメッシュ回復の正確性と時間的一貫性を著しく向上することが示された。
私たちのコードとデモは補足資料で確認できます。
関連論文リスト
- Occluded Human Pose Estimation based on Limb Joint Augmentation [14.36131862057872]
そこで本研究では,人体におけるポーズ推定モデルの一般化能力を高めるために,手足関節拡張に基づく閉鎖型ポーズ推定フレームワークを提案する。
モデルの局所化能力を高めるために,手足グラフに基づく動的構造損失関数を構築し,閉塞した関節の分布を探索する。
論文 参考訳(メタデータ) (2024-10-13T15:48:24Z) - Occlusion-Aware 3D Motion Interpretation for Abnormal Behavior Detection [10.782354892545651]
我々は,メッシュ頂点とヒト関節の3次元座標をモノクロビデオから再構成し,運動異常を識別するOAD2Dを提案する。
動作特徴の定量化にVQVAEを用いるM2Tモデルと組み合わせることで、異常姿勢推定を再構成する。
本研究は, 重度・自己閉塞性に対する異常行動検出のロバスト性を示すものである。
論文 参考訳(メタデータ) (2024-07-23T18:41:16Z) - DPMesh: Exploiting Diffusion Prior for Occluded Human Mesh Recovery [71.6345505427213]
DPMeshは、人間のメッシュリカバリを排除した革新的なフレームワークである。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルに埋め込まれた対象構造と空間的関係について、より深い拡散に乗じる。
論文 参考訳(メタデータ) (2024-04-01T18:59:13Z) - AiOS: All-in-One-Stage Expressive Human Pose and Shape Estimation [55.179287851188036]
人間のポーズと形状の復元のための新しいオールインワンステージフレームワークであるAiOSを、追加の人間検出ステップなしで導入する。
まず、画像中の人間の位置を探索し、各インスタンスのグローバルな機能をエンコードするために、人間のトークンを使用します。
そして、画像中の人間の関節を探索し、きめ細かい局所的特徴を符号化するジョイント関連トークンを導入する。
論文 参考訳(メタデータ) (2024-03-26T17:59:23Z) - DPoser: Diffusion Model as Robust 3D Human Pose Prior [51.75784816929666]
拡散モデルに基づいて構築された,頑丈で多目的な人間のポーズであるDPoserを紹介する。
DPoserは、様々なポーズ中心タスクを逆問題とみなし、効率的な解法として変分拡散サンプリングを用いる。
提案手法は、画像領域で使用される一般的な均一スケジューリングよりも大幅に改善され、それぞれ5.4%、17.2%、および3.8%の改善が達成された。
論文 参考訳(メタデータ) (2023-12-09T11:18:45Z) - Enhanced Spatio-Temporal Context for Temporally Consistent Robust 3D
Human Motion Recovery from Monocular Videos [5.258814754543826]
本稿では,モノクロ映像からの時間的一貫した動き推定手法を提案する。
汎用的なResNetのような機能を使う代わりに、本手法ではボディ認識機能表現と独立したフレーム単位のポーズを使用する。
提案手法は, 高速化誤差を著しく低減し, 既存の最先端手法よりも優れる。
論文 参考訳(メタデータ) (2023-11-20T10:53:59Z) - Occluded Human Body Capture with Self-Supervised Spatial-Temporal Motion
Prior [7.157324258813676]
私たちは、トレーニングとテストの両方に使用できる最初の3Dクローズドモーションデータセット(OcMotion)を構築します。
次に、空間時間層は、関節レベルの相関を学習するために設計される。
実験結果から,提案手法は,映像から高精度で一貫性のある人間の動きを生成できることが示唆された。
論文 参考訳(メタデータ) (2022-07-12T08:15:11Z) - 3D Skeleton-based Human Motion Prediction with Manifold-Aware GAN [3.1313293632309827]
本研究では,3次元骨格を用いた人体動作予測の新しい手法を提案する。
我々は,人間の運動の時間的および空間的依存を捉える,多様体を意識したワッサーシュタイン生成逆数モデルを構築した。
CMU MoCapとHuman 3.6Mデータセットで実験が行われた。
論文 参考訳(メタデータ) (2022-03-01T20:49:13Z) - Imposing Temporal Consistency on Deep Monocular Body Shape and Pose
Estimation [67.23327074124855]
本稿では,適合過程における時間的制約の統合に対するエレガントな解法を提案する。
我々は、顎ポーズ、表情、指ポーズを含む人物の形状と動きを表す一連の身体モデルのパラメーターを導出する。
本手法は,表情や手話を含む画像系列からリアルな3次元体モデルの導出を可能にする。
論文 参考訳(メタデータ) (2022-02-07T11:11:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。