論文の概要: Physics Informed Human Posture Estimation Based on 3D Landmarks from Monocular RGB-Videos
- arxiv url: http://arxiv.org/abs/2512.06783v1
- Date: Sun, 07 Dec 2025 10:54:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.527178
- Title: Physics Informed Human Posture Estimation Based on 3D Landmarks from Monocular RGB-Videos
- Title(参考訳): 単眼RGB映像からの3次元ランドマークに基づく物理インフォームドヒューマン姿勢推定
- Authors: Tobias Leuthold, Michele Xiloyannis, Yves Zimmermann,
- Abstract要約: BlazePoseのような最先端モデルは、リアルタイムのポーズトラッキングに優れていますが、解剖学的制約の欠如は、物理的な知識を含めることで、改善の可能性を示しています。
本稿では、重み付け最適化を用いたBlazePose 3Dと2D推定の長所を生かしたリアルタイム後処理アルゴリズムを提案する。
Physio2.2Mデータセットによる評価では、3D MPJPEが10.2%減少し、BlazePoseの3D推定に比べて16.6%減少している。
- 参考スコア(独自算出の注目度): 1.3399128310861848
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Applications providing automated coaching for physical training are increasing in popularity, for example physical therapy. These applications rely on accurate and robust pose estimation using monocular video streams. State-of-the-art models like BlazePose excel in real-time pose tracking, but their lack of anatomical constraints indicates improvement potential by including physical knowledge. We present a real-time post-processing algorithm fusing the strengths of BlazePose 3D and 2D estimations using a weighted optimization, penalizing deviations from expected bone length and biomechanical models. Bone length estimations are refined to the individual anatomy using a Kalman filter with adapting measurement trust. Evaluation using the Physio2.2M dataset shows a 10.2 percent reduction in 3D MPJPE and a 16.6 percent decrease in errors of angles between body segments compared to BlazePose 3D estimation. Our method provides a robust, anatomically consistent pose estimation based on a computationally efficient video-to-3D pose estimation, suitable for automated physiotherapy, healthcare, and sports coaching on consumer-level laptops and mobile devices. The refinement runs on the backend with anonymized data only.
- Abstract(参考訳): 物理トレーニングのための自動コーチングを提供するアプリケーションは、例えば理学療法のような人気が高まっている。
これらのアプリケーションは単眼ビデオストリームを用いた正確でロバストなポーズ推定に頼っている。
BlazePoseのような最先端モデルは、リアルタイムのポーズトラッキングに優れていますが、解剖学的制約の欠如は、物理的な知識を含めることで、改善の可能性を示しています。
本稿では, 骨長と生体力学モデルとの差分を加重最適化し, BlazePose 3Dおよび2D推定の強度を生かしたリアルタイム後処理アルゴリズムを提案する。
測定信頼度に適応したカルマンフィルタを用いて骨長推定を個々の解剖学に洗練する。
Physio2.2Mデータセットによる評価では、3D MPJPEが10.2%減少し、BlazePoseの3D推定に比べて16.6%減少している。
提案手法は,パソコンやモバイルデバイス上での自動生理学療法,医療,スポーツコーチングに適した,計算効率のよい3次元ポーズ推定に基づく,堅牢で解剖学的に一貫したポーズ推定を提供する。
改善は匿名データのみを使用してバックエンドで動作する。
関連論文リスト
- AthletePose3D: A Benchmark Dataset for 3D Human Pose Estimation and Kinematic Validation in Athletic Movements [4.653030985708889]
AthletePose3Dは、高速で高速な運動運動をキャプチャするために設計された、新しいデータセットである。
本研究では,SOTA (State-of-the-art monocular 2D and 3D pose Estimation model on the dataset。
論文 参考訳(メタデータ) (2025-03-10T16:16:02Z) - BioPose: Biomechanically-accurate 3D Pose Estimation from Monocular Videos [6.280386490530478]
BioPoseは、モノクロビデオから直接、生体力学的に正確な3Dポーズを予測するための学習ベースのフレームワークである。
マルチクエリヒューマンメッシュリカバリモデル(MQ-HMR)、ニューラル・インバース・キネマティクス(NeurIK)モデル、および2Dインフォームド・ポーズ・リファインメント技術を含んでいる。
ベンチマークデータセットの実験では、BioPoseが最先端の手法を大幅に上回っていることが示されている。
論文 参考訳(メタデータ) (2025-01-14T02:56:19Z) - Estimating Body and Hand Motion in an Ego-sensed World [62.61989004520802]
頭部装着装置から人体の動きを推定するシステムであるEgoAlloについて述べる。
エゴセントリックなSLAMポーズとイメージのみを使用して、EgoAlloは条件付き拡散モデルからサンプリングを行い、3Dボディポーズ、高さ、手のパラメータを推定する。
論文 参考訳(メタデータ) (2024-10-04T17:59:57Z) - Hybrid 3D Human Pose Estimation with Monocular Video and Sparse IMUs [15.017274891943162]
モノクロビデオからの時間的3Dポーズ推定は、人間中心のコンピュータビジョンにおいて難しい課題である。
情報ソースを補完するために慣性センサが導入された。
物理的に合理的な3Dポーズを生成するために、異種センサデータを統合することは依然として困難である。
論文 参考訳(メタデータ) (2024-04-27T09:02:42Z) - Cloth2Body: Generating 3D Human Body Mesh from 2D Clothing [54.29207348918216]
Cloth2Bodyは、入力の部分的な観察と出力の多様性によって引き起こされる新しい課題に対処する必要がある。
本稿では,2次元衣料品画像のポーズと形状によってパラメータ化された3Dボディメッシュを高精度に推定できるエンドツーエンドフレームワークを提案する。
実験結果から示されるように,提案手法は最先端の性能を実現し,自然および多様な3Dボディメッシュを2次元画像から効果的に回収することができる。
論文 参考訳(メタデータ) (2023-09-28T06:18:38Z) - Towards Single Camera Human 3D-Kinematics [15.559206592078425]
深層ニューラルネットワークを用いたビデオから直接3次元人体動推定D3KEを提案する。
実験により,提案したエンドツーエンドトレーニングは頑健であり,2次元および3次元マーカーレスモーションキャプチャに基づく運動推定パイプラインよりも優れていた。
論文 参考訳(メタデータ) (2023-01-13T08:44:09Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z) - Contact and Human Dynamics from Monocular Video [73.47466545178396]
既存のディープモデルは、ほぼ正確に見えるエラーを含むビデオから2Dと3Dキネマティックのポーズを予測する。
本稿では,最初の2次元と3次元のポーズ推定を入力として,映像系列から3次元の人間の動きを推定する物理に基づく手法を提案する。
論文 参考訳(メタデータ) (2020-07-22T21:09:11Z) - Anatomy-aware 3D Human Pose Estimation with Bone-based Pose
Decomposition [92.99291528676021]
3次元関節位置を直接回帰するのではなく,骨方向予測と骨長予測に分解する。
私たちのモチベーションは、人間の骨格の骨の長さが時間とともに一定であることにあります。
我々の完全なモデルは、Human3.6MとMPI-INF-3DHPデータセットにおいて、以前の最高の結果よりも優れています。
論文 参考訳(メタデータ) (2020-02-24T15:49:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。