論文の概要: SKEL-CF: Coarse-to-Fine Biomechanical Skeleton and Surface Mesh Recovery
- arxiv url: http://arxiv.org/abs/2511.20157v1
- Date: Tue, 25 Nov 2025 10:33:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.404442
- Title: SKEL-CF: Coarse-to-Fine Biomechanical Skeleton and Surface Mesh Recovery
- Title(参考訳): SKEL-CF: 粗大な生体力学的骨格と表面メッシュ回復
- Authors: Da Li, Ji-Ping Jin, Xuanlong Yu, Wei Liu, Xiaodong Cun, Kai Chen, Rui Fan, Jiangang Kong, Shen Xi,
- Abstract要約: 本稿では,SKELパラメータ推定のための粗大なフレームワークであるSKEL-CFを紹介する。
SKEL-CFはトランスフォーマーベースのエンコーダデコーダアーキテクチャを採用しており、そこではエンコーダが粗いカメラとSKELパラメータを予測する。
本研究では,SKEL-CFを人間の動作解析のためのスケーラブルで解剖学的に忠実なフレームワークとして確立した。
- 参考スコア(独自算出の注目度): 31.645433720972367
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Parametric 3D human models such as SMPL have driven significant advances in human pose and shape estimation, yet their simplified kinematics limit biomechanical realism. The recently proposed SKEL model addresses this limitation by re-rigging SMPL with an anatomically accurate skeleton. However, estimating SKEL parameters directly remains challenging due to limited training data, perspective ambiguities, and the inherent complexity of human articulation. We introduce SKEL-CF, a coarse-to-fine framework for SKEL parameter estimation. SKEL-CF employs a transformer-based encoder-decoder architecture, where the encoder predicts coarse camera and SKEL parameters, and the decoder progressively refines them in successive layers. To ensure anatomically consistent supervision, we convert the existing SMPL-based dataset 4DHuman into a SKEL-aligned version, 4DHuman-SKEL, providing high-quality training data for SKEL estimation. In addition, to mitigate depth and scale ambiguities, we explicitly incorporate camera modeling into the SKEL-CF pipeline and demonstrate its importance across diverse viewpoints. Extensive experiments validate the effectiveness of the proposed design. On the challenging MOYO dataset, SKEL-CF achieves 85.0 MPJPE / 51.4 PA-MPJPE, significantly outperforming the previous SKEL-based state-of-the-art HSMR (104.5 / 79.6). These results establish SKEL-CF as a scalable and anatomically faithful framework for human motion analysis, bridging the gap between computer vision and biomechanics. Our implementation is available on the project page: https://pokerman8.github.io/SKEL-CF/.
- Abstract(参考訳): SMPLのようなパラメトリックな3Dモデルが人間のポーズや形状の推定に大きな進歩をもたらしたが、その単純化されたキネマティクスは生体力学的リアリズムを制限する。
最近提案されたSKELモデルでは、SMPLを解剖学的に正確な骨格に書き換えることで、この制限に対処している。
しかしながら、SKELパラメータを直接推定することは、限られた訓練データ、視点のあいまいさ、および人間の調音の固有の複雑さのために、依然として困難である。
本稿では,SKELパラメータ推定のための粗大なフレームワークであるSKEL-CFを紹介する。
SKEL-CFはトランスフォーマーベースのエンコーダデコーダアーキテクチャを用いており、そこではエンコーダが粗いカメラとSKELパラメータを予測する。
既存のSMPLベースのデータセット4DHumanをSKEL対応バージョン4DHuman-SKELに変換し,SKEL推定のための高品質なトレーニングデータを提供する。
さらに、奥行きを緩和し、あいまいさを拡大するために、カメラモデリングをSKEL-CFパイプラインに明示的に組み入れ、その重要性を様々な視点で示す。
大規模な実験により提案した設計の有効性が検証された。
挑戦的なMOYOデータセットでは、SKEL-CFは85.0 MPJPE / 51.4 PA-MPJPEを達成した。
これらの結果は、コンピュータビジョンとバイオメカニクスのギャップを埋め、人間の動作分析のためのスケーラブルで解剖学的に忠実なフレームワークとしてSKEL-CFを確立した。
私たちの実装はプロジェクトのページで利用可能です。
関連論文リスト
- From Skin to Skeleton: Towards Biomechanically Accurate 3D Digital Humans [50.014530130312714]
SMPL体モデルに生体力学スケルトンを付加したSKELを開発した。
その結果,SKELはSMPLよりも生体力学的に正確な関節位置を有しており,骨は従来法よりも体表面に収まることがわかった。
論文 参考訳(メタデータ) (2025-09-08T12:24:27Z) - SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation [81.36747103102459]
表現的人間のポーズと形状推定(EHPS)は、身体、手、顔の動きを多数の応用で統合する。
現在の最先端の手法は、限定されたデータセット上で革新的なアーキテクチャ設計を訓練することに焦点を当てている。
本稿では,EHPSのスケールアップが一般基盤モデルのファミリに与える影響について検討する。
論文 参考訳(メタデータ) (2025-01-16T18:59:46Z) - SMILE: Zero-Shot Sparse Mixture of Low-Rank Experts Construction From Pre-Trained Foundation Models [85.67096251281191]
我々は、ゼロショットスパースミクチャー(SMILE)と呼ばれるモデル融合に対する革新的なアプローチを提案する。
SMILEは、余分なデータやさらなるトレーニングなしに、ソースモデルをMoEモデルにアップスケーリングできる。
画像分類やテキスト生成タスクなど,さまざまなシナリオに対して,フル微調整とLoRA微調整を用いて広範な実験を行う。
論文 参考訳(メタデータ) (2024-08-19T17:32:15Z) - Benchmarking Skeleton-based Motion Encoder Models for Clinical Applications: Estimating Parkinson's Disease Severity in Walking Sequences [3.650839294933459]
PD患者の歩行パターンを解析するための大規模人間の動作データセットを訓練した一般人動作エンコーダ。
運動障害社会の予測能力について,6つの事前訓練されたヒト運動エンコーダモデルの評価を行った。
論文 参考訳(メタデータ) (2024-05-28T04:29:10Z) - SkeletonMAE: Graph-based Masked Autoencoder for Skeleton Sequence
Pre-training [110.55093254677638]
我々はSkeleton Sequence Learning(SSL)という,効率的なスケルトンシーケンス学習フレームワークを提案する。
本論文では,SkeletonMAEという非対称なグラフベースのエンコーダデコーダ事前学習アーキテクチャを構築する。
我々のSSLは、さまざまなデータセットにまたがってうまく一般化し、最先端の自己教師型スケルトンベースのアクション認識手法よりも優れています。
論文 参考訳(メタデータ) (2023-07-17T13:33:11Z) - Scaling Pre-trained Language Models to Deeper via Parameter-efficient
Architecture [68.13678918660872]
行列積演算子(MPO)に基づくより有能なパラメータ共有アーキテクチャを設計する。
MPO分解はパラメータ行列の情報を再編成し、2つの部分に分解することができる。
私たちのアーキテクチャは、モデルのサイズを減らすために、すべてのレイヤで中央テンソルを共有しています。
論文 参考訳(メタデータ) (2023-03-27T02:34:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。