論文の概要: Learnable SMPLify: A Neural Solution for Optimization-Free Human Pose Inverse Kinematics
- arxiv url: http://arxiv.org/abs/2508.13562v1
- Date: Tue, 19 Aug 2025 06:53:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.822927
- Title: Learnable SMPLify: A Neural Solution for Optimization-Free Human Pose Inverse Kinematics
- Title(参考訳): Learnable SMPLify: 最適化のない人間の逆運動学のためのニューラルネットワーク
- Authors: Yuchen Yang, Linfeng Dong, Wei Wang, Zhihang Zhong, Xiao Sun,
- Abstract要約: Learnable SMPLifyは、SMPLifyの反復フィッティングプロセスをシングルパス回帰モデルに置き換えるニューラルネットワークフレームワークである。
SMPLifyに比べて200倍近く高速なランタイムを実現し、3DPWやRICHによく対応し、LucidActionのプラグインツールとして使用する場合、モデルに依存しない方法として動作する。
- 参考スコア(独自算出の注目度): 13.621560002904873
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In 3D human pose and shape estimation, SMPLify remains a robust baseline that solves inverse kinematics (IK) through iterative optimization. However, its high computational cost limits its practicality. Recent advances across domains have shown that replacing iterative optimization with data-driven neural networks can achieve significant runtime improvements without sacrificing accuracy. Motivated by this trend, we propose Learnable SMPLify, a neural framework that replaces the iterative fitting process in SMPLify with a single-pass regression model. The design of our framework targets two core challenges in neural IK: data construction and generalization. To enable effective training, we propose a temporal sampling strategy that constructs initialization-target pairs from sequential frames. To improve generalization across diverse motions and unseen poses, we propose a human-centric normalization scheme and residual learning to narrow the solution space. Learnable SMPLify supports both sequential inference and plug-in post-processing to refine existing image-based estimators. Extensive experiments demonstrate that our method establishes itself as a practical and simple baseline: it achieves nearly 200x faster runtime compared to SMPLify, generalizes well to unseen 3DPW and RICH, and operates in a model-agnostic manner when used as a plug-in tool on LucidAction. The code is available at https://github.com/Charrrrrlie/Learnable-SMPLify.
- Abstract(参考訳): 3次元人間のポーズと形状推定では、SMPLifyは反復最適化により逆運動学(IK)を解く頑健なベースラインのままである。
しかし、計算コストが高いため実用性は制限される。
ドメイン間の最近の進歩は、反復最適化をデータ駆動ニューラルネットワークに置き換えることによって、精度を犠牲にすることなく、実行時の大幅な改善が達成できることを示している。
本稿では,SMPLifyの反復的嵌合過程を単一パス回帰モデルで置き換えるニューラルネットワークフレームワークであるLearnerable SMPLifyを提案する。
我々のフレームワークの設計は、データ構築と一般化という、ニューラルIKにおける2つのコア課題をターゲットにしている。
効果的なトレーニングを実現するため,シーケンシャルフレームから初期化ターゲットペアを構成する時間的サンプリング戦略を提案する。
多様な動きや見知らぬポーズの一般化を改善するため,解空間を狭めるための人間中心の正規化スキームと残差学習を提案する。
Learnable SMPLifyは、シーケンシャル推論とプラグイン後処理の両方をサポートし、既存の画像ベース推定装置を洗練する。
SMPLifyと比較して200倍近く高速な実行を実現し、3DPW や RICH に準じて一般化し、LucidAction 上のプラグインツールとして使用する場合、モデルに依存しない動作を行う。
コードはhttps://github.com/Charrrlie/Learnable-SMPLifyで公開されている。
関連論文リスト
- VoxelOpt: Voxel-Adaptive Message Passing for Discrete Optimization in Deformable Abdominal CT Registration [15.78340001680369]
離散最適化に基づく変形可能な画像登録フレームワークであるVoxelOptを提案する。
学習ベースの長所と反復的手法を組み合わせて、登録精度と実行時のバランスを改善する。
腹部CTの登録では、これらの変更により、VoxelOptは、ラベルの監督によって訓練された最先端の学習ベースの手法と一致しながら、効率と正確性の両方において、リード反復性を上回っている。
論文 参考訳(メタデータ) (2025-06-24T19:44:04Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Learning Large-scale Neural Fields via Context Pruned Meta-Learning [60.93679437452872]
本稿では,大規模ニューラルネットワーク学習のための最適化に基づくメタラーニング手法を提案する。
メタテスト時間における勾配再スケーリングは、非常に高品質なニューラルネットワークの学習を可能にすることを示す。
我々のフレームワークは、モデルに依存しない、直感的で、実装が容易であり、幅広い信号に対する大幅な再構成改善を示す。
論文 参考訳(メタデータ) (2023-02-01T17:32:16Z) - Distribution-Aware Single-Stage Models for Multi-Person 3D Pose
Estimation [29.430404703883084]
本稿では,多人数の3Dポーズ推定問題に対処する新しいDASモデルを提案する。
提案するDASモデルでは,3次元カメラ空間における人物位置と人体関節をワンパスで同時に位置決めする。
CMU Panoptic と MuPoTS-3D のベンチマークに関する総合的な実験は、提案したDASモデルの優れた効率を実証している。
論文 参考訳(メタデータ) (2022-03-15T07:30:27Z) - RL-PGO: Reinforcement Learning-based Planar Pose-Graph Optimization [1.4884785898657995]
本稿では,最新のDeep Reinforcement Learning (DRL) ベースの環境と2次元ポーズグラフ最適化のためのエージェントを提案する。
本研究では、ポーズグラフ最適化問題を部分的に観測可能な決定プロセスとしてモデル化し、実世界および合成データセットの性能を評価することを実証する。
論文 参考訳(メタデータ) (2022-02-26T20:10:14Z) - Human Body Model Fitting by Learned Gradient Descent [48.79414884222403]
画像に3次元の人体形状を適合させる新しいアルゴリズムを提案する。
このアルゴリズムは高速(約120ms収束)で、データセットに頑健であり、公開評価データセットの最先端結果が得られることを示す。
論文 参考訳(メタデータ) (2020-08-19T14:26:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。