論文の概要: SOMA: Unifying Parametric Human Body Models
- arxiv url: http://arxiv.org/abs/2603.16858v1
- Date: Tue, 17 Mar 2026 17:58:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.469636
- Title: SOMA: Unifying Parametric Human Body Models
- Title(参考訳): SOMA:パラメトリックな人体モデルの統合
- Authors: Jun Saito, Jiefeng Li, Michael de Ruyter, Miguel Guerrero, Edy Lim, Ehsan Hassani, Roger Blanco Ribera, Hyejin Moon, Magdalena Dadela, Marco Di Lucca, Qiao Wang, Xueting Li, Jan Kautz, Simon Yuen, Umar Iqbal,
- Abstract要約: パラメトリックな人体モデルは、人間の再構築、アニメーション、シミュレーションの基礎となっているが、それらは相互に相容れないままである。
これらの異種表現を3つの抽象層を通して変換する統一体層であるSOMAを提案する。
パイプライン全体は完全に差別化可能で、NVIDIA-Warp経由でGPUを加速する。
- 参考スコア(独自算出の注目度): 47.381120553445136
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Parametric human body models are foundational to human reconstruction, animation, and simulation, yet they remain mutually incompatible: SMPL, SMPL-X, MHR, Anny, and related models each diverge in mesh topology, skeletal structure, shape parameterization, and unit convention, making it impractical to exploit their complementary strengths within a single pipeline. We present SOMA, a unified body layer that bridges these heterogeneous representations through three abstraction layers. Mesh topology abstraction maps any source model's identity to a shared canonical mesh in constant time per vertex. Skeletal abstraction recovers a full set of identity-adapted joint transforms from any body shape, whether in rest pose or an arbitrary posed configuration, in a single closed-form pass, with no iterative optimization or per-model training. Pose abstraction inverts the skinning pipeline to recover unified skeleton rotations directly from posed vertices of any supported model, enabling heterogeneous motion datasets to be consumed without custom retargeting. Together, these layers reduce the $O(M^2)$ per-pair adapter problem to $O(M)$ single-backend connectors, letting practitioners freely mix identity sources and pose data at inference time. The entire pipeline is fully differentiable end-to-end and GPU-accelerated via NVIDIA-Warp.
- Abstract(参考訳): SMPL、SMPL-X、MHR、Anny、および関連するモデルはそれぞれメッシュトポロジ、骨格構造、形状パラメータ化、ユニット・コンベンションに偏り、単一のパイプライン内で補完的な強度を活用できない。
3つの抽象層を通してこれらの異種表現をブリッジする統一ボディ層であるSOMAを提示する。
メッシュトポロジ抽象化は、任意のソースモデルのIDを、頂点毎の一定時間で共有カノニカルメッシュにマッピングする。
骨格抽象は、静止ポーズであれ任意の配置であれ、任意の身体形状から、反復的な最適化やモデルごとのトレーニングなしに、完全なアイデンティティ適応関節変換を単一の閉形式パスで復元する。
Poseの抽象化はスキンパイプラインを逆転させ、サポート対象モデルの仮定された頂点から直接統合された骨格回転を復元する。
これらのレイヤは共に$O(M^2)$ per-pairアダプタの問題を$O(M)$ single-backendコネクタに還元し、実践者はIDソースを自由に混ぜて推論時にデータをポーズさせることができる。
パイプライン全体は完全に差別化可能で、NVIDIA-Warp経由でGPUを加速する。
関連論文リスト
- MORPH: Shape-agnostic PDE Foundation Models [37.26306668589026]
MORPHは偏微分方程式(PDE)の形状に依存しない自己回帰基底モデルである
様々なデータ次元(1D--3D)の不均一な評価をシームレスに処理する畳み込み視覚バックボーン上に構築されている。
広範なデータセット全体にわたって、MORPHは強力なベースラインと最近の最先端モデルにマッチするか、超えている。
論文 参考訳(メタデータ) (2025-09-25T22:38:36Z) - ATLAS: Decoupling Skeletal and Shape Parameters for Expressive Parametric Human Modeling [43.66748605071065]
240個の同期カメラを用いて,600kの高分解能スキャンから得られた高忠実度ボディモデルATLASを提案する。
我々は、人間の骨格にメッシュ表現を接地することで、形状と骨格の基部を明示的に分離する。
ATLASは、未確認の被写体を多様なポーズに適合させることで既存の手法よりも優れており、定量的評価により、我々の非線形ポーズ補正が線形モデルと比較して複雑なポーズをより効果的に捉えていることが示されている。
論文 参考訳(メタデータ) (2025-08-21T17:58:56Z) - PoseGRAF: Geometric-Reinforced Adaptive Fusion for Monocular 3D Human Pose Estimation [5.223657684081615]
既存の単眼的な3次元ポーズ推定法は, 骨格の内在方向と角方向の相関性を見越しながら, 関節位置の特徴に依存している。
これらの課題に対処するためのPoseGRAFフレームワークを提案する。
Human3.6M と MPI-INF-3DHP のデータセットによる実験結果から,本手法が最先端の手法を超えることが示された。
論文 参考訳(メタデータ) (2025-06-17T14:59:56Z) - PyMAF-X: Towards Well-aligned Full-body Model Regression from Monocular
Images [60.33197938330409]
PyMAF-Xは、モノクロ画像からパラメトリックフルボディモデルを復元するための回帰ベースのアプローチである。
PyMAFとPyMAF-Xは、メッシュイメージアライメントを効果的に改善し、新しい最先端の結果を達成する。
論文 参考訳(メタデータ) (2022-07-13T17:58:33Z) - NeuroMorph: Unsupervised Shape Interpolation and Correspondence in One
Go [109.88509362837475]
入力2つの3次元形状を考慮したニューラルネットワークアーキテクチャであるNeuroMorphを提案する。
NeuroMorphはそれらの間のスムーズかつポイントツーポイント対応を生成する。
異なる対象カテゴリの非等尺性ペアを含む、さまざまな入力形状に対してうまく機能する。
論文 参考訳(メタデータ) (2021-06-17T12:25:44Z) - MotioNet: 3D Human Motion Reconstruction from Monocular Video with
Skeleton Consistency [72.82534577726334]
モノクロビデオから3次元人間の骨格の動きを直接再構成するディープニューラルネットワークであるMotioNetを紹介した。
本手法は,動作表現を完全かつ一般的に使用するキネマティックスケルトンを直接出力する最初のデータ駆動型手法である。
論文 参考訳(メタデータ) (2020-06-22T08:50:09Z) - Monocular Human Pose and Shape Reconstruction using Part Differentiable
Rendering [53.16864661460889]
近年の研究では、3次元基底真理によって教師されるディープニューラルネットワークを介してパラメトリックモデルを直接推定する回帰に基づく手法が成功している。
本稿では,ボディセグメンテーションを重要な監視対象として紹介する。
部分分割による再構成を改善するために,部分分割により部分ベースモデルを制御可能な部分レベル微分可能部を提案する。
論文 参考訳(メタデータ) (2020-03-24T14:25:46Z) - Learning Nonparametric Human Mesh Reconstruction from a Single Image
without Ground Truth Meshes [56.27436157101251]
そこで本研究では,人間のメッシュ再構築を基礎となる真理メッシュを使わずに学習する手法を提案する。
これはグラフ畳み込みニューラルネットワーク(Graph CNN)の損失関数に2つの新しい用語を導入することで実現される。
論文 参考訳(メタデータ) (2020-02-28T20:30:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。