論文の概要: VolumetricSMPL: A Neural Volumetric Body Model for Efficient Interactions, Contacts, and Collisions
- arxiv url: http://arxiv.org/abs/2506.23236v1
- Date: Sun, 29 Jun 2025 13:48:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.785443
- Title: VolumetricSMPL: A Neural Volumetric Body Model for Efficient Interactions, Contacts, and Collisions
- Title(参考訳): VolumetricSMPL: 効率的な相互作用, 接触, 衝突のための神経体積体モデル
- Authors: Marko Mihajlovic, Siwei Zhang, Gen Li, Kaifeng Zhao, Lea Müller, Siyu Tang,
- Abstract要約: パラメトリックな人体モデルはコンピュータグラフィックスと視覚において重要な役割を担い、人間の動作分析から人間と環境の相互作用を理解するためのアプリケーションを可能にする。
この制限に対処するため、最近の研究では、容積的な暗黙の身体モデルについて研究している。
本稿では,コンパクトで効率的なデコーダを生成するニューラルネットワークモデルであるVolumetricSMPLを紹介する。
- 参考スコア(独自算出の注目度): 17.542908770824596
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Parametric human body models play a crucial role in computer graphics and vision, enabling applications ranging from human motion analysis to understanding human-environment interactions. Traditionally, these models use surface meshes, which pose challenges in efficiently handling interactions with other geometric entities, such as objects and scenes, typically represented as meshes or point clouds. To address this limitation, recent research has explored volumetric neural implicit body models. However, existing works are either insufficiently robust for complex human articulations or impose high computational and memory costs, limiting their widespread use. To this end, we introduce VolumetricSMPL, a neural volumetric body model that leverages Neural Blend Weights (NBW) to generate compact, yet efficient MLP decoders. Unlike prior approaches that rely on large MLPs, NBW dynamically blends a small set of learned weight matrices using predicted shape- and pose-dependent coefficients, significantly improving computational efficiency while preserving expressiveness. VolumetricSMPL outperforms prior volumetric occupancy model COAP with 10x faster inference, 6x lower GPU memory usage, enhanced accuracy, and a Signed Distance Function (SDF) for efficient and differentiable contact modeling. We demonstrate VolumetricSMPL's strengths across four challenging tasks: (1) reconstructing human-object interactions from in-the-wild images, (2) recovering human meshes in 3D scenes from egocentric views, (3) scene-constrained motion synthesis, and (4) resolving self-intersections. Our results highlight its broad applicability and significant performance and efficiency gains.
- Abstract(参考訳): パラメトリックな人体モデルはコンピュータグラフィックスと視覚において重要な役割を担い、人間の動作分析から人間と環境の相互作用を理解するためのアプリケーションを可能にする。
従来、これらのモデルは表面メッシュを使用しており、一般的にメッシュやポイントクラウドとして表現されるオブジェクトやシーンなど、他の幾何学的エンティティとのインタラクションを効率的に処理する上で、課題となる。
この制限に対処するため、最近の研究では、容積的な暗黙の身体モデルについて研究している。
しかし、既存の作品は複雑な人間の調音には不十分なほど堅牢であるか、高い計算コストとメモリコストを課し、その使用を制限している。
そこで我々は,NBW(Neural Blend Weights)を利用して,コンパクトかつ効率的なMPPデコーダを生成する,ニューラルボリュームボディモデルであるVolumetricSMPLを紹介する。
大規模なMLPに依存する従来のアプローチとは異なり、NBWは予測された形状とポーズ依存係数を用いて学習された重量行列の小さなセットを動的にブレンドし、表現性を維持しながら計算効率を著しく向上させる。
VolumetricSMPLは、10倍高速な推論、GPUメモリ使用量の6倍の削減、精度の向上、および効率的で微分可能なコンタクトモデリングのための符号付き距離関数(Signed Distance Function, SDF)で、以前のボリューム占有モデルCOAPより優れている。
本研究では,(1)人間と物体の相互作用の再構築,(2)自己中心的な視点から3次元のメッシュを復元すること,(3)シーン制約されたモーション合成,(4)自己断面積の解消の4つの課題にまたがって,VolumetricSMPLの強みを実証する。
我々の結果は、その広範囲な適用性と、パフォーマンスと効率性の向上を強調します。
関連論文リスト
- 3HANDS Dataset: Learning from Humans for Generating Naturalistic Handovers with Supernumerary Robotic Limbs [64.99122701615151]
スーパー数式ロボットアーム(英: Supernumerary Robotics limbs、SRL)は、ユーザーの身体と密に統合されたロボット構造である。
3HANDSは,日常活動を行う参加者と,ヒップマウントSRLを自然な方法で実施する参加者との間の,オブジェクトハンドオーバインタラクションの新たなデータセットである。
本稿では,自然なハンドオーバ軌跡を生成する3つのモデル,適切なハンドオーバエンドポイントを決定する1つのモデル,ハンドオーバ開始のタイミングを予測する3つのモデルを提案する。
論文 参考訳(メタデータ) (2025-03-06T17:23:55Z) - NanoHTNet: Nano Human Topology Network for Efficient 3D Human Pose Estimation [24.059039655555807]
3次元人間のポーズ推定(HPE)は、リソース制約されたエッジデバイスによって制限される。
そこで我々は,NanoHTNet(Nano Human Topology Network)を提案する。
また、プロキシタスクにおける多様な視点から2Dのポーズを調整するためにPoseCLRを提案する。
論文 参考訳(メタデータ) (2025-01-27T04:16:42Z) - LLMPhy: Complex Physical Reasoning Using Large Language Models and World Models [35.01842161084472]
そこで我々は,TraySimという物理推論タスクとデータセットを提案する。
私たちのタスクは、外部の影響を受けるトレイ上のいくつかのオブジェクトのダイナミクスを予測することです。
LLMの物理知識とプログラム合成能力を活用するゼロショットブラックボックス最適化フレームワークであるLLMPhyを提案する。
この結果から,LLMと物理エンジンの組み合わせにより,最先端のゼロショット物理推論性能が得られることがわかった。
論文 参考訳(メタデータ) (2024-11-12T18:56:58Z) - Scaling Up Dynamic Human-Scene Interaction Modeling [58.032368564071895]
TRUMANSは、現在利用可能な最も包括的なモーションキャプチャーHSIデータセットである。
人体全体の動きや部分レベルの物体の動きを複雑に捉えます。
本研究では,任意の長さのHSI配列を効率的に生成する拡散型自己回帰モデルを提案する。
論文 参考訳(メタデータ) (2024-03-13T15:45:04Z) - Learn to Predict How Humans Manipulate Large-sized Objects from
Interactive Motions [82.90906153293585]
本稿では,動きデータと動的記述子を融合させるグラフニューラルネットワークHO-GCNを提案する。
動的記述子を消費するネットワークは、最先端の予測結果が得られ、未確認オブジェクトへのネットワークの一般化に役立つことを示す。
論文 参考訳(メタデータ) (2022-06-25T09:55:39Z) - NeuralFusion: Neural Volumetric Rendering under Human-object
Interactions [46.70371238621842]
本稿では,スパース・コンシューマRGBDセンサを用いたボリューム・オブジェクトのキャプチャとレンダリングのためのニューラル・アプローチを提案する。
幾何学的モデリングでは,非剛性鍵体積融合を用いたニューラル暗黙的推論方式を提案する。
また,空間的領域と時間的領域の両方において,ボリュームと画像に基づくレンダリングを組み合わせた階層的ヒューマンオブジェクトテクスチャレンダリング手法を提案する。
論文 参考訳(メタデータ) (2022-02-25T17:10:07Z) - LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human
Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。
完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。
我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文 参考訳(メタデータ) (2021-11-30T04:10:57Z) - RobustFusion: Robust Volumetric Performance Reconstruction under
Human-object Interactions from Monocular RGBD Stream [27.600873320989276]
現実のシナリオでは、さまざまなオブジェクトと複雑な相互作用を持つ人間のパフォーマンスの高品質の4D再構築が不可欠です。
近年の進歩は、信頼性の高い性能回復には至っていない。
人間と物体のインタラクションシナリオのための堅牢なボリュームパフォーマンス再構築システムであるRobustFusionを提案する。
論文 参考訳(メタデータ) (2021-04-30T08:41:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。