Fugu-MT 論文翻訳(概要): HuMoR: 3D Human Motion Model for Robust Pose Estimation

論文の概要: HuMoR: 3D Human Motion Model for Robust Pose Estimation

arxiv url: http://arxiv.org/abs/2105.04668v1
Date: Mon, 10 May 2021 21:04:55 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-12 14:03:30.789331
Title: HuMoR: 3D Human Motion Model for Robust Pose Estimation
Title（参考訳）: HuMoR:ロバストな姿勢推定のための3次元人体運動モデル
Authors: Davis Rempe, Tolga Birdal, Aaron Hertzmann, Jimei Yang, Srinath Sridhar, Leonidas J. Guibas
Abstract要約: HuMoRは、時間的ポーズと形状のロバスト推定のための3Dヒューマンモーションモデルです。モーションシーケンスの各ステップにおけるポーズの変化の分布を学習する条件付き変分オートエンコーダについて紹介する。本モデルが大規模モーションキャプチャーデータセットのトレーニング後に多様な動きや体型に一般化することを示す。
参考スコア（独自算出の注目度）: 100.55369985297797
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce HuMoR: a 3D Human Motion Model for Robust Estimation of temporal pose and shape. Though substantial progress has been made in estimating 3D human motion and shape from dynamic observations, recovering plausible pose sequences in the presence of noise and occlusions remains a challenge. For this purpose, we propose an expressive generative model in the form of a conditional variational autoencoder, which learns a distribution of the change in pose at each step of a motion sequence. Furthermore, we introduce a flexible optimization-based approach that leverages HuMoR as a motion prior to robustly estimate plausible pose and shape from ambiguous observations. Through extensive evaluations, we demonstrate that our model generalizes to diverse motions and body shapes after training on a large motion capture dataset, and enables motion reconstruction from multiple input modalities including 3D keypoints and RGB(-D) videos.
Abstract（参考訳）: 時間的ポーズと形状をロバストに推定する3次元人間の運動モデルであるmobiを紹介する。ダイナミックな観察から3次元の人間の動きや形状を推定する上では大きな進歩があったが、騒音や咬合の存在下での可能なポーズシーケンスの復元は依然として課題である。この目的のために,条件付き変分オートエンコーダの形式で表現的生成モデルを提案し,動き列の各ステップにおけるポーズの変化の分布を学習する。さらに,HuMoRを動作として活用したフレキシブルな最適化手法を導入し,不明瞭な観測から可視的なポーズと形状を頑健に推定する。広汎な評価により,本モデルは大規模なモーションキャプチャーデータセットのトレーニング後に多様な動きや体形に一般化し,3DキーポイントやRGB(-D)ビデオを含む複数の入力モードからの動作再構成を可能にする。

関連論文リスト

UniMo: Unifying 2D Video and 3D Human Motion with an Autoregressive Framework [54.337290937468175]
統合された枠組み内での2次元映像と3次元映像の協調モデリングのための自己回帰モデルUniMoを提案する。本手法は,正確なモーションキャプチャを行いながら,対応する映像と動きを同時に生成することを示す。
論文参考訳（メタデータ） (2025-12-03T16:03:18Z)
Geometric Neural Distance Fields for Learning Human Motion Priors [51.99890740169883]
本研究では,より頑健で時間的に整合性があり,物理的に妥当な3次元運動回復を可能にする新しい3D生成人体運動について紹介する。 AMASSデータセットをトレーニングし、NRMFは複数の入力モードにまたがって著しく一般化する。
論文参考訳（メタデータ） (2025-09-11T17:58:18Z)
GENMO: A GENeralist Model for Human MOtion [64.16188966024542]
本稿では,1つのフレームワークで動作推定と生成を橋渡しする汎用人体運動モデル GENMO を提案する。我々の重要な洞察は、出力運動が観測された条件信号を正確に満たさなければならないような制約された動き生成として運動推定を再構成することである。我々の新しいアーキテクチャは、可変長動きと混合マルチモーダル条件(テキスト、オーディオ、ビデオ)を異なる時間間隔で処理し、柔軟な制御を提供する。
論文参考訳（メタデータ） (2025-05-02T17:59:55Z)
MoManifold: Learning to Measure 3D Human Motion via Decoupled Joint Acceleration Manifolds [20.83684434910106]
我々は、連続した高次元運動空間における可塑性人間の動きをモデル化した、新しい人間の動きであるMoManifoldを提案する。具体的には、既存の限られた動きデータから人間の力学をモデル化する新しい結合加速法を提案する。大規模な実験により、MoManifoldはいくつかの下流タスクにおいて既存のSOTAよりも優れていることが示された。
論文参考訳（メタデータ） (2024-09-01T15:00:16Z)
SkelFormer: Markerless 3D Pose and Shape Estimation using Skeletal Transformers [57.46911575980854]
マルチビュー人間のポーズと形状推定のための新しいマーカーレスモーションキャプチャパイプラインであるSkelFormerを紹介する。提案手法は,まず市販の2次元キーポイント推定器を用いて,大規模インザミルドデータに基づいて事前トレーニングを行い,3次元関節位置を求める。次に、重雑音観測から、関節の位置をポーズと形状の表現にマッピングする回帰に基づく逆運動性骨格変換器を設計する。
論文参考訳（メタデータ） (2024-04-19T04:51:18Z)
Within the Dynamic Context: Inertia-aware 3D Human Modeling with Pose Sequence [47.16903508897047]
本研究では、現在のフレームのポーズ状態だけでなく、過去のポーズ状態にも人間の外観の変化が依存していることを明らかにする。非剛性変形に対するデルタポーズシーケンス表現を利用した新しい手法であるDycoを導入する。さらに, 慣性を考慮した3次元人間の手法は, 異なる速度での慣性による外観変化を前例なくシミュレートすることができる。
論文参考訳（メタデータ） (2024-03-28T06:05:14Z)
Champ: Controllable and Consistent Human Image Animation with 3D Parametric Guidance [25.346255905155424]
本稿では,潜伏拡散フレームワーク内での3次元人間のパラメトリックモデルを活用することで,人間の画像アニメーションの方法論を提案する。人間の3次元パラメトリックモデルを動作誘導として表現することにより、基準画像と音源映像の動きの間に人体のパラメトリック形状アライメントを行うことができる。提案手法は,提案した組込みデータセットに対して,より優れた一般化能力を示す。
論文参考訳（メタデータ） (2024-03-21T18:52:58Z)
GaussianAvatar: Towards Realistic Human Avatar Modeling from a Single Video via Animatable 3D Gaussians [51.46168990249278]
一つのビデオから動的に3D映像を映し出すリアルな人間のアバターを作成するための効率的なアプローチを提案する。 GustafAvatarは、公開データセットと収集データセットの両方で検証されています。
論文参考訳（メタデータ） (2023-12-04T18:55:45Z)
Unsupervised 3D Pose Estimation with Non-Rigid Structure-from-Motion Modeling [83.76377808476039]
本研究では,人間のポーズの変形をモデル化し,それに伴う拡散に基づく動きを事前に設計する手法を提案する。動作中の3次元人間の骨格を復元する作業は3次元基準骨格の推定に分割する。混合時空間NASfMformerを用いて、各フレームの3次元基準骨格と骨格変形を2次元観測シーケンスから同時に推定する。
論文参考訳（メタデータ） (2023-08-18T16:41:57Z)
Learning Motion-Dependent Appearance for High-Fidelity Rendering of Dynamic Humans from a Single Camera [49.357174195542854]
外観のダイナミクスを学ぶ上で重要な課題は、違法に大量の観測を必要とすることである。本手法は,1つの視点映像から,身体のポーズや新しいビューを時間的に協調的に生成できることを示す。
論文参考訳（メタデータ） (2022-03-24T00:22:03Z)
LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文参考訳（メタデータ） (2021-11-30T04:10:57Z)
Multi-frame sequence generator of 4D human body motion [0.0]
本稿では,翻訳と回転を含むグローバルな移動をエンコードする自動エンコーダに基づく生成フレームワークと,単一遅延空間ベクトルとしての多フレーム時間運動を提案する。本研究は,低誤差境界内でのヒト形態素の4次元配列の再構成能力について検証した。また,最初の人間のフレームから将来のフレームの4次元動作予測を行う手法の利点についても述べる。
論文参考訳（メタデータ） (2021-06-07T13:56:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。