論文の概要: Neural Descent for Visual 3D Human Pose and Shape
- arxiv url: http://arxiv.org/abs/2008.06910v2
- Date: Mon, 14 Jun 2021 09:10:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 11:39:52.552595
- Title: Neural Descent for Visual 3D Human Pose and Shape
- Title(参考訳): 視覚3次元ポーズと形状のための神経降下
- Authors: Andrei Zanfir, Eduard Gabriel Bazavan, Mihai Zanfir, William T.
Freeman, Rahul Sukthankar, Cristian Sminchisescu
- Abstract要約: 入力RGB画像から3次元のポーズと形状を復元するディープニューラルネットワーク手法を提案する。
我々は最近導入された表現力のあるボディ統計モデルGHUMに頼っている。
我々の方法論の中心は、HUmanNeural Descent (HUND)と呼ばれるアプローチの学習と最適化である。
- 参考スコア(独自算出の注目度): 67.01050349629053
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present deep neural network methodology to reconstruct the 3d pose and
shape of people, given an input RGB image. We rely on a recently introduced,
expressivefull body statistical 3d human model, GHUM, trained end-to-end, and
learn to reconstruct its pose and shape state in a self-supervised regime.
Central to our methodology, is a learning to learn and optimize approach,
referred to as HUmanNeural Descent (HUND), which avoids both second-order
differentiation when training the model parameters,and expensive state gradient
descent in order to accurately minimize a semantic differentiable rendering
loss at test time. Instead, we rely on novel recurrent stages to update the
pose and shape parameters such that not only losses are minimized effectively,
but the process is meta-regularized in order to ensure end-progress. HUND's
symmetry between training and testing makes it the first 3d human sensing
architecture to natively support different operating regimes including
self-supervised ones. In diverse tests, we show that HUND achieves very
competitive results in datasets like H3.6M and 3DPW, aswell as good quality 3d
reconstructions for complex imagery collected in-the-wild.
- Abstract(参考訳): 本稿では,入力rgb画像から3次元ポーズと形状を再構成する深層ニューラルネットワーク手法を提案する。
最近紹介された、表現力に富んだ身体統計3d人体モデル「ghum」に基づき、自己監督体制でそのポーズと形状状態を再構築することを学ぶ。
提案手法の中心となるのは,HUmanNeural Descent (HUND) と呼ばれるアプローチの学習と最適化である。これは,モデルパラメータをトレーニングする際の2次微分と,テスト時の意味的微分可能なレンダリング損失を正確に最小化するために,高価な状態勾配勾配の両方を回避する。
代わりに、ポーズや形状パラメータを更新するために新しいリカレントステージに依存し、損失が効果的に最小化されるだけでなく、エンドプログレッシブを保証するためにプロセスがメタレギュラライズされる。
HUNDのトレーニングとテストの対称性は、自己管理されたものを含むさまざまなオペレーティングシステムをネイティブにサポートする最初の3Dヒューマンセンシングアーキテクチャである。
多様なテストにおいて、HUNDはH3.6Mや3DPWのようなデータセットで非常に競争力のある結果を得ることを示した。
関連論文リスト
- 3D Facial Expressions through Analysis-by-Neural-Synthesis [30.2749903946587]
SMIRK(Spatial Modeling for Image-based Reconstruction of Kinesics)は、画像から表現力のある3次元顔を忠実に再構築する。
既存の手法では,自己指導型トレーニングの定式化における欠点と,訓練画像における表現の多様性の欠如の2つの重要な限界を識別する。
我々の質的,定量的,特に知覚的評価は、SMIRKが正確な表現再構成における新しい最先端技術を実現することを証明している。
論文 参考訳(メタデータ) (2024-04-05T14:00:07Z) - 3D-Aware Neural Body Fitting for Occlusion Robust 3D Human Pose
Estimation [28.24765523800196]
本研究では,3次元ポーズ推定のための3次元認識型ニューラルボディフィッティング(3DNBF)を提案する。
特に,3次元ポーズ依存特徴ベクトルを出力するガウス楕円体カーネルを用いた人間の体積表現に基づく深部特徴の生成モデルを提案する。
ニューラル特徴は、対照的な学習で訓練され、3D認識となり、2D-3D曖昧さを克服する。
論文 参考訳(メタデータ) (2023-08-19T22:41:00Z) - Deformable Model-Driven Neural Rendering for High-Fidelity 3D
Reconstruction of Human Heads Under Low-View Settings [20.07788905506271]
低視点で3Dの頭部を再構築することは技術的な課題を呈する。
幾何学的分解を提案し、2段階の粗大なトレーニング戦略を採用する。
提案手法は,低視野環境下での再現精度と新規ビュー合成の観点から,既存のニューラルレンダリング手法より優れる。
論文 参考訳(メタデータ) (2023-03-24T08:32:00Z) - RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects [68.85305626324694]
カメラ空間における光マーチング (RiCS) は、3次元における前景物体の自己閉塞を2次元の自己閉塞マップに表現する新しい手法である。
表現マップは画像の質を高めるだけでなく,時間的コヒーレントな複雑な影効果をモデル化できることを示す。
論文 参考訳(メタデータ) (2022-05-14T05:35:35Z) - Learned Vertex Descent: A New Direction for 3D Human Model Fitting [64.04726230507258]
画像やスキャンに適合する3次元人体モデルのための新しい最適化手法を提案する。
われわれのアプローチは、非常に異なる体型を持つ服を着た人々の基盤となる身体を捉えることができ、最先端技術と比べて大きな改善を達成できる。
LVDはまた、人間と手の3次元モデル適合にも適用でき、よりシンプルで高速な方法でSOTAに大きな改善が示される。
論文 参考訳(メタデータ) (2022-05-12T17:55:51Z) - NeuralReshaper: Single-image Human-body Retouching with Deep Neural
Networks [50.40798258968408]
本稿では,深部生成ネットワークを用いた単一画像における人体の意味的再構成手法であるNeuralReshaperを提案する。
われわれのアプローチは、まずパラメトリックな3次元人間モデルと元の人間の画像とを適合させるフィッティング・セイン・リフォーム・パイプラインに従う。
ペアデータが存在しないデータ不足に対処するために,ネットワークをトレーニングするための新たな自己教師型戦略を導入する。
論文 参考訳(メタデータ) (2022-03-20T09:02:13Z) - LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human
Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。
完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。
我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文 参考訳(メタデータ) (2021-11-30T04:10:57Z) - THUNDR: Transformer-based 3D HUmaN Reconstruction with Markers [67.8628917474705]
THUNDRは、人の3Dポーズと形状を再構築するトランスフォーマーベースのディープニューラルネットワーク手法である。
完全教師付きモデルと自己教師型モデルの両方に対して,Human3.6Mと3DPWの最先端結果を示す。
野生で収集された難易度の高い人間のポーズに対して, 非常に堅固な3次元再構成性能を観察した。
論文 参考訳(メタデータ) (2021-06-17T09:09:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。