論文の概要: Human Body Model Fitting by Learned Gradient Descent
- arxiv url: http://arxiv.org/abs/2008.08474v1
- Date: Wed, 19 Aug 2020 14:26:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 12:09:11.273906
- Title: Human Body Model Fitting by Learned Gradient Descent
- Title(参考訳): 学習したグラディエントDescentによる人体モデルフィッティング
- Authors: Jie Song, Xu Chen, Otmar Hilliges
- Abstract要約: 画像に3次元の人体形状を適合させる新しいアルゴリズムを提案する。
このアルゴリズムは高速(約120ms収束)で、データセットに頑健であり、公開評価データセットの最先端結果が得られることを示す。
- 参考スコア(独自算出の注目度): 48.79414884222403
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel algorithm for the fitting of 3D human shape to images.
Combining the accuracy and refinement capabilities of iterative gradient-based
optimization techniques with the robustness of deep neural networks, we propose
a gradient descent algorithm that leverages a neural network to predict the
parameter update rule for each iteration. This per-parameter and state-aware
update guides the optimizer towards a good solution in very few steps,
converging in typically few steps. During training our approach only requires
MoCap data of human poses, parametrized via SMPL. From this data the network
learns a subspace of valid poses and shapes in which optimization is performed
much more efficiently. The approach does not require any hard to acquire
image-to-3D correspondences. At test time we only optimize the 2D joint
re-projection error without the need for any further priors or regularization
terms. We show empirically that this algorithm is fast (avg. 120ms
convergence), robust to initialization and dataset, and achieves
state-of-the-art results on public evaluation datasets including the
challenging 3DPW in-the-wild benchmark (improvement over SMPLify 45%) and also
approaches using image-to-3D correspondences
- Abstract(参考訳): 画像に3次元の人体形状を適合させる新しいアルゴリズムを提案する。
繰り返し勾配に基づく最適化手法の精度と改善能力と、深層ニューラルネットワークの堅牢性を組み合わせることで、ニューラルネットワークを利用して各イテレーションのパラメータ更新ルールを予測する勾配降下アルゴリズムを提案する。
このパラメータごとの更新と状態認識の更新は、最適化をいくつかのステップで良いソリューションへと導く。
トレーニング中、我々のアプローチはSMPLを介してパラメータ化された人間のポーズのMoCapデータのみを必要とする。
このデータからネットワークは、最適化がより効率的に実行される有効なポーズと形状のサブスペースを学習する。
このアプローチでは、画像から3D対応を取得するのが困難ではない。
テスト時には、さらなる事前条件や正規化条件を必要とせずに、2次元の関節再投射誤差を最適化するだけです。
このアルゴリズムは高速(約120ms収束)で、初期化とデータセットに頑健であり、挑戦的な3DPW in-theldベンチマーク(SMPLify 45%)や画像から3D対応を用いたアプローチを含む、公開評価データセットの最先端結果を得る。
関連論文リスト
- A Construct-Optimize Approach to Sparse View Synthesis without Camera Pose [44.13819148680788]
カメラポーズを伴わないスパースビュー合成のための新しい構成と最適化手法を開発した。
具体的には、単分子深度と画素を3次元の世界に投影することで、解を構築する。
タンク・アンド・テンプル・アンド・スタティック・ハイクスのデータセットに3つの広い範囲のビューで結果を示す。
論文 参考訳(メタデータ) (2024-05-06T17:36:44Z) - Learned Vertex Descent: A New Direction for 3D Human Model Fitting [64.04726230507258]
画像やスキャンに適合する3次元人体モデルのための新しい最適化手法を提案する。
われわれのアプローチは、非常に異なる体型を持つ服を着た人々の基盤となる身体を捉えることができ、最先端技術と比べて大きな改善を達成できる。
LVDはまた、人間と手の3次元モデル適合にも適用でき、よりシンプルで高速な方法でSOTAに大きな改善が示される。
論文 参考訳(メタデータ) (2022-05-12T17:55:51Z) - Adversarial Parametric Pose Prior [106.12437086990853]
我々は、SMPLパラメータを現実的なポーズを生成する値に制限する事前学習を行う。
得られた先行学習は実データ分布の多様性をカバーし、2次元キーポイントからの3次元再構成の最適化を容易にし、画像からの回帰に使用する場合のポーズ推定精度を向上することを示す。
論文 参考訳(メタデータ) (2021-12-08T10:05:32Z) - Learning to Fit Morphable Models [12.469605679847085]
学習最適化の最近の進歩の上に構築し、古典的なレバンス・マルカルトアルゴリズムに触発された更新ルールを提案する。
本稿では,頭部装着装置による3次元体表面推定問題と2次元ランドマークによる顔の嵌合性に対するニューラルネットワークの有効性を示す。
論文 参考訳(メタデータ) (2021-11-29T18:59:53Z) - Multi-scale Neural ODEs for 3D Medical Image Registration [7.715565365558909]
医用画像解析において画像登録は重要な役割を担っている。
ラーニング・トゥ・マップのような深層学習手法はより高速であるが、大きな動きを扱うための精度を改善するために反復的あるいは粗大なアプローチが必要である。
本研究では,マルチスケールのニューラルODEモデルを用いて登録を学習することを提案する。
論文 参考訳(メタデータ) (2021-06-16T00:26:53Z) - Exploiting Adam-like Optimization Algorithms to Improve the Performance
of Convolutional Neural Networks [82.61182037130405]
勾配降下(SGD)は深いネットワークを訓練するための主要なアプローチです。
本研究では,現在と過去の勾配の違いに基づいて,Adamに基づく変分を比較する。
resnet50を勾配降下訓練したネットワークのアンサンブルと融合実験を行った。
論文 参考訳(メタデータ) (2021-03-26T18:55:08Z) - Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。
しかし、その推測時間は一般的に540p画像の秒数で遅い。
本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文 参考訳(メタデータ) (2020-12-01T23:58:16Z) - SSP-Net: Scalable Sequential Pyramid Networks for Real-Time 3D Human
Pose Regression [27.85790535227085]
高速でスケーラブルな畳み込みニューラルネットワークを,静止RGB画像からのリアルタイムな3次元ポーズ回帰のために提案する。
我々のネットワークは1つのトレーニング手順を必要とし、最高の予測を毎秒120フレームで作成することができる。
論文 参考訳(メタデータ) (2020-09-04T03:43:24Z) - Neural Descent for Visual 3D Human Pose and Shape [67.01050349629053]
入力RGB画像から3次元のポーズと形状を復元するディープニューラルネットワーク手法を提案する。
我々は最近導入された表現力のあるボディ統計モデルGHUMに頼っている。
我々の方法論の中心は、HUmanNeural Descent (HUND)と呼ばれるアプローチの学習と最適化である。
論文 参考訳(メタデータ) (2020-08-16T13:38:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。