論文の概要: IKOL: Inverse kinematics optimization layer for 3D human pose and shape
estimation via Gauss-Newton differentiation
- arxiv url: http://arxiv.org/abs/2302.01058v1
- Date: Thu, 2 Feb 2023 12:43:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-03 14:01:41.342985
- Title: IKOL: Inverse kinematics optimization layer for 3D human pose and shape
estimation via Gauss-Newton differentiation
- Title(参考訳): IKOL:3次元ポーズのための逆運動学最適化層とガウスニュートン微分による形状推定
- Authors: Juze Zhang, Ye Shi, Ye Shi, Lan Xu, Jingyi Yu, Jingya Wang
- Abstract要約: 本稿では3次元ポーズ形状推定のための逆運動層(IKOL)を提案する。
IKOLは、既存の回帰ベースのメソッドよりもはるかに多い。
より正確な3Dポーズ推定を提供する。
- 参考スコア(独自算出の注目度): 44.00115413716392
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents an inverse kinematic optimization layer (IKOL) for 3D
human pose and shape estimation that leverages the strength of both
optimization- and regression-based methods within an end-to-end framework. IKOL
involves a nonconvex optimization that establishes an implicit mapping from an
image's 3D keypoints and body shapes to the relative body-part rotations. The
3D keypoints and the body shapes are the inputs and the relative body-part
rotations are the solutions. However, this procedure is implicit and hard to
make differentiable. So, to overcome this issue, we designed a Gauss-Newton
differentiation (GN-Diff) procedure to differentiate IKOL. GN-Diff iteratively
linearizes the nonconvex objective function to obtain Gauss-Newton directions
with closed form solutions. Then, an automatic differentiation procedure is
directly applied to generate a Jacobian matrix for end-to-end training.
Notably, the GN-Diff procedure works fast because it does not rely on a
time-consuming implicit differentiation procedure. The twist rotation and shape
parameters are learned from the neural networks and, as a result, IKOL has a
much lower computational overhead than most existing optimization-based
methods. Additionally, compared to existing regression-based methods, IKOL
provides a more accurate mesh-image correspondence. This is because it
iteratively reduces the distance between the keypoints and also enhances the
reliability of the pose structures. Extensive experiments demonstrate the
superiority of our proposed framework over a wide range of 3D human pose and
shape estimation methods.
- Abstract(参考訳): 本稿では, エンドツーエンドフレームワークにおける最適化手法と回帰手法の両方の長所を生かした3次元人間のポーズと形状推定のための逆キネマティック最適化層(IKOL)を提案する。
IKOLは、画像の3Dキーポイントとボディ形状から相対的なボディ部分回転への暗黙のマッピングを確立する非凸最適化を含む。
3Dキーポイントとボディ形状は入力であり、相対的なボディ部分回転は解である。
しかし、この手順は暗黙的であり、差別化が難しい。
そこで我々は, ikol を識別するための gauss-newton differentiation (gn-diff) 法を考案した。
GN-ディフは非凸目的関数を反復線型化し、閉形式解を持つガウス-ニュートン方向を得る。
次に、エンドツーエンドトレーニングのためのヤコビ行列を生成するために、自動微分手順を直接適用する。
特にgn-diffプロシージャは、時間を要する暗黙的な微分手順に依存しないため、高速に動作する。
ツイストローテーションと形状パラメータはニューラルネットワークから学習され、その結果、IKOLは既存の最適化手法よりも計算オーバーヘッドがはるかに小さい。
さらに、既存の回帰ベースの手法と比較して、IKOLはより正確なメッシュイメージ対応を提供する。
これはキーポイント間の距離を反復的に削減し、またポーズ構造の信頼性を高めるためである。
広範な実験により, 提案手法が, 幅広い3次元ポーズおよび形状推定法において優れていることを実証した。
関連論文リスト
- 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - Fast-SNARF: A Fast Deformer for Articulated Neural Fields [92.68788512596254]
本稿では,標準空間とポーズ空間の正確な対応性を求める,ニューラルフィールドのための新しい調音モジュールFast-SNARFを提案する。
Fast-SNARFはこれまでの研究であるSNARFの代替であり、計算効率は大幅に向上した。
変形マップの学習は多くの3次元人間のアバター法において重要な要素であるため、この研究は3次元仮想人間の実現に向けた重要なステップであると考えている。
論文 参考訳(メタデータ) (2022-11-28T17:55:34Z) - PLIKS: A Pseudo-Linear Inverse Kinematic Solver for 3D Human Body
Estimation [10.50175010474078]
1枚の2次元画像から人体の3次元メッシュを再構築するためのPLIKSを提案する。
PLIKSはパラメトリックSMPLモデルの線形化された定式化に基づいている。
PLIKSは10%以上の精度で再現可能であることを確認した。
論文 参考訳(メタデータ) (2022-11-21T18:54:12Z) - Learned Vertex Descent: A New Direction for 3D Human Model Fitting [64.04726230507258]
画像やスキャンに適合する3次元人体モデルのための新しい最適化手法を提案する。
われわれのアプローチは、非常に異なる体型を持つ服を着た人々の基盤となる身体を捉えることができ、最先端技術と比べて大きな改善を達成できる。
LVDはまた、人間と手の3次元モデル適合にも適用でき、よりシンプルで高速な方法でSOTAに大きな改善が示される。
論文 参考訳(メタデータ) (2022-05-12T17:55:51Z) - Deep convolutional neural network for shape optimization using level-set
approach [0.0]
本稿では,深部畳み込みニューラルネットワーク(CNN)を用いた形状最適化のための低次モデリング手法を提案する。
CNNベースのリダクションオーダーモデル(ROM)は完全にデータ駆動型で構築され、非侵襲的なアプリケーションに適している。
論文 参考訳(メタデータ) (2022-01-17T04:41:51Z) - Equivalent Distance Geometry Error for Molecular Conformation Comparison [26.331322944298208]
コンフォメーション間の差分差を計算するために,等価距離幾何学誤差(EDGE)を提案する。
本手法の改良版では, 3ホップ内における原子対距離の線形変換を最小化する。
論文 参考訳(メタデータ) (2021-11-13T09:04:55Z) - Differentiable Rendering with Perturbed Optimizers [85.66675707599782]
2Dイメージプロジェクションから3Dシーンを推論することは、コンピュータビジョンにおける中核的な問題の一つだ。
我々の研究は、よく知られた微分可能な定式化とランダムなスムーズなレンダリングの関連性を強調している。
提案手法を3次元シーン再構成に適用し,その利点を6次元ポーズ推定と3次元メッシュ再構成の課題に適用した。
論文 参考訳(メタデータ) (2021-10-18T08:56:23Z) - Robust Regression via Model Based Methods [13.300549123177705]
モデルベース最適化 (MBO) [35, 36] に着想を得たアルゴリズムを提案し, 非対象を凸モデル関数に置き換える。
これをロバスト回帰に適用し、MBOの内部最適化を解くために、オンライン乗算器のオンライン交互方向法(OOADM) [50] の関数 SADM を提案する。
最後に、(a)アウトレーヤに対するl_pノルムのロバスト性、(b)オートエンコーダ法とマルチターゲット回帰法と比較して、提案したモデルベースアルゴリズムの効率性を実験的に実証した。
論文 参考訳(メタデータ) (2021-06-20T21:45:35Z) - Revitalizing Optimization for 3D Human Pose and Shape Estimation: A
Sparse Constrained Formulation [21.710205047008916]
そこで我々は,新しいスパース制約型定式化を提案し,そこから3次元人間のポーズと形状推定のリアルタイム最適化手法を導出した。
この計算は、複雑な3次元人体モデルの関節の数と線形にスケールすることを示し、より密集した非拘束的な定式化のために立方的にスケールする以前の作業とは対照的である。
本研究では,30FPS以上の1枚の画像から3次元の人間のポーズと形状を推定するリアルタイムモーションキャプチャフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-28T16:44:56Z) - Cogradient Descent for Bilinear Optimization [124.45816011848096]
双線形問題に対処するために、CoGDアルゴリズム(Cogradient Descent Algorithm)を導入する。
一方の変数は、他方の変数との結合関係を考慮し、同期勾配降下をもたらす。
本アルゴリズムは,空間的制約下での1変数の問題を解くために応用される。
論文 参考訳(メタデータ) (2020-06-16T13:41:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。