論文の概要: NIKI: Neural Inverse Kinematics with Invertible Neural Networks for 3D
Human Pose and Shape Estimation
- arxiv url: http://arxiv.org/abs/2305.08590v1
- Date: Mon, 15 May 2023 12:13:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 14:46:18.428432
- Title: NIKI: Neural Inverse Kinematics with Invertible Neural Networks for 3D
Human Pose and Shape Estimation
- Title(参考訳): niki:3次元ポーズと形状推定のための可逆ニューラルネットワークを用いたニューラル逆運動学
- Authors: Jiefeng Li, Siyuan Bian, Qi Liu, Jiasheng Tang, Fan Wang, Cewu Lu
- Abstract要約: 両方向誤差をモデル化したNIKI(Neural Inverse Kinematics with Invertible Neural Network)を提案する。
NIKIは、非可逆ネットワークによる前処理と逆処理の両方から学習することができる。
- 参考スコア(独自算出の注目度): 53.25973084799954
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the progress of 3D human pose and shape estimation, state-of-the-art
methods can either be robust to occlusions or obtain pixel-aligned accuracy in
non-occlusion cases. However, they cannot obtain robustness and mesh-image
alignment at the same time. In this work, we present NIKI (Neural Inverse
Kinematics with Invertible Neural Network), which models bi-directional errors
to improve the robustness to occlusions and obtain pixel-aligned accuracy. NIKI
can learn from both the forward and inverse processes with invertible networks.
In the inverse process, the model separates the error from the plausible 3D
pose manifold for a robust 3D human pose estimation. In the forward process, we
enforce the zero-error boundary conditions to improve the sensitivity to
reliable joint positions for better mesh-image alignment. Furthermore, NIKI
emulates the analytical inverse kinematics algorithms with the twist-and-swing
decomposition for better interpretability. Experiments on standard and
occlusion-specific benchmarks demonstrate the effectiveness of NIKI, where we
exhibit robust and well-aligned results simultaneously. Code is available at
https://github.com/Jeff-sjtu/NIKI
- Abstract(参考訳): 人間の3Dポーズと形状推定の進歩により、最先端の手法は閉塞に対して堅牢であるか、非閉塞の場合の画素アライメントの精度を得ることができる。
しかし、堅牢性とメッシュ画像アライメントを同時に得ることはできない。
本研究では,2方向誤差をモデル化し,オクルージョンに対するロバスト性を改善し,画素整合精度を得るNIKI(Neural Inverse Kinematics with Invertible Neural Network)を提案する。
NIKIは、非可逆ネットワークによる前処理と逆処理の両方から学習することができる。
逆過程において、モデルは、ロバストな3次元ポーズ推定のために、可塑性3次元ポーズ多様体から誤差を分離する。
前方プロセスでは, メッシュ画像アライメントを改善するために, 信頼性の高い関節位置の感度を向上させるために, ゼロエラー境界条件を強制する。
さらに、NIKIは解析的逆キネマティクスアルゴリズムをツイスト・アンド・スウィング分解でエミュレートし、解釈性を向上させる。
標準および咬合特異的ベンチマーク実験により,nikiの有効性が示され,ロバストかつ整列した結果が同時に得られた。
コードはhttps://github.com/Jeff-sjtu/NIKIで入手できる。
関連論文リスト
- No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.80376573969045]
NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。
提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。
この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:58:22Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - SCIPaD: Incorporating Spatial Clues into Unsupervised Pose-Depth Joint Learning [17.99904937160487]
本研究では,教師なし深層学習のための空間的手がかりを取り入れた新しいアプローチであるSCIPaDを紹介する。
SCIPaDは平均翻訳誤差22.2%、カメラポーズ推定タスクの平均角誤差34.8%をKITTI Odometryデータセットで達成している。
論文 参考訳(メタデータ) (2024-07-07T06:52:51Z) - iComMa: Inverting 3D Gaussian Splatting for Camera Pose Estimation via Comparing and Matching [14.737266480464156]
コンピュータビジョンにおける6次元カメラのポーズ推定問題に対処するため,iComMaという手法を提案する。
3次元ガウススプラッティング(3DGS)の反転による高精度カメラポーズ推定法を提案する。
論文 参考訳(メタデータ) (2023-12-14T15:31:33Z) - 3D-Aware Neural Body Fitting for Occlusion Robust 3D Human Pose
Estimation [28.24765523800196]
本研究では,3次元ポーズ推定のための3次元認識型ニューラルボディフィッティング(3DNBF)を提案する。
特に,3次元ポーズ依存特徴ベクトルを出力するガウス楕円体カーネルを用いた人間の体積表現に基づく深部特徴の生成モデルを提案する。
ニューラル特徴は、対照的な学習で訓練され、3D認識となり、2D-3D曖昧さを克服する。
論文 参考訳(メタデータ) (2023-08-19T22:41:00Z) - MoDA: Modeling Deformable 3D Objects from Casual Videos [84.29654142118018]
神経二元四元系ブレンドスキンニング(NeuDBS)を提案し,スキンを折り畳むことなく3次元点変形を実現する。
異なるフレーム間で2Dピクセルを登録する試みにおいて、標準空間内の3D点を符号化する標準特徴埋め込みの対応性を確立する。
本手法は,ヒトと動物の3Dモデルを,最先端の手法よりも質的,定量的な性能で再構築することができる。
論文 参考訳(メタデータ) (2023-04-17T13:49:04Z) - RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust
Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。
この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。
各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文 参考訳(メタデータ) (2022-03-24T06:24:55Z) - OcclusionFusion: Occlusion-aware Motion Estimation for Real-time Dynamic
3D Reconstruction [14.130915525776055]
RGBDに基づくリアルタイム動的3次元再構成は、フレーム間運動推定の不正確さに悩まされる。
オクルージョンフュージョン(OcclusionFusion, OcclusionFusion)は、オクルージョンを意識した3次元運動を計算し、再構成を誘導する手法である。
本手法は,既存の単一ビューベースリアルタイム手法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2022-03-15T15:09:01Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Neural Monocular 3D Human Motion Capture with Physical Awareness [76.55971509794598]
物理的に可塑性なマーカーレス3次元モーションキャプチャのための新しいトレーニングシステムを提案する。
人間のモーションキャプチャのためのほとんどのニューラルな手法とは異なり、我々のアプローチは物理的および環境的な制約を認識している。
様々な場面でインタラクティブなフレームレートで、滑らかで物理的に原理化された3dモーションを生成する。
論文 参考訳(メタデータ) (2021-05-03T17:57:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。