論文の概要: Representation learning of vertex heatmaps for 3D human mesh
reconstruction from multi-view images
- arxiv url: http://arxiv.org/abs/2306.16615v1
- Date: Thu, 29 Jun 2023 01:16:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-30 15:18:22.778137
- Title: Representation learning of vertex heatmaps for 3D human mesh
reconstruction from multi-view images
- Title(参考訳): 多視点画像を用いた3次元メッシュ再構築のための頂点熱マップの表現学習
- Authors: Sungho Chun, Sungbum Park, Ju Yong Chang
- Abstract要約: 本稿では,オートエンコーダを用いたヒートマップの表現学習が,そのような手法の性能向上に役立つことを示す。
提案手法は,従来の手法より優れ,最先端のヒューマンメッシュ再構築性能を実現する。
- 参考スコア(独自算出の注目度): 6.699132260402631
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study addresses the problem of 3D human mesh reconstruction from
multi-view images. Recently, approaches that directly estimate the skinned
multi-person linear model (SMPL)-based human mesh vertices based on volumetric
heatmap representation from input images have shown good performance. We show
that representation learning of vertex heatmaps using an autoencoder helps
improve the performance of such approaches. Vertex heatmap autoencoder (VHA)
learns the manifold of plausible human meshes in the form of latent codes using
AMASS, which is a large-scale motion capture dataset. Body code predictor (BCP)
utilizes the learned body prior from VHA for human mesh reconstruction from
multi-view images through latent code-based supervision and transfer of
pretrained weights. According to experiments on Human3.6M and LightStage
datasets, the proposed method outperforms previous methods and achieves
state-of-the-art human mesh reconstruction performance.
- Abstract(参考訳): 本研究では,マルチビュー画像からの3次元メッシュ再構成の問題に対処する。
近年,入力画像からの体積熱マップ表現に基づくスキン付き多人線形モデル(SMPL)に基づくヒューマンメッシュ頂点を直接推定する手法の性能が向上した。
オートエンコーダを用いた頂点ヒートマップの表現学習は,このような手法の性能向上に役立つことを示す。
Vertex Heatmap Autoencoder (VHA)は、大規模モーションキャプチャーデータセットであるAMASSを用いて、潜時符号の形で可塑性人間のメッシュの多様体を学習する。
ボディコード予測器(BCP)は、VHAに先立つ学習体を用いて、遅延コードに基づく監督と事前訓練された重みの移動を通じて、多視点画像から人間のメッシュ再構築を行う。
Human3.6MとLightStageデータセットの実験によると、提案手法は従来の手法より優れ、最先端のヒューマンメッシュ再構築性能を実現する。
関連論文リスト
- Fine-Grained Multi-View Hand Reconstruction Using Inverse Rendering [11.228453237603834]
本稿では,逆レンダリングを利用して手ポーズを復元し,詳細を複雑化する多視点ハンドメッシュ再構成手法を提案する。
また、ハンドメッシュとテクスチャの両方を洗練させるために、新しいハンドアルベドとメッシュ(HAM)最適化モジュールも導入した。
提案手法は,再現精度とレンダリング品質の両面において,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2024-07-08T07:28:24Z) - HR Human: Modeling Human Avatars with Triangular Mesh and High-Resolution Textures from Videos [52.23323966700072]
本研究では,モノクロ映像から高精細な物理材料テクスチャとメッシュを付加したアバターの取得のための枠組みを提案する。
本手法では,モノクロ映像からの情報を組み合わせて仮想多視点画像の合成を行う新しい情報融合方式を提案する。
実験により, 提案手法は, 高忠実度で従来の表現よりも優れており, この明示的な結果は共通三角形への展開をサポートすることが示された。
論文 参考訳(メタデータ) (2024-05-18T11:49:09Z) - Personalized 3D Human Pose and Shape Refinement [19.082329060985455]
回帰に基づく手法は3次元人間のポーズと形状推定の分野を支配してきた。
本稿では,初期人間のモデル推定値と対応する画像との密接な対応性を構築することを提案する。
提案手法は画像モデルアライメントの改善だけでなく,3次元精度の向上にも寄与する。
論文 参考訳(メタデータ) (2024-03-18T10:13:53Z) - Learned Vertex Descent: A New Direction for 3D Human Model Fitting [64.04726230507258]
画像やスキャンに適合する3次元人体モデルのための新しい最適化手法を提案する。
われわれのアプローチは、非常に異なる体型を持つ服を着た人々の基盤となる身体を捉えることができ、最先端技術と比べて大きな改善を達成できる。
LVDはまた、人間と手の3次元モデル適合にも適用でき、よりシンプルで高速な方法でSOTAに大きな改善が示される。
論文 参考訳(メタデータ) (2022-05-12T17:55:51Z) - Pixel2Mesh++: 3D Mesh Generation and Refinement from Multi-View Images [82.32776379815712]
カメラポーズの有無にかかわらず、少数のカラー画像から3次元メッシュ表現における形状生成の問題について検討する。
我々は,グラフ畳み込みネットワークを用いたクロスビュー情報を活用することにより,形状品質をさらに向上する。
我々のモデルは初期メッシュの品質とカメラポーズの誤差に頑健であり、テスト時間最適化のための微分関数と組み合わせることができる。
論文 参考訳(メタデータ) (2022-04-21T03:42:31Z) - Implicit Neural Deformation for Multi-View Face Reconstruction [43.88676778013593]
マルチビューRGB画像から新しい3次元顔再構成法を提案する。
従来の3次元形態素モデルに基づく手法とは異なり,本手法は暗黙の表現を利用してリッチな幾何学的特徴を符号化する。
いくつかのベンチマークデータセットに対する実験結果から,提案手法は代替ベースラインよりも優れ,最先端の手法に比べて優れた顔再構成結果が得られることが示された。
論文 参考訳(メタデータ) (2021-12-05T07:02:53Z) - Direct Multi-view Multi-person 3D Pose Estimation [138.48139701871213]
マルチビュー画像からマルチパーソン3Dポーズを推定するためのMulti-view Pose Transformer(MvP)を提案する。
MvPは、中間タスクに頼ることなく、複数の人物の3Dポーズを直接クリーンで効率的な方法で回帰する。
我々は,MvPモデルがより効率的でありながら,いくつかのベンチマークにおいて最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-07T13:09:20Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - 3D Human Pose and Shape Regression with Pyramidal Mesh Alignment
Feedback Loop [128.07841893637337]
回帰に基づく手法は最近、単眼画像からヒトのメッシュを再構成する有望な結果を示した。
パラメータの小さな偏差は、推定メッシュと画像のエビデンスの間に顕著な不一致を引き起こす可能性がある。
本稿では,特徴ピラミッドを活用し,予測パラメータを補正するために,ピラミッドメッシュアライメントフィードバック(pymaf)ループを提案する。
論文 参考訳(メタデータ) (2021-03-30T17:07:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。