論文の概要: FIND: An Unsupervised Implicit 3D Model of Articulated Human Feet
- arxiv url: http://arxiv.org/abs/2210.12241v1
- Date: Fri, 21 Oct 2022 20:47:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 17:11:23.563008
- Title: FIND: An Unsupervised Implicit 3D Model of Articulated Human Feet
- Title(参考訳): FIND: 人工膝関節の非教師型インシシット3Dモデル
- Authors: Oliver Boyne, James Charles, Roberto Cipolla
- Abstract要約: 我々は高忠実度3次元人足モデルを提案する。
モデルは、形状、テクスチャ、調音されたポーズという観点で、非絡み合った潜在コードによってパラメータ化される。
- 参考スコア(独自算出の注目度): 27.85606375080643
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper we present a high fidelity and articulated 3D human foot model.
The model is parameterised by a disentangled latent code in terms of shape,
texture and articulated pose. While high fidelity models are typically created
with strong supervision such as 3D keypoint correspondences or
pre-registration, we focus on the difficult case of little to no annotation. To
this end, we make the following contributions: (i) we develop a Foot Implicit
Neural Deformation field model, named FIND, capable of tailoring explicit
meshes at any resolution i.e. for low or high powered devices; (ii) an approach
for training our model in various modes of weak supervision with progressively
better disentanglement as more labels, such as pose categories, are provided;
(iii) a novel unsupervised part-based loss for fitting our model to 2D images
which is better than traditional photometric or silhouette losses; (iv)
finally, we release a new dataset of high resolution 3D human foot scans,
Foot3D. On this dataset, we show our model outperforms a strong PCA
implementation trained on the same data in terms of shape quality and part
correspondences, and that our novel unsupervised part-based loss improves
inference on images.
- Abstract(参考訳): 本稿では,高い忠実度と明瞭な3次元人足モデルを提案する。
モデルは、形状、テクスチャ、明瞭なポーズの観点で、不連続な潜在コードによってパラメータ化される。
高忠実度モデルは通常、3dキーポイント対応や事前登録といった強い監督の下で作成されますが、アノテーションがほとんどないという難しいケースに焦点を合わせます。
この目的のために、以下の貢献をしている。
(i)フットインシシット・ニューラル・フォーメーション・フィールド・モデル(FIND)を開発し、低出力または高出力のデバイスに対して任意の解像度で明確なメッシュを調整できる。
(二)ポーズカテゴリー等のラベルの増大に伴い、徐々に整合性を高めて、弱監督の様々な態様でモデルを訓練するためのアプローチ。
三 従来の測光やシルエットの損失よりも優れた2次元画像にモデルを適合させるための新規な教師なし部分的損失
(iv)最後に,高精細な3d人足スキャン,foot3dの新しいデータセットをリリースする。
このデータセットでは, モデルが同一データ上でトレーニングされた強力なPCA実装よりも, 形状品質やパート対応の点で優れており, 新規な教師なし部分ベース損失は画像の推測を改善する。
関連論文リスト
- Personalized 3D Human Pose and Shape Refinement [19.082329060985455]
回帰に基づく手法は3次元人間のポーズと形状推定の分野を支配してきた。
本稿では,初期人間のモデル推定値と対応する画像との密接な対応性を構築することを提案する。
提案手法は画像モデルアライメントの改善だけでなく,3次元精度の向上にも寄与する。
論文 参考訳(メタデータ) (2024-03-18T10:13:53Z) - ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [54.86887812687023]
ほとんどの3D-HPE法は回帰モデルに依存しており、入力と出力の1対1のマッピングを前提としている。
提案するManiPoseは,2次元入力毎に複数の候補3次元ポーズを提案可能な,新しい多様体制約型マルチハイポテーシスモデルである。
従来のマルチハイブリッドアプローチとは異なり、我々のソリューションは完全に教師付きであり、複雑な生成モデルに依存しない。
論文 参考訳(メタデータ) (2023-12-11T13:50:10Z) - IT3D: Improved Text-to-3D Generation with Explicit View Synthesis [71.68595192524843]
本研究では、これらの問題に対処するために、明示的に合成されたマルチビュー画像を活用する新しい戦略を提案する。
我々のアプローチは、高画質画像を生成するために、LCDによって強化されたイメージ・ツー・イメージ・パイプラインを活用することである。
組込み判別器では、合成したマルチビュー画像は実データと見なされ、最適化された3Dモデルのレンダリングは偽データとして機能する。
論文 参考訳(メタデータ) (2023-08-22T14:39:17Z) - Deformable Model-Driven Neural Rendering for High-Fidelity 3D
Reconstruction of Human Heads Under Low-View Settings [20.07788905506271]
低視点で3Dの頭部を再構築することは技術的な課題を呈する。
幾何学的分解を提案し、2段階の粗大なトレーニング戦略を採用する。
提案手法は,低視野環境下での再現精度と新規ビュー合成の観点から,既存のニューラルレンダリング手法より優れる。
論文 参考訳(メタデータ) (2023-03-24T08:32:00Z) - 3D Equivariant Molecular Graph Pretraining [42.957880677779556]
完全かつ新しい意味での3D分子プレトレーニングに取り組む。
まず,3次元空間の対称性を満たすことのメリットを享受する事前学習のバックボーンとして,同変エネルギーベースモデルを採用することを提案する。
大規模3DデータセットGEOM-QM9から事前学習したモデルを,MD17とQM9の2つの挑戦的な3Dベンチマークで評価した。
論文 参考訳(メタデータ) (2022-07-18T16:26:24Z) - Learned Vertex Descent: A New Direction for 3D Human Model Fitting [64.04726230507258]
画像やスキャンに適合する3次元人体モデルのための新しい最適化手法を提案する。
われわれのアプローチは、非常に異なる体型を持つ服を着た人々の基盤となる身体を捉えることができ、最先端技術と比べて大きな改善を達成できる。
LVDはまた、人間と手の3次元モデル適合にも適用でき、よりシンプルで高速な方法でSOTAに大きな改善が示される。
論文 参考訳(メタデータ) (2022-05-12T17:55:51Z) - Neural Descent for Visual 3D Human Pose and Shape [67.01050349629053]
入力RGB画像から3次元のポーズと形状を復元するディープニューラルネットワーク手法を提案する。
我々は最近導入された表現力のあるボディ統計モデルGHUMに頼っている。
我々の方法論の中心は、HUmanNeural Descent (HUND)と呼ばれるアプローチの学習と最適化である。
論文 参考訳(メタデータ) (2020-08-16T13:38:41Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。