論文の概要: GFPose: Learning 3D Human Pose Prior with Gradient Fields
- arxiv url: http://arxiv.org/abs/2212.08641v1
- Date: Fri, 16 Dec 2022 18:31:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 15:50:11.603426
- Title: GFPose: Learning 3D Human Pose Prior with Gradient Fields
- Title(参考訳): GFPose: グラディエントフィールドで3Dヒューマンポースを学習する
- Authors: Hai Ci, Mingdong Wu, Wentao Zhu, Xiaoxuan Ma, Hao Dong, Fangwei Zhong
and Yizhou Wang
- Abstract要約: GFPoseは、様々な用途のために可塑性な3Dポーズをモデル化するための多用途フレームワークである。
GFPoseのコアには時間依存のスコアネットワークがあり、各関節の勾配を推定する。
デノナイジング過程の間、GFPoseは暗黙的に勾配のポーズを取り入れ、様々な識別的および生成的タスクを統一する。
- 参考スコア(独自算出の注目度): 18.534273401723706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning 3D human pose prior is essential to human-centered AI. Here, we
present GFPose, a versatile framework to model plausible 3D human poses for
various applications. At the core of GFPose is a time-dependent score network,
which estimates the gradient on each body joint and progressively denoises the
perturbed 3D human pose to match a given task specification. During the
denoising process, GFPose implicitly incorporates pose priors in gradients and
unifies various discriminative and generative tasks in an elegant framework.
Despite the simplicity, GFPose demonstrates great potential in several
downstream tasks. Our experiments empirically show that 1) as a
multi-hypothesis pose estimator, GFPose outperforms existing SOTAs by 20% on
Human3.6M dataset. 2) as a single-hypothesis pose estimator, GFPose achieves
comparable results to deterministic SOTAs, even with a vanilla backbone. 3)
GFPose is able to produce diverse and realistic samples in pose denoising,
completion and generation tasks. Project page
https://sites.google.com/view/gfpose/
- Abstract(参考訳): 人間の3Dポーズを事前に学習することは、人間中心のAIにとって不可欠である。
本稿では,多機能な3次元人間のポーズをモデル化するGFPoseについて述べる。
GFPoseのコアは時間依存のスコアネットワークで、各体の関節の勾配を推定し、与えられたタスク仕様に合うように、乱れた3Dのポーズを段階的に認知する。
denoisingプロセスの間、GFPoseは暗黙的に勾配のポーズを取り入れ、エレガントなフレームワークで様々な差別的および生成的タスクを統一する。
単純さにもかかわらず、GFPoseはいくつかの下流タスクにおいて大きな可能性を示す。
私たちの実験は
GFPoseはHuman3.6Mデータセットで既存のSOTAを20%上回っている。
GFPoseは, 1-hypothesis pose estimatorとして, バニラバックボーンでも決定論的SOTAと同等の結果を得る。
3) gfposeはポーズの変動、完了、生成タスクにおいて多様で現実的なサンプルを生成できる。
プロジェクトページ https://sites.google.com/view/gfpose/
関連論文リスト
- ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [54.86887812687023]
ほとんどの3D-HPE法は回帰モデルに依存しており、入力と出力の1対1のマッピングを前提としている。
提案するManiPoseは,2次元入力毎に複数の候補3次元ポーズを提案可能な,新しい多様体制約型マルチハイポテーシスモデルである。
従来のマルチハイブリッドアプローチとは異なり、我々のソリューションは完全に教師付きであり、複雑な生成モデルに依存しない。
論文 参考訳(メタデータ) (2023-12-11T13:50:10Z) - GLA-GCN: Global-local Adaptive Graph Convolutional Network for 3D Human
Pose Estimation from Monocular Video [33.801470193414325]
この研究は、地上の真実データを通して3Dのポーズリフトを改善することに焦点を当てている。
本研究では,グローバルローカル適応グラフ畳み込みネットワーク(GLA-GCN)を提案する。
GLA-GCNは, 基礎的真理2Dで実装され, 最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2023-07-12T00:13:04Z) - Decanus to Legatus: Synthetic training for 2D-3D human pose lifting [26.108023246654646]
10個の手作り3Dポーズ(Decanus)に基づく3Dポーズ分布から無限個の合成人間のポーズ(Legatus)を生成するアルゴリズムを提案する。
この結果から,特定データセットの実際のデータを用いた手法に匹敵する3次元ポーズ推定性能を,ゼロショット設定で実現し,フレームワークの可能性を示した。
論文 参考訳(メタデータ) (2022-10-05T13:10:19Z) - PoseGU: 3D Human Pose Estimation with Novel Human Pose Generator and
Unbiased Learning [36.609189237732394]
3Dポーズ推定は近年,コンピュータビジョン領域において大きな関心を集めている。
既存の3Dポーズ推定手法は,大規模な3Dポーズデータセットに強く依存している。
本稿では,種子サンプルの小さなサイズにのみアクセス可能な多彩なポーズを生成する新規な人造ポーズ生成装置PoseGUを提案する。
論文 参考訳(メタデータ) (2022-07-07T23:43:53Z) - Unsupervised Geodesic-preserved Generative Adversarial Networks for
Unconstrained 3D Pose Transfer [84.04540436494011]
任意の任意の任意の3次元メッシュ間のポーズ転送を行うための教師なしアプローチを提案する。
具体的には、内因性(形状)と外因性(ポーズ)の情報保存について、新規な内因性-外因性保存生成ネットワーク(IEP-GAN)を提示する。
提案手法は,最近の最先端手法と比較して,より優れた結果が得られ,より効率的である。
論文 参考訳(メタデータ) (2021-08-17T09:08:21Z) - 3D Human Pose Regression using Graph Convolutional Network [68.8204255655161]
本稿では,2次元のポーズから3次元のポーズ回帰を行うために,PoseGraphNetというグラフ畳み込みネットワークを提案する。
我々のモデルの性能は最先端に近いが、パラメータははるかに少ない。
論文 参考訳(メタデータ) (2021-05-21T14:41:31Z) - Unsupervised 3D Human Pose Representation with Viewpoint and Pose
Disentanglement [63.853412753242615]
優れた3次元ポーズ表現を学習することは、人間のポーズ関連タスクにとって重要である。
本稿では,3次元ポーズ表現を学習するために,新しいシームズ・デノナイズドオートエンコーダを提案する。
提案手法は,2つの本質的に異なるタスクに対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-07-14T14:25:22Z) - Cascaded deep monocular 3D human pose estimation with evolutionary
training data [76.3478675752847]
深層表現学習は単眼の3次元ポーズ推定において顕著な精度を達成した。
本稿では,大量のトレーニングデータに対してスケーラブルな新しいデータ拡張手法を提案する。
本手法は,先行知識に触発された階層的人体表現と合成に基づいて,未知の3次元人体骨格を合成する。
論文 参考訳(メタデータ) (2020-06-14T03:09:52Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。