論文の概要: HuManiFlow: Ancestor-Conditioned Normalising Flows on SO(3) Manifolds
for Human Pose and Shape Distribution Estimation
- arxiv url: http://arxiv.org/abs/2305.06968v1
- Date: Thu, 11 May 2023 16:49:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-12 13:54:50.964332
- Title: HuManiFlow: Ancestor-Conditioned Normalising Flows on SO(3) Manifolds
for Human Pose and Shape Distribution Estimation
- Title(参考訳): 人為流:人間のポーズと形状分布推定のためのso(3)多様体上の祖先条件付き正規化流れ
- Authors: Akash Sengupta and Ignas Budvytis and Roberto Cipolla
- Abstract要約: 近年のアプローチでは、画像上に条件付き3次元ポーズと形状パラメータの確率分布が予測されている。
これらの手法が3つの重要な特性のトレードオフを示すことを示す。
我々の手法であるHuManiFlowは、同時に正確で一貫性があり多様な分布を予測する。
- 参考スコア(独自算出の注目度): 27.14060158187953
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular 3D human pose and shape estimation is an ill-posed problem since
multiple 3D solutions can explain a 2D image of a subject. Recent approaches
predict a probability distribution over plausible 3D pose and shape parameters
conditioned on the image. We show that these approaches exhibit a trade-off
between three key properties: (i) accuracy - the likelihood of the ground-truth
3D solution under the predicted distribution, (ii) sample-input consistency -
the extent to which 3D samples from the predicted distribution match the
visible 2D image evidence, and (iii) sample diversity - the range of plausible
3D solutions modelled by the predicted distribution. Our method, HuManiFlow,
predicts simultaneously accurate, consistent and diverse distributions. We use
the human kinematic tree to factorise full body pose into ancestor-conditioned
per-body-part pose distributions in an autoregressive manner. Per-body-part
distributions are implemented using normalising flows that respect the manifold
structure of SO(3), the Lie group of per-body-part poses. We show that
ill-posed, but ubiquitous, 3D point estimate losses reduce sample diversity,
and employ only probabilistic training losses. Code is available at:
https://github.com/akashsengupta1997/HuManiFlow.
- Abstract(参考訳): 複数の3次元解が被写体の2次元像を説明できるため、単眼的なポーズと形状推定は不適切な問題である。
近年のアプローチでは、画像上の3Dポーズと形状パラメータの確率分布が予測されている。
これらのアプローチは、3つの重要な性質の間のトレードオフを示す。
(i)精度 - 予測分布下での地上3次元解の可能性。
(ii) サンプル・インプットの一貫性 予測分布からの3dサンプルが可視2d画像証拠と一致する程度
(iii) サンプル多様性 - 予測分布をモデルとした3次元解の範囲。
提案手法であるhumaniflowは, 精度, 一貫性, 多様な分布を同時に予測する。
我々は,ヒトのキネマティックツリーを用いて,全身のポーズを祖先条件の個体ごとのポーズ分布に自己回帰的に分解する。
体-部分分布は、体-部分のリー群であるso(3)の多様体構造を尊重する正規化フローを用いて実装される。
これらの結果から, 3次元点推定損失はサンプルの多様性を低下させ, 確率的トレーニング損失のみを生かすことがわかった。
コードはhttps://github.com/akashsengupta1997/humaniflowで入手できる。
関連論文リスト
- Diffusion with Forward Models: Solving Stochastic Inverse Problems
Without Direct Supervision [76.32860119056964]
本稿では,直接観測されない信号の分布からサンプルを学習する拡散確率モデルを提案する。
コンピュータビジョンの課題3つの課題に対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2023-06-20T17:53:00Z) - Diffusion-Based 3D Human Pose Estimation with Multi-Hypothesis
Aggregation [64.874000550443]
ジョイントワイズ・リジェクション・ベース・マルチハイブリッド・アグリゲーション(JPMA)を用いた拡散型3次元ポス推定法を提案する。
提案したJPMAは,D3DPが生成する複数の仮説を1つの3次元ポーズにまとめて実用的に利用する。
提案手法は, 最先端の決定論的アプローチと確率論的アプローチをそれぞれ1.5%, 8.9%上回った。
論文 参考訳(メタデータ) (2023-03-21T04:00:47Z) - DiffPose: Multi-hypothesis Human Pose Estimation using Diffusion models [5.908471365011943]
与えられた入力画像に対して複数の仮説を予測する条件拡散モデルであるemphDiffPoseを提案する。
DiffPoseは, 簡単なポーズの多面的ポーズを推定し, 極めてあいまいなポーズに対して大きなマージンで優れることを示す。
論文 参考訳(メタデータ) (2022-11-29T18:55:13Z) - A generic diffusion-based approach for 3D human pose prediction in the
wild [68.00961210467479]
3D人間のポーズ予測、すなわち、過去の観察されたポーズのシーケンスが与えられた後の人間の3Dポーズのシーケンスを予測することは、困難な時間課題である。
本稿では,不完全な要素(予測や観測に関係しない)をノイズとして扱える統一的な定式化法を提案し,それらを認知し,妥当なポーズを予測する条件拡散モデルを提案する。
本研究は,4つの標準データセットについて検討し,現状よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-10-11T17:59:54Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Probabilistic Estimation of 3D Human Shape and Pose with a Semantic
Local Parametric Model [25.647676661390282]
本稿では,RGB画像からの3次元人体形状とポーズ推定の問題に対処する。
本研究では,局所的な身体形状の分布を意味的身体計測の形で予測する手法を提案する。
本手法は,身元依存の身体形状推定精度において,現在の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-30T13:50:45Z) - Hierarchical Kinematic Probability Distributions for 3D Human Shape and
Pose Estimation from Images in the Wild [25.647676661390282]
本稿では,RGB画像からの3次元人体形状とポーズ推定の問題に対処する。
深層ニューラルネットワークを用いて、相対的な3次元関節回転行列上の階層行列-フィッシャー分布を推定する。
本手法は,SSP-3Dおよび3DPWデータセット上で,3次元形状の計測値を用いて,最先端技術と競合することを示す。
論文 参考訳(メタデータ) (2021-10-03T11:59:37Z) - Probabilistic Modeling for Human Mesh Recovery [73.11532990173441]
本稿では,2次元の証拠から3次元の人体復元の問題に焦点を当てた。
我々は,この問題を,入力から3Dポーズの分布へのマッピング学習として再考した。
論文 参考訳(メタデータ) (2021-08-26T17:55:11Z) - Implicit-PDF: Non-Parametric Representation of Probability Distributions
on the Rotation Manifold [47.31074799708132]
我々はSO(3)上の任意の非パラメトリック分布を推定する手法を提案する。
私たちのキーとなるアイデアは、入力画像と候補ポーズの確率を推定するニューラルネットワークで、分布を暗黙的に表現することです。
我々はPascal3D+とModelNet10-SO(3)ベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-06-10T17:57:23Z) - Probabilistic 3D Human Shape and Pose Estimation from Multiple
Unconstrained Images in the Wild [25.647676661390282]
人間の被写体の複数の画像のグループから、形状とポーズ推定という新しいタスクを提案します。
提案手法は,SMPL体形状上の分布を予測し,入力画像にパラメータを付与する。
複数画像入力グループに存在する付加体形状情報により, 人体形状推定の精度が向上することを示す。
論文 参考訳(メタデータ) (2021-03-19T18:32:16Z) - Weakly Supervised Generative Network for Multiple 3D Human Pose
Hypotheses [74.48263583706712]
単一画像からの3次元ポーズ推定は、欠落した深さのあいまいさに起因する逆問題である。
逆問題に対処するために,弱い教師付き深層生成ネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T09:26:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。