論文の概要: Stochastic Modeling for Learnable Human Pose Triangulation
- arxiv url: http://arxiv.org/abs/2110.00280v1
- Date: Fri, 1 Oct 2021 09:26:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-04 14:35:17.258392
- Title: Stochastic Modeling for Learnable Human Pose Triangulation
- Title(参考訳): 学習可能なポーズ三角測量のための確率的モデリング
- Authors: Kristijan Bartol, David Bojani\'c, Tomislav Petkovi\'c, Tomislav
Pribani\'c
- Abstract要約: 本研究では,3次元ポーズ三角測量のためのモデリングフレームワークを提案し,その性能を異なるデータセットと空間カメラアレンジメントで評価する。
提案したポーズ三角測量モデルは、異なるカメラアレンジメントと2つの公開データセット間の一般化に成功している。
- 参考スコア(独自算出の注目度): 0.7646713951724009
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a stochastic modeling framework for 3D human pose triangulation
and evaluate its performance across different datasets and spatial camera
arrangements. The common approach to 3D pose estimation is to first detect 2D
keypoints in images and then apply the triangulation from multiple views.
However, the majority of existing triangulation models are limited to a single
dataset, i.e. camera arrangement and their number. Moreover, they require known
camera parameters. The proposed stochastic pose triangulation model
successfully generalizes to different camera arrangements and between two
public datasets. In each step, we generate a set of 3D pose hypotheses obtained
by triangulation from a random subset of views. The hypotheses are evaluated by
a neural network and the expectation of the triangulation error is minimized.
The key novelty is that the network learns to evaluate the poses without taking
into account the spatial camera arrangement, thus improving generalization.
Additionally, we demonstrate that the proposed stochastic framework can also be
used for fundamental matrix estimation, showing promising results towards
relative camera pose estimation from noisy keypoint correspondences.
- Abstract(参考訳): 本研究では,3次元ポーズ三角測量のための確率的モデリングフレームワークを提案し,その性能を異なるデータセットと空間カメラアレンジメントで評価する。
3Dポーズ推定の一般的なアプローチは、まず画像中の2Dキーポイントを検出し、次に複数のビューから三角測量を適用することである。
しかし、既存の三角測量モデルのほとんどは単一のデータセット、すなわちカメラ配置とその数に限られている。
さらに、既知のカメラパラメータが必要である。
提案する確率的ポーズ三角測量モデルは,異なるカメラ配置と2つの公開データセット間をうまく一般化する。
各ステップにおいて、ランダムなビューのサブセットから三角法により得られる3次元ポーズ仮説のセットを生成する。
仮説をニューラルネットワークで評価し、三角測量誤差の期待を最小化する。
重要な特徴は、ネットワークが空間カメラ配置を考慮せずにポーズを評価することを学び、一般化を改善することである。
さらに,提案手法を基本行列推定に応用し,ノイズのあるキーポイント対応による相対カメラポーズ推定に有望な結果が得られることを示す。
関連論文リスト
- D3PRefiner: A Diffusion-based Denoise Method for 3D Human Pose
Refinement [3.514184876338779]
拡散型3次元ポース・リファイナは既存の3次元ポーズ推定器の出力を改良するために提案される。
現在の拡散モデルのアーキテクチャを利用して、ノイズの多い3Dポーズの分布を3Dポーズに変換する。
実験により,提案アーキテクチャは,現在の3次元ポーズ推定器の性能を大幅に向上させることができることを示した。
論文 参考訳(メタデータ) (2024-01-08T14:21:02Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - 6D Object Pose Estimation from Approximate 3D Models for Orbital
Robotics [19.64111218032901]
単一画像から物体の6次元ポーズを推定する新しい手法を提案する。
画素毎に3次元モデル座標を回帰する高密度な2次元から3次元対応予測器を用いる。
提案手法は,SPEED+データセット上での最先端性能を実現し,SPEC2021ポストモーテムコンペティションで優勝した。
論文 参考訳(メタデータ) (2023-03-23T13:18:05Z) - Learning Implicit Probability Distribution Functions for Symmetric
Orientation Estimation from RGB Images Without Pose Labels [23.01797447932351]
RGB-D画像の自動ポーズラベリング方式を提案する。
我々は、RGB画像の向き仮説の確率を推定するために、インプリシットPDFモデルを訓練する。
SO(3)多様体の効率的な階層的サンプリングは、完備な対称性の集合を抽出可能な生成を可能にする。
論文 参考訳(メタデータ) (2022-11-21T12:07:40Z) - Occupancy Planes for Single-view RGB-D Human Reconstruction [120.5818162569105]
暗黙的な機能を持つシングルビューRGB-Dヒト再構成は、しばしばポイント単位の分類として定式化される。
本稿では,カメラの視野フラストラムをスライスする平面上での占有率予測として,一視点のRGB-D人間の再構成を定式化できる占有面(OPlanes)表現を提案する。
論文 参考訳(メタデータ) (2022-08-04T17:59:56Z) - Pose-NDF: Modeling Human Pose Manifolds with Neural Distance Fields [47.62275563070933]
ニューラル距離場(NDF)に基づく可塑性人間のポーズの連続モデルを提案する。
Pose-NDFは、ニューラルネットワークの暗黙関数のゼロレベル集合として可塑性ポーズの多様体を学習する。
ランダムサンプリングとプロジェクションにより、VAEベースの手法よりも多様なポーズを生成することができる。
論文 参考訳(メタデータ) (2022-07-27T21:46:47Z) - MetaPose: Fast 3D Pose from Multiple Views without 3D Supervision [72.5863451123577]
正確な3Dポーズとカメラ推定が可能なニューラルモデルをトレーニングする方法を示す。
本手法は,古典的バンドル調整と弱教師付き単分子3Dベースラインの両方に優れる。
論文 参考訳(メタデータ) (2021-08-10T18:39:56Z) - VoxelTrack: Multi-Person 3D Human Pose Estimation and Tracking in the
Wild [98.69191256693703]
本稿では,VoxelTrackを用いて,多人数の3次元ポーズ推定と,広義のベースラインで分離された少数のカメラからの追跡を行う。
マルチブランチネットワークを使用して、環境中のすべての人に3Dポーズと再識別機能(Re-ID)を共同で推定する。
これは、Shelf、Campus、CMU Panopticの3つの公開データセットに対して、最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2021-08-05T08:35:44Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - Beyond Weak Perspective for Monocular 3D Human Pose Estimation [6.883305568568084]
単眼映像からの3次元関節位置と方向予測の課題を考察する。
まず,市販のポーズ推定アルゴリズムを用いて2次元関節位置を推定する。
次に、初期パラメータを受信するSMPLifyアルゴリズムに準拠する。
論文 参考訳(メタデータ) (2020-09-14T16:23:14Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。