論文の概要: Stochastic Modeling for Learnable Human Pose Triangulation
- arxiv url: http://arxiv.org/abs/2110.00280v1
- Date: Fri, 1 Oct 2021 09:26:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-04 14:35:17.258392
- Title: Stochastic Modeling for Learnable Human Pose Triangulation
- Title(参考訳): 学習可能なポーズ三角測量のための確率的モデリング
- Authors: Kristijan Bartol, David Bojani\'c, Tomislav Petkovi\'c, Tomislav
Pribani\'c
- Abstract要約: 本研究では,3次元ポーズ三角測量のためのモデリングフレームワークを提案し,その性能を異なるデータセットと空間カメラアレンジメントで評価する。
提案したポーズ三角測量モデルは、異なるカメラアレンジメントと2つの公開データセット間の一般化に成功している。
- 参考スコア(独自算出の注目度): 0.7646713951724009
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a stochastic modeling framework for 3D human pose triangulation
and evaluate its performance across different datasets and spatial camera
arrangements. The common approach to 3D pose estimation is to first detect 2D
keypoints in images and then apply the triangulation from multiple views.
However, the majority of existing triangulation models are limited to a single
dataset, i.e. camera arrangement and their number. Moreover, they require known
camera parameters. The proposed stochastic pose triangulation model
successfully generalizes to different camera arrangements and between two
public datasets. In each step, we generate a set of 3D pose hypotheses obtained
by triangulation from a random subset of views. The hypotheses are evaluated by
a neural network and the expectation of the triangulation error is minimized.
The key novelty is that the network learns to evaluate the poses without taking
into account the spatial camera arrangement, thus improving generalization.
Additionally, we demonstrate that the proposed stochastic framework can also be
used for fundamental matrix estimation, showing promising results towards
relative camera pose estimation from noisy keypoint correspondences.
- Abstract(参考訳): 本研究では,3次元ポーズ三角測量のための確率的モデリングフレームワークを提案し,その性能を異なるデータセットと空間カメラアレンジメントで評価する。
3Dポーズ推定の一般的なアプローチは、まず画像中の2Dキーポイントを検出し、次に複数のビューから三角測量を適用することである。
しかし、既存の三角測量モデルのほとんどは単一のデータセット、すなわちカメラ配置とその数に限られている。
さらに、既知のカメラパラメータが必要である。
提案する確率的ポーズ三角測量モデルは,異なるカメラ配置と2つの公開データセット間をうまく一般化する。
各ステップにおいて、ランダムなビューのサブセットから三角法により得られる3次元ポーズ仮説のセットを生成する。
仮説をニューラルネットワークで評価し、三角測量誤差の期待を最小化する。
重要な特徴は、ネットワークが空間カメラ配置を考慮せずにポーズを評価することを学び、一般化を改善することである。
さらに,提案手法を基本行列推定に応用し,ノイズのあるキーポイント対応による相対カメラポーズ推定に有望な結果が得られることを示す。
関連論文リスト
- No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.80376573969045]
NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。
提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。
この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:58:22Z) - Unsupervised Learning of Category-Level 3D Pose from Object-Centric Videos [15.532504015622159]
カテゴリーレベルの3Dポーズ推定は、コンピュータビジョンとロボット工学において基本的に重要な問題である。
カテゴリーレベルの3Dポーズを,カジュアルに撮られた対象中心の動画からのみ推定する学習の課題に取り組む。
論文 参考訳(メタデータ) (2024-07-05T09:43:05Z) - 6D Object Pose Estimation from Approximate 3D Models for Orbital
Robotics [19.64111218032901]
単一画像から物体の6次元ポーズを推定する新しい手法を提案する。
画素毎に3次元モデル座標を回帰する高密度な2次元から3次元対応予測器を用いる。
提案手法は,SPEED+データセット上での最先端性能を実現し,SPEC2021ポストモーテムコンペティションで優勝した。
論文 参考訳(メタデータ) (2023-03-23T13:18:05Z) - Learning Implicit Probability Distribution Functions for Symmetric
Orientation Estimation from RGB Images Without Pose Labels [23.01797447932351]
RGB-D画像の自動ポーズラベリング方式を提案する。
我々は、RGB画像の向き仮説の確率を推定するために、インプリシットPDFモデルを訓練する。
SO(3)多様体の効率的な階層的サンプリングは、完備な対称性の集合を抽出可能な生成を可能にする。
論文 参考訳(メタデータ) (2022-11-21T12:07:40Z) - Occupancy Planes for Single-view RGB-D Human Reconstruction [120.5818162569105]
暗黙的な機能を持つシングルビューRGB-Dヒト再構成は、しばしばポイント単位の分類として定式化される。
本稿では,カメラの視野フラストラムをスライスする平面上での占有率予測として,一視点のRGB-D人間の再構成を定式化できる占有面(OPlanes)表現を提案する。
論文 参考訳(メタデータ) (2022-08-04T17:59:56Z) - MetaPose: Fast 3D Pose from Multiple Views without 3D Supervision [72.5863451123577]
正確な3Dポーズとカメラ推定が可能なニューラルモデルをトレーニングする方法を示す。
本手法は,古典的バンドル調整と弱教師付き単分子3Dベースラインの両方に優れる。
論文 参考訳(メタデータ) (2021-08-10T18:39:56Z) - VoxelTrack: Multi-Person 3D Human Pose Estimation and Tracking in the
Wild [98.69191256693703]
本稿では,VoxelTrackを用いて,多人数の3次元ポーズ推定と,広義のベースラインで分離された少数のカメラからの追跡を行う。
マルチブランチネットワークを使用して、環境中のすべての人に3Dポーズと再識別機能(Re-ID)を共同で推定する。
これは、Shelf、Campus、CMU Panopticの3つの公開データセットに対して、最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2021-08-05T08:35:44Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - Beyond Weak Perspective for Monocular 3D Human Pose Estimation [6.883305568568084]
単眼映像からの3次元関節位置と方向予測の課題を考察する。
まず,市販のポーズ推定アルゴリズムを用いて2次元関節位置を推定する。
次に、初期パラメータを受信するSMPLifyアルゴリズムに準拠する。
論文 参考訳(メタデータ) (2020-09-14T16:23:14Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。