論文の概要: SelfPose: 3D Egocentric Pose Estimation from a Headset Mounted Camera
- arxiv url: http://arxiv.org/abs/2011.01519v1
- Date: Mon, 2 Nov 2020 16:18:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 12:34:00.104066
- Title: SelfPose: 3D Egocentric Pose Estimation from a Headset Mounted Camera
- Title(参考訳): selfpose:ヘッドセット搭載カメラによる3dエゴセントリックなポーズ推定
- Authors: Denis Tome, Thiemo Alldieck, Patrick Peluse, Gerard Pons-Moll, Lourdes
Agapito, Hernan Badino and Fernando De la Torre
- Abstract要約: 頭部装着型VR装置の縁に設置した下向きの魚眼カメラから撮影した単眼画像から,エゴセントリックな3Dボディポーズ推定法を提案する。
この特異な視点は、厳密な自己閉塞と視点歪みを伴う、独特の視覚的な外観のイメージに繋がる。
本稿では,2次元予測の不確実性を考慮した新しいマルチブランチデコーダを用いたエンコーダデコーダアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 97.0162841635425
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present a solution to egocentric 3D body pose estimation from monocular
images captured from downward looking fish-eye cameras installed on the rim of
a head mounted VR device. This unusual viewpoint leads to images with unique
visual appearance, with severe self-occlusions and perspective distortions that
result in drastic differences in resolution between lower and upper body. We
propose an encoder-decoder architecture with a novel multi-branch decoder
designed to account for the varying uncertainty in 2D predictions. The
quantitative evaluation, on synthetic and real-world datasets, shows that our
strategy leads to substantial improvements in accuracy over state of the art
egocentric approaches. To tackle the lack of labelled data we also introduced a
large photo-realistic synthetic dataset. xR-EgoPose offers high quality
renderings of people with diverse skintones, body shapes and clothing,
performing a range of actions. Our experiments show that the high variability
in our new synthetic training corpus leads to good generalization to real world
footage and to state of theart results on real world datasets with ground
truth. Moreover, an evaluation on the Human3.6M benchmark shows that the
performance of our method is on par with top performing approaches on the more
classic problem of 3D human pose from a third person viewpoint.
- Abstract(参考訳): 頭部装着型VR装置の縁に設置した下向きの魚眼カメラから撮影した単眼画像から,エゴセントリックな3Dボディポーズ推定法を提案する。
この異常な視点は、下半身と上半身の解像度に劇的な違いをもたらす、厳密な自己閉塞と視点歪みを伴う独特の視覚的外観のイメージにつながる。
本稿では,2次元予測の不確実性を考慮した新しいマルチブランチデコーダを用いたエンコーダデコーダアーキテクチャを提案する。
合成および実世界のデータセットに基づく定量的評価は、我々の戦略が、アートエゴセントリックなアプローチの状況よりも精度を大幅に向上させることを示している。
ラベル付きデータの欠如に対処するため、大規模な写真リアルな合成データセットも導入しました。
xr-egoposeは、様々なスキントーン、体型、衣服を持つ人々の高品質なレンダリングを提供し、さまざまなアクションを実行します。
実験の結果,我々の新しい合成学習コーパスの高変動は,実世界の映像や実世界の実世界のデータセットにおける技術結果のステートメントに優れた一般化をもたらすことがわかった。
さらに,Human3.6Mベンチマークを用いて評価した結果,従来の3次元人間のポーズ問題に対する従来の手法と同等の性能を示した。
関連論文リスト
- 3D Human Pose Perception from Egocentric Stereo Videos [67.9563319914377]
我々は,エゴセントリックな立体3次元ポーズ推定を改善するためのトランスフォーマーベースの新しいフレームワークを提案する。
本手法は, しゃがんだり座ったりといった困難なシナリオにおいても, 人間のポーズを正確に推定することができる。
私たちはUnrealEgo2、UnrealEgo-RW、およびトレーニングされたモデルをプロジェクトページでリリースします。
論文 参考訳(メタデータ) (2023-12-30T21:21:54Z) - Egocentric Whole-Body Motion Capture with FisheyeViT and Diffusion-Based
Motion Refinement [65.08165593201437]
本研究では,人体と手の動きを同時に推定する単一魚眼カメラを用いて,自我中心型全体モーションキャプチャーを探索する。
この課題は、高品質なデータセットの欠如、魚眼カメラの歪み、人間の身体の自己閉塞など、重大な課題を提起する。
そこで本研究では,魚眼画像の特徴を3次元人体ポーズ予測のための3次元熱マップ表現に変換した魚眼画像の特徴を抽出する手法を提案する。
論文 参考訳(メタデータ) (2023-11-28T07:13:47Z) - Ego3DPose: Capturing 3D Cues from Binocular Egocentric Views [9.476008200056082]
Ego3DPoseは、高度に高精度な両眼エゴ中心型3Dポーズ再構築システムである。
両眼熱マップと独立に手足のポーズを推定する経路を持つ2経路ネットワークアーキテクチャを提案する。
三角法を用いた新しい視点認識表現を提案し,手足の3次元方向を推定する。
論文 参考訳(メタデータ) (2023-09-21T10:34:35Z) - Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh
Reconstruction [66.10717041384625]
Zollyは、視点歪みの画像に焦点を当てた最初の3DHMR法である。
人体の2次元密度ゆらぎスケールを記述した新しいカメラモデルと新しい2次元歪み画像を提案する。
このタスク用に調整された2つの現実世界のデータセットを拡張します。
論文 参考訳(メタデータ) (2023-03-24T04:22:41Z) - UnrealEgo: A New Dataset for Robust Egocentric 3D Human Motion Capture [70.59984501516084]
UnrealEgoは、エゴセントリックな3Dポーズ推定のための、新しい大規模博物学データセットである。
これは、2台の魚眼カメラを備えた高度な眼鏡のコンセプトに基づいており、制約のない環境で使用することができる。
本稿では,ステレオ入力のための2次元キーポイント推定モジュールを考案し,人間のポーズ推定を改善するための簡易かつ効果的なベンチマーク手法を提案する。
論文 参考訳(メタデータ) (2022-08-02T17:59:54Z) - Exploring Severe Occlusion: Multi-Person 3D Pose Estimation with Gated
Convolution [34.301501457959056]
本稿では,2次元関節を3次元に変換するために,ゲート型畳み込みモジュールを用いた時間回帰ネットワークを提案する。
また, 正規化ポーズを大域軌跡に変換するために, 単純かつ効果的な局所化手法も実施した。
提案手法は,最先端の2D-to-3Dポーズ推定法よりも優れている。
論文 参考訳(メタデータ) (2020-10-31T04:35:24Z) - Towards Generalization of 3D Human Pose Estimation In The Wild [73.19542580408971]
3DBodyTex.Poseは、3Dの人間のポーズ推定のタスクに対処するデータセットである。
3DBodyTex.Poseは、さまざまな衣服やポーズで405種類の実際の被写体を含む高品質でリッチなデータを提供する。
論文 参考訳(メタデータ) (2020-04-21T13:31:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。