論文の概要: Human Pose and Shape Estimation from Single Polarization Images
- arxiv url: http://arxiv.org/abs/2108.06834v1
- Date: Sun, 15 Aug 2021 22:56:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 15:06:09.907296
- Title: Human Pose and Shape Estimation from Single Polarization Images
- Title(参考訳): 単一偏光画像からの人間のポーズと形状推定
- Authors: Shihao Zou, Xinxin Zuo, Sen Wang, Yiming Qian, Chuan Guo, Wei Ji,
Jingjing Li, Minglun Gong, Li Cheng
- Abstract要約: 本研究では, 偏光誘起幾何学的手がかりを利用して, 単一偏光画像から人間のポーズと形状を推定する。
専用のデータセット(PHSPD)が構築されており、正確なポーズと形状のアノテーションを備えた500Kフレーム以上で構成されている。
偏光カメラは、人間のポーズと形状を推定するための従来のRGBカメラに代わる有望な選択肢として提案されている。
- 参考スコア(独自算出の注目度): 45.24275141578927
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper focuses on a new problem of estimating human pose and shape from
single polarization images. Polarization camera is known to be able to capture
the polarization of reflected lights that preserves rich geometric cues of an
object surface. Inspired by the recent applications in surface normal
reconstruction from polarization images, in this paper, we attempt to estimate
human pose and shape from single polarization images by leveraging the
polarization-induced geometric cues. A dedicated two-stage pipeline is
proposed: given a single polarization image, stage one (Polar2Normal) focuses
on the fine detailed human body surface normal estimation; stage two
(Polar2Shape) then reconstructs clothed human shape from the polarization image
and the estimated surface normal. To empirically validate our approach, a
dedicated dataset (PHSPD) is constructed, consisting of over 500K frames with
accurate pose and shape annotations. Empirical evaluations on this real-world
dataset as well as a synthetic dataset, SURREAL, demonstrate the effectiveness
of our approach. It suggests polarization camera as a promising alternative to
the more conventional RGB camera for human pose and shape estimation.
- Abstract(参考訳): 本稿では,単一偏光画像から人間のポーズと形状を推定する新しい問題に着目する。
偏光カメラは、物体表面のリッチな幾何学的手がかりを保存する反射光の偏光を捉えることができることが知られている。
本稿では,偏光画像からの表面正規化の最近の応用に触発されて,偏光による幾何学的手がかりを利用して,単偏光画像から人間のポーズと形状を推定する。
単一偏光画像が与えられた場合、第1ステージ(Polar2Normal)は細かな人体表面の正常な推定に焦点を合わせ、第2ステージ(Polar2Shape)は偏光画像と推定表面の正常な推定から布状人の形状を再構築する。
このアプローチを実証的に検証するために,500Kフレームを超える正確なポーズと形状アノテーションを備えた専用データセット(PHSPD)を構築した。
この実世界のデータセットと合成データセットであるsurrealに対する実証的な評価は、このアプローチの有効性を示しています。
偏光カメラは、人間のポーズと形状を推定するための従来のRGBカメラに代わる有望な選択肢として提案されている。
関連論文リスト
- NeRSP: Neural 3D Reconstruction for Reflective Objects with Sparse Polarized Images [62.752710734332894]
NeRSPはスパース偏光画像を用いた反射面のニューラル3次元再構成技術である。
偏光画像形成モデルと多視点方位整合性から測光的および幾何学的手がかりを導出する。
我々は6つのビューのみを入力として、最先端の表面再構成結果を達成する。
論文 参考訳(メタデータ) (2024-06-11T09:53:18Z) - S2P3: Self-Supervised Polarimetric Pose Prediction [55.43547228561919]
本稿では,マルチモーダルRGB+ポラリメトリック画像から,最初の自己監督型6次元オブジェクトポーズ予測を提案する。
1) 偏光の幾何学的情報を抽出する物理モデル,2) 教師による知識蒸留方式,3) 異なる制約による自己監督的損失の定式化を含む。
論文 参考訳(メタデータ) (2023-12-02T10:46:40Z) - Polarimetric Information for Multi-Modal 6D Pose Estimation of
Photometrically Challenging Objects with Limited Data [51.95347650131366]
6Dポーズ推定パイプラインは、RGBのみまたはRGB-Dデータに依存する。
このような制限を克服するために,補完分極情報を利用した教師付き学習ベース手法を提案する。
論文 参考訳(メタデータ) (2023-08-21T10:56:00Z) - Polarimetric Multi-View Inverse Rendering [13.391866136230165]
偏光カメラは、偏光の角度(AoP)と反射光の偏光の度合い(DoP)が物体の表面の正常と関係しているため、3次元再構成に大きな可能性がある。
入力された多視点カラー偏光画像から抽出した幾何的・測光的・偏光的手がかりを効果的に活用するポラリメトリック多視点逆レンダリング(Polarimetric Multi-View Inverse Rendering, Polarimetric MVIR)と呼ばれる新しい3次元再構成手法を提案する。
論文 参考訳(メタデータ) (2022-12-24T12:12:12Z) - PolarFormer: Multi-camera 3D Object Detection with Polar Transformers [93.49713023975727]
自律運転における3次元物体検出は、3次元の世界に存在する「何」と「どこに」の物体を推論することを目的としている。
既存の手法はしばしば垂直軸を持つ標準カルテ座標系を採用する。
鳥眼ビュー(BEV)におけるより正確な3次元物体検出のための新しい極変換器(PolarFormer)を,マルチカメラ2D画像のみを入力として提案する。
論文 参考訳(メタデータ) (2022-06-30T16:32:48Z) - Deep Polarization Imaging for 3D shape and SVBRDF Acquisition [7.86578678811226]
偏光キューを用いた3次元物体の形状と空間的反射率を効率よく取得する新しい手法を提案する。
偏光イメージングを深層学習と組み合わせることで,物体や物体の出現を一定の制約下で推定する従来の研究と異なり,このような制約を解消する。
我々は,フラッシュ照明とともにディープラーニングを用いた最近の研究と比較して,優れた結果を得るためのアプローチを実証する。
論文 参考訳(メタデータ) (2021-05-06T17:58:43Z) - Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View
Geometry [62.29762409558553]
マルチパーソナライズされた3次元ポーズ推定手法における特徴マッチングと深さ推定のコアは、エピポーラ制約である。
スパサーの群衆シーンにおけるこの定式化の良好なパフォーマンスにもかかわらず、その効果はより密集した群衆の状況下でしばしば挑戦される。
本稿では,マルチパーソン3次元ポーズ推定式から脱却し,群衆ポーズ推定として再編成する。
論文 参考訳(メタデータ) (2020-07-21T17:59:36Z) - 3D Human Shape Reconstruction from a Polarization Image [34.240256720930155]
本稿では, 単偏光2次元画像から衣服の3次元体形状を推定する問題に対処する。
専用2段階のディープラーニングアプローチであるSfPが提案されている。
論文 参考訳(メタデータ) (2020-07-17T22:36:02Z) - Polarimetric Multi-View Inverse Rendering [13.391866136230165]
偏光カメラは、反射光の偏光角(AoP)が物体の表面の正常と関係しているため、3次元再構成に大きな可能性がある。
入力された多視点カラー偏光画像から抽出した幾何的・測光的・偏光的手がかりを利用するポラリメトリック・マルチビュー逆レンダリング(Polarimetric MVIR)と呼ばれる新しい3次元再構成手法を提案する。
論文 参考訳(メタデータ) (2020-07-17T09:00:20Z) - Polarization Human Shape and Pose Dataset [35.156049015251035]
偏光画像は、物体のリッチな幾何学的手がかりを保存する偏光反射光を捉えることが知られている。
単色画像からの人体形状推定の最近の進歩に触発されて,偏光カメラからの幾何学的手がかりが人体形状の詳細な推定に有効か,という新たな疑問を解明しようと試みた。
論文 参考訳(メタデータ) (2020-04-30T15:58:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。