論文の概要: Single View Physical Distance Estimation using Human Pose
- arxiv url: http://arxiv.org/abs/2106.10335v1
- Date: Fri, 18 Jun 2021 19:50:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-25 06:06:23.492303
- Title: Single View Physical Distance Estimation using Human Pose
- Title(参考訳): 人間のポーズを用いた単視点物理距離推定
- Authors: Xiaohan Fei, Henry Wang, Xiangyu Zeng, Lin Lee Cheong, Meng Wang,
Joseph Tighe
- Abstract要約: 本稿では,1枚のRGB画像やビデオからカメラ内在物,地上面,人物間の物理的距離を同時に推定する完全自動システムを提案する。
提案手法により、既存のカメラシステムは、専用のキャリブレーションプロセスやレンジセンサーを必要とせず、物理的距離を測定することができる。
その結果,ポーズに基づく自動校正と距離推定の問題に対して,MEVADAが世界初となる評価ベンチマークとなった。
- 参考スコア(独自算出の注目度): 18.9877515094788
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a fully automated system that simultaneously estimates the camera
intrinsics, the ground plane, and physical distances between people from a
single RGB image or video captured by a camera viewing a 3-D scene from a fixed
vantage point. To automate camera calibration and distance estimation, we
leverage priors about human pose and develop a novel direct formulation for
pose-based auto-calibration and distance estimation, which shows
state-of-the-art performance on publicly available datasets. The proposed
approach enables existing camera systems to measure physical distances without
needing a dedicated calibration process or range sensors, and is applicable to
a broad range of use cases such as social distancing and workplace safety.
Furthermore, to enable evaluation and drive research in this area, we
contribute to the publicly available MEVA dataset with additional distance
annotations, resulting in MEVADA -- the first evaluation benchmark in the world
for the pose-based auto-calibration and distance estimation problem.
- Abstract(参考訳): そこで本研究では,1枚のRGB画像や3Dシーンを一定位置から見るカメラで撮影した映像から,カメラの内在性,地上面,身体的距離を同時に推定するシステムを提案する。
カメラキャリブレーションと距離推定を自動化するために、人間のポーズに関する先行情報を活用し、ポーズに基づく自動校正と距離推定のための新しい直接的な定式化を開発し、公開データセット上での最先端のパフォーマンスを示す。
提案手法により、既存のカメラシステムは、専用のキャリブレーションプロセスやレンジセンサーを必要とせずに物理的な距離を計測でき、ソーシャルディスタンシングや職場の安全といった幅広いユースケースに適用できる。
さらに,この領域における評価と研究の推進のために,さらに距離アノテーションを付加したMEVAデータセットに貢献し,ポーズに基づく自動校正と距離推定の問題に対する世界初となる評価ベンチマークMEVADAを作成した。
関連論文リスト
- GenDepth: Generalizing Monocular Depth Estimation for Arbitrary Camera
Parameters via Ground Plane Embedding [8.289857214449372]
GenDepthは任意の車載カメラの設定に対してメートル法深度推定を行うことができる新しいモデルである。
地平面深度としてのカメラパラメータの新たな埋め込みを提案し,これらの埋め込みを対角領域アライメントと統合するアーキテクチャを提案する。
我々はGenDepthをいくつかの自律走行データセットで検証し、異なる車載カメラシステムに対する最先端の一般化能力を実証した。
論文 参考訳(メタデータ) (2023-12-10T22:28:34Z) - Multimodal Active Measurement for Human Mesh Recovery in Close Proximity [13.265259738826302]
物理的な人間とロボットの相互作用では、ロボットは対象者の正確な身体のポーズを推定する必要がある。
これらのpHRIシナリオでは、ロボットは物理的相互作用のためにロボットに近づかなければならないため、装備されたカメラで対象者の身体を完全に観察することはできない。
本稿では,2次元LiDARのような触覚センサを備えたカメラのアクティブな計測・センサ融合フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-12T08:17:57Z) - Scene-Aware 3D Multi-Human Motion Capture from a Single Camera [83.06768487435818]
静止カメラで記録された1枚のRGBビデオから、シーン内の複数の人間の3次元位置を推定し、その身体形状と調音を推定する問題を考察する。
コンピュータビジョンの最近の進歩を,2次元の人体関節,関節角度,正規化不均等マップ,人間のセグメンテーションマスクなど,様々なモダリティのための大規模事前訓練モデルを用いて活用している。
特に,2次元の関節と関節角度を用いた正規化不均等予測から,シーン深度とユニークな人格尺度を推定する。
論文 参考訳(メタデータ) (2023-01-12T18:01:28Z) - Extrinsic Camera Calibration with Semantic Segmentation [60.330549990863624]
本稿では,セグメンテーション情報を利用してパラメータ推定を自動化する,外部カメラキャリブレーション手法を提案する。
われわれのアプローチは、カメラのポーズの粗い初期測定と、車両に搭載されたライダーセンサーによる構築に依存している。
シミュレーションおよび実世界のデータを用いて,キャリブレーション結果の低誤差測定を行う。
論文 参考訳(メタデータ) (2022-08-08T07:25:03Z) - Embodied Scene-aware Human Pose Estimation [25.094152307452]
シーン認識型人間のポーズ推定手法を提案する。
本手法は, シミュレーション環境下でのグローバルな3次元人間のポーズを再現し, 因果関係の1段階である。
論文 参考訳(メタデータ) (2022-06-18T03:50:19Z) - A Quality Index Metric and Method for Online Self-Assessment of
Autonomous Vehicles Sensory Perception [164.93739293097605]
本稿では,検出品質指標(DQI)と呼ばれる新しい評価指標を提案し,カメラを用いた物体検出アルゴリズムの性能を評価する。
我々は,提案したDQI評価指標を予測するために,原画像画素とスーパーピクセルを入力として利用するスーパーピクセルベースのアテンションネットワーク(SPA-NET)を開発した。
論文 参考訳(メタデータ) (2022-03-04T22:16:50Z) - A Critical Analysis of Image-based Camera Pose Estimation Techniques [18.566761146552537]
カメラのローカライゼーションは、自律運転、ロボットナビゲーション、拡張現実(AR)など、多くのコンピュータビジョン分野に恩恵をもたらす可能性がある
本調査では,まず,異なるサブタスクに応じて,カメラのローカライゼーションポーズの特定の適用領域と評価指標を紹介する。
論文 参考訳(メタデータ) (2022-01-15T09:57:45Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Single Image Human Proxemics Estimation for Visual Social Distancing [37.84559773949066]
シーングラウンドと画像平面のホモグラフィ行列を近似する半自動解を提案する。
次に、オフザシェルフポーズ検出装置を利用して、画像上の身体のポーズを検出し、対人距離を判断する。
論文 参考訳(メタデータ) (2020-11-03T21:49:13Z) - Single View Metrology in the Wild [94.7005246862618]
本研究では,物体の3次元の高さや地上のカメラの高さで表現されるシーンの絶対的なスケールを再現する,単一ビューメロジに対する新しいアプローチを提案する。
本手法は,被写体の高さなどの3Dエンティティによる未知のカメラとの相互作用から,弱い教師付き制約を抑えるために設計されたディープネットワークによって学習されたデータ駆動の先行情報に依存する。
いくつかのデータセットと仮想オブジェクト挿入を含むアプリケーションに対して、最先端の定性的かつ定量的な結果を示す。
論文 参考訳(メタデータ) (2020-07-18T22:31:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。