論文の概要: Multiview Detection with Cardboard Human Modeling
- arxiv url: http://arxiv.org/abs/2207.02013v1
- Date: Tue, 5 Jul 2022 12:47:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-06 20:04:15.254181
- Title: Multiview Detection with Cardboard Human Modeling
- Title(参考訳): カード型ヒューマンモデリングによるマルチビュー検出
- Authors: Jiahao Ma, Zicheng Duan, Yunzhong Hou, Liang Zheng, Chuong Nguyen
- Abstract要約: 本研究では,人点雲モデリングに基づく新しい歩行者表現方式を提案する。
具体的には、人体深度推定のためのレイトレーシングを用いて、歩行者を地上の直立した薄い段ボールの点雲としてモデル化する。
- 参考スコア(独自算出の注目度): 23.072791405965415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multiview detection uses multiple calibrated cameras with overlapping fields
of views to locate occluded pedestrians. In this field, existing methods
typically adopt a ``human modeling - aggregation'' strategy. To find robust
pedestrian representations, some intuitively use locations of detected 2D
bounding boxes, while others use entire frame features projected to the ground
plane. However, the former does not consider human appearance and leads to many
ambiguities, and the latter suffers from projection errors due to the lack of
accurate height of the human torso and head. In this paper, we propose a new
pedestrian representation scheme based on human point clouds modeling.
Specifically, using ray tracing for holistic human depth estimation, we model
pedestrians as upright, thin cardboard point clouds on the ground. Then, we
aggregate the point clouds of the pedestrian cardboard across multiple views
for a final decision. Compared with existing representations, the proposed
method explicitly leverages human appearance and reduces projection errors
significantly by relatively accurate height estimation. On two standard
evaluation benchmarks, the proposed method achieves very competitive results.
- Abstract(参考訳): マルチビュー検出は、重複する視野を持つ複数のキャリブレーションカメラを使用して、閉塞された歩行者を見つける。
この分野では、既存のメソッドは通常 ``human modeling - aggregate''' 戦略を採用する。
頑丈な歩行者表現を見つけるために、検出された2Dバウンディングボックスの位置を直感的に利用するものや、地上に投影されたフレーム全体の特徴を利用するものもある。
しかし、前者は人間の外見を考慮せず、多くの曖昧さを招き、後者は人間の胴体と頭部の正確な高さの欠如により投影誤差に悩まされる。
本稿では,人点雲モデリングに基づく新しい歩行者表現方式を提案する。
具体的には、人体深度推定のためのレイトレーシングを用いて、歩行者を地上の薄い段ボール点雲としてモデル化する。
そして,歩行者用段ボールの点群を複数のビューに集約して最終決定を行う。
既存の表現と比較して、提案手法は人間の外観を明示的に活用し、比較的正確な高さ推定によってプロジェクション誤差を著しく低減する。
2つの標準評価ベンチマークにおいて,提案手法は非常に競争力のある結果が得られる。
関連論文リスト
- Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh
Reconstruction [66.10717041384625]
Zollyは、視点歪みの画像に焦点を当てた最初の3DHMR法である。
人体の2次元密度ゆらぎスケールを記述した新しいカメラモデルと新しい2次元歪み画像を提案する。
このタスク用に調整された2つの現実世界のデータセットを拡張します。
論文 参考訳(メタデータ) (2023-03-24T04:22:41Z) - 3D Random Occlusion and Multi-Layer Projection for Deep Multi-Camera
Pedestrian Localization [6.929027496437192]
提案した3DROM法は,多視点歩行者検出のための最先端のディープラーニング手法と比較して,性能が大幅に向上した。
論文 参考訳(メタデータ) (2022-07-22T06:15:20Z) - Dual networks based 3D Multi-Person Pose Estimation from Monocular Video [42.01876518017639]
複数人の3Dポーズ推定はシングルポーズ推定よりも難しい。
既存のトップダウンとボトムアップのアプローチでは、推定が検出エラーに悩まされる。
我々は,トップダウンアプローチとボトムアップアプローチを統合して,その強みを活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T08:53:38Z) - Generalizable Multi-Camera 3D Pedestrian Detection [1.8303072203996347]
本稿では,対象シーンからのデータを用いて訓練する必要がないマルチカメラ3D歩行者検出手法を提案する。
既製の単眼検出器から人体のポーズと人のバウンディングボックスに基づく小説を用いて、地上平面上の歩行者の位置を推定する。
次に、これらの場所をワールドグランドプレーンに投影し、クライクカバー問題の新たな定式化と融合させます。
論文 参考訳(メタデータ) (2021-04-12T20:58:25Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - Wide-Depth-Range 6D Object Pose Estimation in Space [124.94794113264194]
宇宙での6Dポーズ推定は、地上環境では一般的に遭遇しないユニークな課題を引き起こします。
最も顕著な違いの1つは、大気の散乱の欠如であり、物体を遠くから見えるようにします。
本稿では,単一段階の階層型エンドツーエンドトレーニングネットワークを提案する。
論文 参考訳(メタデータ) (2021-04-01T08:39:26Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z) - Error Bounds of Projection Models in Weakly Supervised 3D Human Pose
Estimation [27.289210415215067]
本稿では,最もよく用いられる簡易射影モデルの詳細な解析を行う。
我々は、この保証された最小誤差を避けるために、正規化された視点投影をどのように置き換えるかを示す。
以上の結果から,どちらの射影モデルも位置とスケールの整列後も,19.3mmから54.7mmの誤差が生じることがわかった。
論文 参考訳(メタデータ) (2020-10-23T11:48:13Z) - Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View
Geometry [62.29762409558553]
マルチパーソナライズされた3次元ポーズ推定手法における特徴マッチングと深さ推定のコアは、エピポーラ制約である。
スパサーの群衆シーンにおけるこの定式化の良好なパフォーマンスにもかかわらず、その効果はより密集した群衆の状況下でしばしば挑戦される。
本稿では,マルチパーソン3次元ポーズ推定式から脱却し,群衆ポーズ推定として再編成する。
論文 参考訳(メタデータ) (2020-07-21T17:59:36Z) - Coherent Reconstruction of Multiple Humans from a Single Image [68.3319089392548]
本研究では,1枚の画像から多人数の3Dポーズ推定を行う問題に対処する。
この問題のトップダウン設定における典型的な回帰アプローチは、まずすべての人間を検出し、それぞれを独立して再構築する。
我々のゴールは、これらの問題を回避し、現場のすべての人間のコヒーレントな3D再構成を生成するために学習する単一のネットワークをトレーニングすることである。
論文 参考訳(メタデータ) (2020-06-15T17:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。