論文の概要: Generalizable Multi-Camera 3D Pedestrian Detection
- arxiv url: http://arxiv.org/abs/2104.05813v1
- Date: Mon, 12 Apr 2021 20:58:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-14 13:30:52.435400
- Title: Generalizable Multi-Camera 3D Pedestrian Detection
- Title(参考訳): 一般化可能なマルチカメラ3D歩行者検出
- Authors: Jo\~ao Paulo Lima, Rafael Roberto, Lucas Figueiredo, Francisco
Sim\~oes, Veronica Teichrieb
- Abstract要約: 本稿では,対象シーンからのデータを用いて訓練する必要がないマルチカメラ3D歩行者検出手法を提案する。
既製の単眼検出器から人体のポーズと人のバウンディングボックスに基づく小説を用いて、地上平面上の歩行者の位置を推定する。
次に、これらの場所をワールドグランドプレーンに投影し、クライクカバー問題の新たな定式化と融合させます。
- 参考スコア(独自算出の注目度): 1.8303072203996347
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a multi-camera 3D pedestrian detection method that does not need
to train using data from the target scene. We estimate pedestrian location on
the ground plane using a novel heuristic based on human body poses and person's
bounding boxes from an off-the-shelf monocular detector. We then project these
locations onto the world ground plane and fuse them with a new formulation of a
clique cover problem. We also propose an optional step for exploiting
pedestrian appearance during fusion by using a domain-generalizable person
re-identification model. We evaluated the proposed approach on the challenging
WILDTRACK dataset. It obtained a MODA of 0.569 and an F-score of 0.78, superior
to state-of-the-art generalizable detection techniques.
- Abstract(参考訳): 本稿では,対象シーンからのデータを用いて訓練する必要がないマルチカメラ3D歩行者検出手法を提案する。
既設のモノクロ検出器から人体のポーズと人のバウンディングボックスに基づいて,新しいヒューリスティックを用いて地上の歩行者位置を推定する。
次に、これらの場所をワールドグランドプレーンに投影し、クライクカバー問題の新たな定式化と融合させます。
また, ドメイン一般化された人物再同定モデルを用いて, 融合中の歩行者の出現を利用するための任意のステップを提案する。
WILDTRACKデータセットに対する提案手法の評価を行った。
0.569のmodaと0.78のf-scoreを取得し、最先端の一般化検出技術よりも優れている。
関連論文リスト
- Sparse Points to Dense Clouds: Enhancing 3D Detection with Limited LiDAR Data [68.18735997052265]
単分子と点雲に基づく3次元検出の利点を組み合わせたバランスの取れたアプローチを提案する。
本手法では,低コストで低解像度のセンサから得られる3Dポイントを少数必要としている。
3次元検出の精度は最先端の単分子検出法と比較して20%向上する。
論文 参考訳(メタデータ) (2024-04-10T03:54:53Z) - Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments [67.83787474506073]
我々は,現在のLiDARに基づく3Dオブジェクト検出システムの限界に対処する。
本稿では,3次元OVタスクに対する汎用textscFind n' Propagate アプローチを提案する。
我々は、新しいオブジェクトクラスに対する平均精度(AP)を最大3.97倍に向上させる。
論文 参考訳(メタデータ) (2024-03-20T12:51:30Z) - Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving [91.39625612027386]
我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T07:11:36Z) - Ground Plane Matters: Picking Up Ground Plane Prior in Monocular 3D
Object Detection [92.75961303269548]
先行する地平面は、モノクル3次元物体検出(M3OD)における非常に情報的な幾何学的手がかりである
本稿では,両問題を一度に解決するGPENetを提案する。
我々のGPENetは、他の手法よりも優れ、最先端のパフォーマンスを実現し、提案手法の有効性と優位性を示すことができる。
論文 参考訳(メタデータ) (2022-11-03T02:21:35Z) - Det6D: A Ground-Aware Full-Pose 3D Object Detector for Improving Terrain
Robustness [1.4620086904601473]
空間的・姿勢的制約を伴わない初の完全自由度3次元物体検出器であるDet6Dを提案する。
ピッチやロールを含む全方向のポーズを予測するために,地上認識方向分岐を設計する。
異なる地形における本手法の有効性とロバスト性について実験を行った。
論文 参考訳(メタデータ) (2022-07-19T17:12:48Z) - Multiview Detection with Cardboard Human Modeling [23.072791405965415]
本研究では,人点雲モデリングに基づく新しい歩行者表現方式を提案する。
具体的には、人体深度推定のためのレイトレーシングを用いて、歩行者を地上の直立した薄い段ボールの点雲としてモデル化する。
論文 参考訳(メタデータ) (2022-07-05T12:47:26Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - Gated3D: Monocular 3D Object Detection From Temporal Illumination Cues [28.806932489163888]
低コストな単分子ゲート型画像処理装置から時間的照度を利用した新しい3次元物体検出法を提案する。
提案手法は,1万km以上の運転データから得られたゲート画像を含む新しい3次元検出データセットを用いて評価する。
論文 参考訳(メタデータ) (2021-02-06T16:06:51Z) - Single-Shot 3D Detection of Vehicles from Monocular RGB Images via
Geometry Constrained Keypoints in Real-Time [6.82446891805815]
単眼RGB画像における車両検出のための新しい3次元単発物体検出法を提案する。
提案手法は,3次元空間への2次元検出を付加回帰および分類パラメータの予測により引き上げる。
KITTI 3D Object Detection と新しい nuScenes Object Detection ベンチマークを用いて,自律走行のための異なるデータセットに対するアプローチを検証し,その評価を行った。
論文 参考訳(メタデータ) (2020-06-23T15:10:19Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。