論文の概要: Behind the Curtain: Learning Occluded Shapes for 3D Object Detection
- arxiv url: http://arxiv.org/abs/2112.02205v1
- Date: Sat, 4 Dec 2021 00:48:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-11 05:59:20.072441
- Title: Behind the Curtain: Learning Occluded Shapes for 3D Object Detection
- Title(参考訳): カーテンの後ろ:3次元物体検出のための付加形状学習
- Authors: Qiangeng Xu, Yiqi Zhong, Ulrich Neumann
- Abstract要約: We present a novel LiDAR-based 3D object detection model called Behind the Curtain Detector (BtcDet)。
BtcDetは、対象の形状を先行して学習し、点雲に部分的に隠された(保持された)完全な対象の形状を推定する。
これらの領域では,領域が対象形状を含むかどうかを示す占有確率が予測される。
- 参考スコア(独自算出の注目度): 13.67757407624219
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Advances in LiDAR sensors provide rich 3D data that supports 3D scene
understanding. However, due to occlusion and signal miss, LiDAR point clouds
are in practice 2.5D as they cover only partial underlying shapes, which poses
a fundamental challenge to 3D perception. To tackle the challenge, we present a
novel LiDAR-based 3D object detection model, dubbed Behind the Curtain Detector
(BtcDet), which learns the object shape priors and estimates the complete
object shapes that are partially occluded (curtained) in point clouds. BtcDet
first identifies the regions that are affected by occlusion and signal miss. In
these regions, our model predicts the probability of occupancy that indicates
if a region contains object shapes. Integrated with this probability map,
BtcDet can generate high-quality 3D proposals. Finally, the probability of
occupancy is also integrated into a proposal refinement module to generate the
final bounding boxes. Extensive experiments on the KITTI Dataset and the Waymo
Open Dataset demonstrate the effectiveness of BtcDet. Particularly, for the 3D
detection of both cars and cyclists on the KITTI benchmark, BtcDet surpasses
all of the published state-of-the-art methods by remarkable margins. Code is
released
(https://github.com/Xharlie/BtcDet}{https://github.com/Xharlie/BtcDet).
- Abstract(参考訳): LiDARセンサーの進歩は、3Dシーン理解をサポートするリッチな3Dデータを提供する。
しかし、オクルージョンと信号ミスのため、LiDAR点雲は実際には2.5Dであり、部分的な基礎的な形状しかカバーしていない。
そこで本研究では,物体の形状を事前に学習し,ポイント・クラウドで部分的に遮蔽(測定)された完全な物体形状を推定するカーテン・ディテクター(btcdet)と呼ばれる,ライダーを用いた新しい3次元物体検出モデルを提案する。
BtcDetは、最初に閉塞と信号ミスによって影響を受ける領域を特定する。
これらの領域では,領域が対象形状を含むかどうかを示す占有確率が予測される。
この確率マップと統合して、BtcDetは高品質な3D提案を生成することができる。
最後に、占有確率も提案改良モジュールに統合され、最終境界ボックスを生成する。
KITTIデータセットとWaymo Open Datasetに関する大規模な実験は、BtcDetの有効性を実証している。
特に、KITTIベンチマークで車とサイクリストの両方を3Dで検出するために、BtcDetは、公開された最先端の手法を驚くほど上回っている。
コードはリリースされている(https://github.com/Xharlie/BtcDet}{https://github.com/Xharlie/BtcDet)。
関連論文リスト
- Training an Open-Vocabulary Monocular 3D Object Detection Model without 3D Data [57.53523870705433]
我々はOVM3D-Detと呼ばれる新しいオープン語彙単分子オブジェクト検出フレームワークを提案する。
OVM3D-Detは、入力または3Dバウンディングボックスを生成するために高精度のLiDARや3Dセンサーデータを必要としない。
オープンボキャブラリ2Dモデルと擬似LiDARを使用して、RGB画像に3Dオブジェクトを自動的にラベル付けし、オープンボキャブラリ単分子3D検出器の学習を促進する。
論文 参考訳(メタデータ) (2024-11-23T21:37:21Z) - Learning Occupancy for Monocular 3D Object Detection [25.56336546513198]
モノクローナル3次元検出のための占有度学習法であるtextbfOccupancy M3D を提案する。
フラストムと3D空間の占有を直接学習し、より差別的で情報的な3D特徴や表現をもたらす。
KITTIとオープンデータセットの実験により,提案手法が新たな最先端技術を実現し,他の手法をはるかに上回っていることが示された。
論文 参考訳(メタデータ) (2023-05-25T04:03:46Z) - BSH-Det3D: Improving 3D Object Detection with BEV Shape Heatmap [10.060577111347152]
我々は,BSH-Det3Dという新しいLiDARベースの3Dオブジェクト検出モデルを提案する。
鳥の視線から完全な形状を推定することにより、空間的特徴を高める効果的な方法を適用する。
KITTIベンチマークの実験は、精度と速度の観点から最先端(SOTA)性能を達成する。
論文 参考訳(メタデータ) (2023-03-03T15:13:11Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR-based
Perception [122.53774221136193]
運転時のLiDARに基づく認識のための最先端の手法は、しばしば点雲を2D空間に投影し、2D畳み込みによって処理する。
自然な対策として、3Dボクセル化と3D畳み込みネットワークを利用する方法がある。
本研究では,3次元幾何学的パターンを探索するために,円筒状分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-12T06:25:11Z) - Anchor-free 3D Single Stage Detector with Mask-Guided Attention for
Point Cloud [79.39041453836793]
我々は、点雲をアンカーフリーで検出する新しい1段3次元検出器を開発した。
ボクセルをベースとしたスパース3D特徴量からスパース2D特徴量マップに変換することでこれを克服する。
検出信頼度スコアとバウンディングボックス回帰の精度との相関性を改善するために,IoUに基づく検出信頼度再校正手法を提案する。
論文 参考訳(メタデータ) (2021-08-08T13:42:13Z) - FGR: Frustum-Aware Geometric Reasoning for Weakly Supervised 3D Vehicle
Detection [81.79171905308827]
3Dアノテーションを使わずに点雲中の車両を検出するためのフラストラム対応幾何推論(FGR)を提案する。
本手法は粗い3次元セグメンテーションと3次元バウンディングボックス推定の2段階からなる。
2Dバウンディングボックスとスパースポイントクラウドだけで、3D空間内のオブジェクトを正確に検出できます。
論文 参考訳(メタデータ) (2021-05-17T07:29:55Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - Learning to Predict the 3D Layout of a Scene [0.3867363075280544]
本稿では,単一のRGB画像のみを使用する手法を提案し,LiDARセンサを持たないデバイスや車両に適用できるようにする。
KITTIデータセットは,クラスラベル付き道路交通シーン,2D境界ボックス,自由度7自由度3Dアノテーションで構成される。
我々は、公式のKITTIベンチマークで要求されるように、結合閾値70%の3次元交差で測定された適度に困難なデータに対して平均47.3%の平均精度を達成し、従来の最先端のRGBのみの手法よりも大きなマージンで上回った。
論文 参考訳(メタデータ) (2020-11-19T17:23:30Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z) - SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint
Estimation [3.1542695050861544]
3Dの向きとオブジェクトの変換を推定することは、インフラストラクチャレスの自律走行と運転に不可欠である。
SMOKEと呼ばれる新しい3次元オブジェクト検出手法を提案する。
構造的単純さにもかかわらず、提案するSMOKEネットワークは、KITTIデータセット上の既存のモノクル3D検出方法よりも優れている。
論文 参考訳(メタデータ) (2020-02-24T08:15:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。