論文の概要: 3D Cascade RCNN: High Quality Object Detection in Point Clouds
- arxiv url: http://arxiv.org/abs/2211.08248v1
- Date: Tue, 15 Nov 2022 15:58:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 15:11:45.193876
- Title: 3D Cascade RCNN: High Quality Object Detection in Point Clouds
- Title(参考訳): 3DカスケードRCNN:ポイントクラウドにおける高品質物体検出
- Authors: Qi Cai and Yingwei Pan and Ting Yao and Tao Mei
- Abstract要約: 本稿では3次元カスケードRCNNを提案する。これはカスケードパラダイムにおいて、酸化点雲に基づいて複数の検出器を割り当てる。
提案する3次元カスケードRCNNは,最先端の3次元物体検出技術と比較した場合の優位性を検証した。
- 参考スコア(独自算出の注目度): 122.42455210196262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent progress on 2D object detection has featured Cascade RCNN, which
capitalizes on a sequence of cascade detectors to progressively improve
proposal quality, towards high-quality object detection. However, there has not
been evidence in support of building such cascade structures for 3D object
detection, a challenging detection scenario with highly sparse LiDAR point
clouds. In this work, we present a simple yet effective cascade architecture,
named 3D Cascade RCNN, that allocates multiple detectors based on the voxelized
point clouds in a cascade paradigm, pursuing higher quality 3D object detector
progressively. Furthermore, we quantitatively define the sparsity level of the
points within 3D bounding box of each object as the point completeness score,
which is exploited as the task weight for each proposal to guide the learning
of each stage detector. The spirit behind is to assign higher weights for
high-quality proposals with relatively complete point distribution, while
down-weight the proposals with extremely sparse points that often incur noise
during training. This design of completeness-aware re-weighting elegantly
upgrades the cascade paradigm to be better applicable for the sparse input
data, without increasing any FLOP budgets. Through extensive experiments on
both the KITTI dataset and Waymo Open Dataset, we validate the superiority of
our proposed 3D Cascade RCNN, when comparing to state-of-the-art 3D object
detection techniques. The source code is publicly available at
\url{https://github.com/caiqi/Cascasde-3D}.
- Abstract(参考訳): 2次元物体検出の最近の進歩はカスケードRCNNが特徴であり、それは一連のカスケード検出器を利用して、高品質物体検出に向けた提案品質を徐々に改善している。
しかし、3Dオブジェクト検出のためのこのようなカスケード構造の構築を支持する証拠は存在せず、これは高度にスパースなLiDAR点雲による挑戦的な検出シナリオである。
本研究では,3次元カスケードRCNNという単純なカスケードアーキテクチャを提案する。このアーキテクチャは,酸化点雲に基づく複数の検出器をカスケードパラダイムで割り当て,高品質な3次元物体検出器を徐々に追求する。
さらに,各物体の3次元境界ボックス内の点の空間性レベルを点完全度スコアとして定量的に定義し,各提案のタスクウェイトとして利用し,各ステージ検出器の学習を指導する。
背後にある精神は、比較的完全な点分布を持つ高品質な提案に対して、より高い重みを割り当てることである。
この完全性認識再重み付けの設計は、フラップ予算を増加させることなく、スパース入力データに適用可能なカスケードパラダイムをエレガントにアップグレードする。
KITTIデータセットとWaymo Open Datasetの両方に関する広範な実験を通じて、最先端の3Dオブジェクト検出技術と比較して提案した3D Cascade RCNNの優位性を検証する。
ソースコードは \url{https://github.com/caiqi/Cascasde-3D} で公開されている。
関連論文リスト
- CascadeV-Det: Cascade Point Voting for 3D Object Detection [10.714006902287904]
アンカーレス物体検出器は、アンカーの余分な後処理を必要とせず、ポイントベースの予測を行うのに非常に効率的である。
2Dグリッドとは異なり、これらの検出器で使用される3Dポイントは、しばしば地上の真理の中心から遠く離れている。
本稿では,高品質な3Dオブジェクト検出を実現するカスケード投票(CascadeV)戦略を提案する。
論文 参考訳(メタデータ) (2024-01-15T05:10:27Z) - CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds [55.44204039410225]
本稿では,CAGroup3Dという新しい2段階完全スパース3Dオブジェクト検出フレームワークを提案する。
提案手法は,まず,オブジェクト表面のボクセル上でのクラス認識型局所群戦略を活用することによって,高品質な3D提案を生成する。
不正なボクセルワイドセグメンテーションにより欠落したボクセルの特徴を回復するために,完全にスパースな畳み込み型RoIプールモジュールを構築した。
論文 参考訳(メタデータ) (2022-10-09T13:38:48Z) - 3D Object Detection Combining Semantic and Geometric Features from Point
Clouds [19.127930862527666]
そこで本研究では,SGNetと呼ばれる2次元物体検出装置を提案する。
VTPMはVoxel-Point-Based Moduleであり、最終的に点空間で3Dオブジェクト検出を実装している。
2021年9月19日時点で、KITTIデータセットでは、SGNetは、難易度の高いサイクリストの3DおよびBEV検出で1位、適度なサイクリストの3D検出では2位であった。
論文 参考訳(メタデータ) (2021-10-10T04:43:27Z) - Improving 3D Object Detection with Channel-wise Transformer [58.668922561622466]
我々は手作りの最小限の設計で2段階の3Dオブジェクト検出フレームワーク(CT3D)を提案する。
CT3Dは、提案対応の埋め込みとチャンネルワイドコンテキストアグリゲーションを同時に行う。
これはKITTIテスト3D検出ベンチマークで中等車カテゴリーで81.77%のAPを達成した。
論文 参考訳(メタデータ) (2021-08-23T02:03:40Z) - Anchor-free 3D Single Stage Detector with Mask-Guided Attention for
Point Cloud [79.39041453836793]
我々は、点雲をアンカーフリーで検出する新しい1段3次元検出器を開発した。
ボクセルをベースとしたスパース3D特徴量からスパース2D特徴量マップに変換することでこれを克服する。
検出信頼度スコアとバウンディングボックス回帰の精度との相関性を改善するために,IoUに基づく検出信頼度再校正手法を提案する。
論文 参考訳(メタデータ) (2021-08-08T13:42:13Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z) - D3Feat: Joint Learning of Dense Detection and Description of 3D Local
Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。
本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。
本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文 参考訳(メタデータ) (2020-03-06T12:51:09Z) - SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint
Estimation [3.1542695050861544]
3Dの向きとオブジェクトの変換を推定することは、インフラストラクチャレスの自律走行と運転に不可欠である。
SMOKEと呼ばれる新しい3次元オブジェクト検出手法を提案する。
構造的単純さにもかかわらず、提案するSMOKEネットワークは、KITTIデータセット上の既存のモノクル3D検出方法よりも優れている。
論文 参考訳(メタデータ) (2020-02-24T08:15:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。