論文の概要: 3D Object Detection Combining Semantic and Geometric Features from Point
Clouds
- arxiv url: http://arxiv.org/abs/2110.04704v1
- Date: Sun, 10 Oct 2021 04:43:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 18:09:29.333336
- Title: 3D Object Detection Combining Semantic and Geometric Features from Point
Clouds
- Title(参考訳): 点雲からの意味的特徴と幾何学的特徴を組み合わせた3次元物体検出
- Authors: Hao Peng, Guofeng Tong, Zheng Li, Yaqi Wang, Yuyuan Shao
- Abstract要約: そこで本研究では,SGNetと呼ばれる2次元物体検出装置を提案する。
VTPMはVoxel-Point-Based Moduleであり、最終的に点空間で3Dオブジェクト検出を実装している。
2021年9月19日時点で、KITTIデータセットでは、SGNetは、難易度の高いサイクリストの3DおよびBEV検出で1位、適度なサイクリストの3D検出では2位であった。
- 参考スコア(独自算出の注目度): 19.127930862527666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we investigate the combination of voxel-based methods and
point-based methods, and propose a novel end-to-end two-stage 3D object
detector named SGNet for point clouds scenes. The voxel-based methods voxelize
the scene to regular grids, which can be processed with the current advanced
feature learning frameworks based on convolutional layers for semantic feature
learning. Whereas the point-based methods can better extract the geometric
feature of the point due to the coordinate reservations. The combination of the
two is an effective solution for 3D object detection from point clouds.
However, most current methods use a voxel-based detection head with anchors for
final classification and localization. Although the preset anchors cover the
entire scene, it is not suitable for point clouds detection tasks with larger
scenes and multiple categories due to the limitation of voxel size. In this
paper, we propose a voxel-to-point module (VTPM) that captures semantic and
geometric features. The VTPM is a Voxel-Point-Based Module that finally
implements 3D object detection in point space, which is more conducive to the
detection of small-size objects and avoids the presets of anchors in inference
stage. In addition, a Confidence Adjustment Module (CAM) with the
center-boundary-aware confidence attention is proposed to solve the
misalignment between the predicted confidence and proposals in the regions of
the interest (RoI) selection. The SGNet proposed in this paper has achieved
state-of-the-art results for 3D object detection in the KITTI dataset,
especially in the detection of small-size objects such as cyclists. Actually,
as of September 19, 2021, for KITTI dataset, SGNet ranked 1st in 3D and BEV
detection on cyclists with easy difficulty level, and 2nd in the 3D detection
of moderate cyclists.
- Abstract(参考訳): 本稿では,voxel-based method と point-based method の組み合わせについて検討し,SGNet と呼ばれる新しいエンドツーエンドの2次元物体検出器を提案する。
ボクセルベースの手法はシーンを通常のグリッドに酸化し、セマンティックな特徴学習のための畳み込み層に基づいた現在の高度な特徴学習フレームワークで処理することができる。
点に基づく手法は座標予約による点の幾何学的特徴をよりよく抽出することができる。
この2つの組み合わせは、ポイントクラウドからの3dオブジェクト検出に有効なソリューションである。
しかし、現在のほとんどの方法は、最終分類と局在化のためにアンカー付きのvoxelベースの検出ヘッドを使用している。
プリセットアンカーはシーン全体をカバーするが、ボクセルサイズの制限のため、より大きなシーンと複数のカテゴリを持つポイントクラウド検出タスクには適していない。
本稿では,意味的および幾何学的特徴を捉えたvoxel-to-pointモジュール(vtpm)を提案する。
VTPMはVoxel-Point-Based Module(VTPM)であり、最終的に点空間で3Dオブジェクト検出を実装している。
また,センター・バウンダリー・アウェア・信頼度を考慮した信頼度調整モジュール(cam)を提案し,利子選択領域における予測信頼度と提案のずれを解決する。
本稿で提案したSGNetは,KITTIデータセットにおける3次元物体検出,特にサイクリストなどの小型物体検出において,最先端の成果を得た。
実際、2021年9月19日時点で、KITTIデータセットでは、SGNetは、難易度の高いサイクリストの3DおよびBEV検出で1位、適度なサイクリストの3D検出では2位だった。
関連論文リスト
- 3D Cascade RCNN: High Quality Object Detection in Point Clouds [122.42455210196262]
本稿では3次元カスケードRCNNを提案する。これはカスケードパラダイムにおいて、酸化点雲に基づいて複数の検出器を割り当てる。
提案する3次元カスケードRCNNは,最先端の3次元物体検出技術と比較した場合の優位性を検証した。
論文 参考訳(メタデータ) (2022-11-15T15:58:36Z) - CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds [55.44204039410225]
本稿では,CAGroup3Dという新しい2段階完全スパース3Dオブジェクト検出フレームワークを提案する。
提案手法は,まず,オブジェクト表面のボクセル上でのクラス認識型局所群戦略を活用することによって,高品質な3D提案を生成する。
不正なボクセルワイドセグメンテーションにより欠落したボクセルの特徴を回復するために,完全にスパースな畳み込み型RoIプールモジュールを構築した。
論文 参考訳(メタデータ) (2022-10-09T13:38:48Z) - RBGNet: Ray-based Grouping for 3D Object Detection [104.98776095895641]
本稿では,点雲からの正確な3次元物体検出のための投票型3次元検出器RBGNetフレームワークを提案する。
決定された光線群を用いて物体表面上の点方向の特徴を集約する。
ScanNet V2 と SUN RGB-D による最先端の3D 検出性能を実現する。
論文 参考訳(メタデータ) (2022-04-05T14:42:57Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - Anchor-free 3D Single Stage Detector with Mask-Guided Attention for
Point Cloud [79.39041453836793]
我々は、点雲をアンカーフリーで検出する新しい1段3次元検出器を開発した。
ボクセルをベースとしたスパース3D特徴量からスパース2D特徴量マップに変換することでこれを克服する。
検出信頼度スコアとバウンディングボックス回帰の精度との相関性を改善するために,IoUに基づく検出信頼度再校正手法を提案する。
論文 参考訳(メタデータ) (2021-08-08T13:42:13Z) - InfoFocus: 3D Object Detection for Autonomous Driving with Dynamic
Information Modeling [65.47126868838836]
動的情報モデリングを用いた新しい3次元オブジェクト検出フレームワークを提案する。
粗い予測は、ボクセルベースの領域提案ネットワークを介して第1段階で生成される。
大規模なnuScenes 3D検出ベンチマークで実験を行った。
論文 参考訳(メタデータ) (2020-07-16T18:27:08Z) - 1st Place Solution for Waymo Open Dataset Challenge -- 3D Detection and
Domain Adaptation [7.807118356899879]
本研究では,一段式,アンカーフリー,NMSフリーの3Dポイント・クラウド・オブジェクト検出器AFDetを提案する。
AFDetは私たちの勝利ソリューションの強力なベースラインとして機能します。
我々は、より強力なネットワークを設計し、デンシフィケーションとポイントペインティングを用いてポイントクラウドデータを強化する。
論文 参考訳(メタデータ) (2020-06-28T04:49:39Z) - Stereo RGB and Deeper LIDAR Based Network for 3D Object Detection [40.34710686994996]
3Dオブジェクト検出は、自動運転のシナリオにおいて新たな課題となっている。
以前の作業では、プロジェクションベースまたはボクセルベースのモデルを使用して3Dポイントクラウドを処理していた。
本稿では,意味情報と空間情報の同時利用が可能なStereo RGBおよびDeeper LIDARフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-09T11:19:24Z) - Object as Hotspots: An Anchor-Free 3D Object Detection Approach via
Firing of Hotspots [37.16690737208046]
オブジェクトレベルのアンカーを用いた既存のメソッドとは逆のアプローチを論じる。
構成モデルに着想を得て、内部の空でないボクセルの組成として、ホットスポットと呼ばれる物体を提案する。
提案手法は,OHSに基づく新しい地中真理割当て戦略を用いたアンカーフリー検出ヘッドを提案する。
論文 参考訳(メタデータ) (2019-12-30T03:02:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。