論文の概要: SCP: Scene Completion Pre-training for 3D Object Detection
- arxiv url: http://arxiv.org/abs/2309.06199v1
- Date: Tue, 12 Sep 2023 13:08:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 13:02:00.160935
- Title: SCP: Scene Completion Pre-training for 3D Object Detection
- Title(参考訳): SCP: 3次元物体検出のためのシーン補完事前学習
- Authors: Yiming Shan, Yan Xia, Yuhong Chen, Daniel Cremers
- Abstract要約: LiDARポイントクラウドを用いた3Dオブジェクト検出は、コンピュータビジョン、ロボティクス、自律運転の分野における基本的なタスクである。
既存の3D検出器は、アノテーション付きデータセットに大きく依存している。
ラベル付きデータが少ない3Dオブジェクト検出器の性能を向上させるために,シーンコンプリート事前学習法を提案する。
- 参考スコア(独自算出の注目度): 43.66751537743793
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D object detection using LiDAR point clouds is a fundamental task in the
fields of computer vision, robotics, and autonomous driving. However, existing
3D detectors heavily rely on annotated datasets, which are both time-consuming
and prone to errors during the process of labeling 3D bounding boxes. In this
paper, we propose a Scene Completion Pre-training (SCP) method to enhance the
performance of 3D object detectors with less labeled data. SCP offers three key
advantages: (1) Improved initialization of the point cloud model. By completing
the scene point clouds, SCP effectively captures the spatial and semantic
relationships among objects within urban environments. (2) Elimination of the
need for additional datasets. SCP serves as a valuable auxiliary network that
does not impose any additional efforts or data requirements on the 3D
detectors. (3) Reduction of the amount of labeled data for detection. With the
help of SCP, the existing state-of-the-art 3D detectors can achieve comparable
performance while only relying on 20% labeled data.
- Abstract(参考訳): LiDARポイントクラウドを用いた3Dオブジェクト検出は、コンピュータビジョン、ロボティクス、自律運転の分野における基本的なタスクである。
しかし、既存の3D検出器はアノテーション付きデータセットに大きく依存しており、3Dバウンディングボックスをラベル付けする過程でエラーが発生する。
本稿では,ラベルの少ない3次元物体検出器の性能を向上させるためのシーン補完プリトレーニング(scp)手法を提案する。
1)ポイントクラウドモデルの初期化の改善。
シーンポイント雲を完了させることで、SCPは都市環境内のオブジェクト間の空間的および意味的関係を効果的にキャプチャする。
(2)追加のデータセットの必要性の排除。
SCPは、3D検出器に追加の努力やデータ要求を課さない貴重な補助ネットワークとして機能する。
(3)検出のためのラベル付きデータの量を削減する。
SCPの助けを借りて、既存の最先端の3D検出器は20%のラベル付きデータに頼るだけで同等のパフォーマンスを達成できる。
関連論文リスト
- STONE: A Submodular Optimization Framework for Active 3D Object Detection [20.54906045954377]
正確な3Dオブジェクト検出器をトレーニングするための鍵となる要件は、大量のLiDARベースのポイントクラウドデータが利用できることである。
本稿では,3次元物体検出装置のトレーニングにおけるラベル付けコストを大幅に削減する,統合されたアクティブな3次元物体検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-04T20:45:33Z) - 3D Small Object Detection with Dynamic Spatial Pruning [62.72638845817799]
本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。
空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。
ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文 参考訳(メタデータ) (2023-05-05T17:57:04Z) - Surface-biased Multi-Level Context 3D Object Detection [1.9723551683930771]
本研究は,高効率表面偏光特性抽出法(wang2022rbgnet)を用いて3次元点雲中の物体検出タスクに対処する。
本稿では,オブジェクト候補の正確な特徴表現を抽出し,点パッチやオブジェクト候補,グローバルシーンにおける自己注意を活用する3Dオブジェクト検出手法を提案する。
論文 参考訳(メタデータ) (2023-02-13T11:50:04Z) - CMR3D: Contextualized Multi-Stage Refinement for 3D Object Detection [57.44434974289945]
本稿では,3次元オブジェクト検出(CMR3D)フレームワークのためのコンテキスト型マルチステージリファインメントを提案する。
我々のフレームワークは3Dシーンを入力として取り、シーンの有用なコンテキスト情報を明示的に統合しようと試みている。
3Dオブジェクトの検出に加えて,3Dオブジェクトカウント問題に対するフレームワークの有効性について検討する。
論文 参考訳(メタデータ) (2022-09-13T05:26:09Z) - Label-Guided Auxiliary Training Improves 3D Object Detector [32.96310946612949]
3次元物体検出(LG3D)のためのラベル誘導補助訓練法を提案する。
提案したLG3Dは,SUN RGB-DおよびScanNetV2データセット上でVoteNetを2.5%,3.1%改善する。
論文 参考訳(メタデータ) (2022-07-24T14:22:21Z) - 3D Spatial Recognition without Spatially Labeled 3D [127.6254240158249]
Weakly-supervised framework for Point cloud Recognitionを紹介する。
We show that WyPR can detected and segment objects in point cloud data without access any space labels at training time。
論文 参考訳(メタデータ) (2021-05-13T17:58:07Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z) - Boundary-Aware Dense Feature Indicator for Single-Stage 3D Object
Detection from Point Clouds [32.916690488130506]
本稿では,3次元検出器が境界を意識して点雲の最も密集した領域に焦点を合わせるのを支援する普遍モジュールを提案する。
KITTIデータセットの実験により、DENFIはベースライン単段検出器の性能を著しく改善することが示された。
論文 参考訳(メタデータ) (2020-04-01T01:21:23Z) - D3Feat: Joint Learning of Dense Detection and Description of 3D Local
Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。
本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。
本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文 参考訳(メタデータ) (2020-03-06T12:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。