論文の概要: Object as Hotspots: An Anchor-Free 3D Object Detection Approach via
Firing of Hotspots
- arxiv url: http://arxiv.org/abs/1912.12791v3
- Date: Tue, 13 Oct 2020 05:04:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-17 02:32:51.810168
- Title: Object as Hotspots: An Anchor-Free 3D Object Detection Approach via
Firing of Hotspots
- Title(参考訳): object as hotspots: hotspotsの発射によるアンカーフリー3dオブジェクト検出アプローチ
- Authors: Qi Chen, Lin Sun, Zhixin Wang, Kui Jia, Alan Yuille
- Abstract要約: オブジェクトレベルのアンカーを用いた既存のメソッドとは逆のアプローチを論じる。
構成モデルに着想を得て、内部の空でないボクセルの組成として、ホットスポットと呼ばれる物体を提案する。
提案手法は,OHSに基づく新しい地中真理割当て戦略を用いたアンカーフリー検出ヘッドを提案する。
- 参考スコア(独自算出の注目度): 37.16690737208046
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate 3D object detection in LiDAR based point clouds suffers from the
challenges of data sparsity and irregularities. Existing methods strive to
organize the points regularly, e.g. voxelize, pass them through a designed
2D/3D neural network, and then define object-level anchors that predict offsets
of 3D bounding boxes using collective evidences from all the points on the
objects of interest. Contrary to the state-of-the-art anchor-based methods,
based on the very nature of data sparsity, we observe that even points on an
individual object part are informative about semantic information of the
object. We thus argue in this paper for an approach opposite to existing
methods using object-level anchors. Inspired by compositional models, which
represent an object as parts and their spatial relations, we propose to
represent an object as composition of its interior non-empty voxels, termed
hotspots, and the spatial relations of hotspots. This gives rise to the
representation of Object as Hotspots (OHS). Based on OHS, we further propose an
anchor-free detection head with a novel ground truth assignment strategy that
deals with inter-object point-sparsity imbalance to prevent the network from
biasing towards objects with more points. Experimental results show that our
proposed method works remarkably well on objects with a small number of points.
Notably, our approach ranked 1st on KITTI 3D Detection Benchmark for cyclist
and pedestrian detection, and achieved state-of-the-art performance on NuScenes
3D Detection Benchmark.
- Abstract(参考訳): LiDARベースの点雲における正確な3Dオブジェクト検出は、データのスパーシリティと不規則性の課題に悩まされる。
既存の手法では、voxelizeのようなポイントを定期的に整理し、設計した2d/3dニューラルネットワークに渡して、3dバウンディングボックスのオフセットを予測するオブジェクトレベルのアンカーを定義している。
現状のアンカーベースの手法とは対照的に、データ空間の性質に基づいて、個々のオブジェクト部分のポイントでさえ、オブジェクトのセマンティック情報について情報を提供する。
そこで本稿では,オブジェクトレベルのアンカーを用いた既存手法と逆のアプローチを論じる。
対象を部分とその空間的関係として表現する合成モデルに着想を得て,対象を内部非空ボクセル,いわゆるホットスポット,ホットスポットの空間的関係の合成として表現することを提案する。
これはオブジェクトをhotspots(ohs)として表現する原因となります。
さらに,OHSに基づいて,物体間疎度不均衡に対処し,ネットワークがより多くの点を持つ物体に対して偏りを生じないようにする,新たな地平真理割当戦略を持つアンカーフリー検出ヘッドを提案する。
実験の結果,提案手法は点数が少ない物体に対して非常に有効であることがわかった。
提案手法は,自転車および歩行者検出におけるKITTI 3D Detection Benchmarkで1位にランクされ,NuScenes 3D Detection Benchmarkで最先端のパフォーマンスを達成した。
関連論文リスト
- SeSame: Simple, Easy 3D Object Detection with Point-Wise Semantics [0.7373617024876725]
自律運転では、3Dオブジェクト検出は、経路計画や動き推定を含む下流タスクに対してより正確な情報を提供する。
本稿では,既存のLiDARのみに基づく3Dオブジェクト検出における意味情報の強化を目的としたSeSameを提案する。
KITTIオブジェクト検出ベンチマークにおいて,提案手法の有効性を示す実験を行った。
論文 参考訳(メタデータ) (2024-03-11T08:17:56Z) - 3DRP-Net: 3D Relative Position-aware Network for 3D Visual Grounding [58.924180772480504]
3Dビジュアルグラウンドは、自由形式の言語記述によって、ターゲットオブジェクトを3Dポイントクラウドにローカライズすることを目的としている。
3次元相対位置認識ネットワーク(3-Net)という,関係性を考慮した一段階フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-25T09:33:25Z) - PSA-Det3D: Pillar Set Abstraction for 3D object Detection [14.788139868324155]
我々は,小物体の検出性能を向上させるために,柱集合抽象化(PSA)と前景点補償(FPC)を提案する。
KITTI 3D 検出ベンチマーク実験の結果,提案した PSA-Det3D は他のアルゴリズムよりも高い精度で小物体検出を行うことができた。
論文 参考訳(メタデータ) (2022-10-20T03:05:34Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - RBGNet: Ray-based Grouping for 3D Object Detection [104.98776095895641]
本稿では,点雲からの正確な3次元物体検出のための投票型3次元検出器RBGNetフレームワークを提案する。
決定された光線群を用いて物体表面上の点方向の特徴を集約する。
ScanNet V2 と SUN RGB-D による最先端の3D 検出性能を実現する。
論文 参考訳(メタデータ) (2022-04-05T14:42:57Z) - ImpDet: Exploring Implicit Fields for 3D Object Detection [74.63774221984725]
我々は、境界ボックス回帰を暗黙の関数として見る新しい視点を導入する。
これは、Implicit DetectionまたはImpDetと呼ばれる提案されたフレームワークにつながります。
我々のImpDetは、異なる局所的な3次元空間の点に特定の値を割り当て、高品質な境界を生成することができる。
論文 参考訳(メタデータ) (2022-03-31T17:52:12Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - 3D Object Detection Combining Semantic and Geometric Features from Point
Clouds [19.127930862527666]
そこで本研究では,SGNetと呼ばれる2次元物体検出装置を提案する。
VTPMはVoxel-Point-Based Moduleであり、最終的に点空間で3Dオブジェクト検出を実装している。
2021年9月19日時点で、KITTIデータセットでは、SGNetは、難易度の高いサイクリストの3DおよびBEV検出で1位、適度なサイクリストの3D検出では2位であった。
論文 参考訳(メタデータ) (2021-10-10T04:43:27Z) - Group-Free 3D Object Detection via Transformers [26.040378025818416]
3Dポイントクラウドから3Dオブジェクトを直接検出するためのシンプルで効果的な方法を紹介します。
本手法は, 点群内のすべての点から物体の特徴を, 変圧器 citevaswaniattention における注意機構の助けを借りて計算する。
ベルやホイッスルが少ないため,ScanNet V2とSUN RGB-Dの2つのベンチマークで最先端の3Dオブジェクト検出性能を実現する。
論文 参考訳(メタデータ) (2021-04-01T17:59:36Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。