論文の概要: S-AT GCN: Spatial-Attention Graph Convolution Network based Feature
Enhancement for 3D Object Detection
- arxiv url: http://arxiv.org/abs/2103.08439v1
- Date: Mon, 15 Mar 2021 15:08:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 14:04:53.309312
- Title: S-AT GCN: Spatial-Attention Graph Convolution Network based Feature
Enhancement for 3D Object Detection
- Title(参考訳): S-AT GCN:空間アテンショングラフ畳み込みネットワークによる3次元物体検出機能強化
- Authors: Li Wang, Chenfei Wang, Xinyu Zhang, Tianwei Lan, Jun Li
- Abstract要約: 3dオブジェクト検出は、自動運転車の環境認識において重要な役割を果たす。
パーティション操作では、歩行者のような単一のインスタンスを複数の部分にスライスし、それをパーティション効果と呼びます。
本稿では,この欠点を克服する特徴強調層を形成するための空間アテンショングラフ畳み込み(S-AT GCN)を提案する。
- 参考スコア(独自算出の注目度): 14.164085180145495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D object detection plays a crucial role in environmental perception for
autonomous vehicles, which is the prerequisite of decision and control. This
paper analyses partition-based methods' inherent drawbacks. In the partition
operation, a single instance such as a pedestrian is sliced into several
pieces, which we call it the partition effect. We propose the Spatial-Attention
Graph Convolution (S-AT GCN), forming the Feature Enhancement (FE) layers to
overcome this drawback. The S-AT GCN utilizes the graph convolution and the
spatial attention mechanism to extract local geometrical structure features.
This allows the network to have more meaningful features for the foreground.
Our experiments on the KITTI 3D object and bird's eye view detection show that
S-AT Conv and FE layers are effective, especially for small objects. FE layers
boost the pedestrian class performance by 3.62\% and cyclist class by 4.21\% 3D
mAP. The time cost of these extra FE layers are limited. PointPillars with FE
layers can achieve 48 PFS, satisfying the real-time requirement.
- Abstract(参考訳): 3dオブジェクト検出は、意思決定と制御の前提となる自動運転車の環境認識において重要な役割を果たす。
本稿では分割法固有の欠点を解析する。
パーティション操作では、歩行者のような単一のインスタンスを複数の部分にスライスし、それをパーティション効果と呼びます。
本稿では,空間アテンショングラフ変換(S-AT GCN)を提案し,その欠点を克服するために特徴拡張(FE)層を形成する。
s-at gcnはグラフ畳み込みと空間注意機構を利用して局所幾何学的構造特徴を抽出する。
これにより、ネットワークはフォアグラウンドでより有意義な機能を持つことができる。
KITTIの3Dオブジェクトと鳥の目視検出実験により,S-AT ConvおよびFE層は特に小物体に対して有効であることが判明した。
FE層は歩行者クラスのパフォーマンスを3.62\%、サイクリストクラスを4.21\% 3D mAP向上させる。
これらの余分なfe層の時間コストは限られている。
FE層のPointPillarsは48 PFSを達成し、リアルタイムの要件を満たすことができます。
関連論文リスト
- CP-VoteNet: Contrastive Prototypical VoteNet for Few-Shot Point Cloud Object Detection [7.205000222081269]
ポイントクラウド3Dオブジェクト検出(FS3D)は、ポイントクラウドから新しいクラスのオブジェクトを特定しローカライズすることを目的としている。
コントラスト的セマンティクスマイニングを導入し、ネットワークが識別的分類的特徴を抽出できるようにする。
洗練された原始幾何学的構造を通して、基本クラスから新しいクラスへの特徴符号化の伝達性が著しく向上する。
論文 参考訳(メタデータ) (2024-08-30T06:13:49Z) - 3D Small Object Detection with Dynamic Spatial Pruning [62.72638845817799]
本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。
空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。
ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文 参考訳(メタデータ) (2023-05-05T17:57:04Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Structure Aware and Class Balanced 3D Object Detection on nuScenes
Dataset [0.0]
NuTonomyのnuScenesデータセットは、KITTIのような一般的なデータセットを大きく拡張している。
このモデルの局所化精度は、ダウンスケールされた特徴写像における空間情報の損失に影響される。
本稿では,3次元点雲の構造情報をフル活用した補助ネットワークを設計することで,CBGSモデルの性能を向上させることを提案する。
論文 参考訳(メタデータ) (2022-05-25T06:18:49Z) - HVPR: Hybrid Voxel-Point Representation for Single-stage 3D Object
Detection [39.64891219500416]
3Dオブジェクト検出手法は、シーン内の3Dオブジェクトを表現するために、ボクセルベースまたはポイントベースの特徴を利用する。
本稿では,voxelベースとポイントベースの両方の特徴を有する,新しい単段3次元検出手法を提案する。
論文 参考訳(メタデータ) (2021-04-02T06:34:49Z) - FS-Net: Fast Shape-based Network for Category-Level 6D Object Pose
Estimation with Decoupled Rotation Mechanism [49.89268018642999]
6次元ポーズ推定のための効率的なカテゴリレベルの特徴抽出が可能な高速形状ベースネットワーク(FS-Net)を提案する。
提案手法は,カテゴリレベルおよびインスタンスレベルの6Dオブジェクトのポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-12T03:07:24Z) - PIG-Net: Inception based Deep Learning Architecture for 3D Point Cloud
Segmentation [0.9137554315375922]
そこで我々はPIG-Netと呼ばれるインセプションに基づくディープネットワークアーキテクチャを提案し,点雲の局所的および大域的幾何学的詳細を効果的に特徴付ける。
我々は2つの最先端データセット上でPIG-Netアーキテクチャの徹底的な実験的解析を行う。
論文 参考訳(メタデータ) (2021-01-28T13:27:55Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - Fine-Grained 3D Shape Classification with Hierarchical Part-View
Attentions [70.0171362989609]
本稿では,FG3D-Netと呼ばれる新しい3次元形状分類手法を提案する。
詳細な3次元形状データセットに基づく結果から,本手法が他の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-05-26T06:53:19Z) - D3Feat: Joint Learning of Dense Detection and Description of 3D Local
Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。
本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。
本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文 参考訳(メタデータ) (2020-03-06T12:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。