論文の概要: SuperMapNet for Long-Range and High-Accuracy Vectorized HD Map Construction
- arxiv url: http://arxiv.org/abs/2505.13856v1
- Date: Tue, 20 May 2025 03:06:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:52.64363
- Title: SuperMapNet for Long-Range and High-Accuracy Vectorized HD Map Construction
- Title(参考訳): 長距離高速ベクトル化HDマップ構築のためのSuperMapNet
- Authors: Ruqin Zhou, San Jiang, Wanshou Jiang, Yongsheng Zhang, Chenguang Dai,
- Abstract要約: 長距離および高精度なベクトル化HDマップ構築のためのSuperMapNetを提案する。
入力にはカメライメージとLiDARポイントクラウドの両方を使用し、最初にカメライメージからのセマンティック情報とLiDARポイントクラウドからの幾何学的情報とを密に結合する。
nuScenesとArgoverse2データセットの実験では、SOTAが14.9/8.8 mAPと18.5/3.1 mAPを超え、ハード/イージーな設定で優れたパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 4.931626462826974
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vectorized HD map is essential for autonomous driving. Remarkable work has been achieved in recent years, but there are still major issues: (1) in the generation of the BEV features, single modality-based methods are of limited perception capability, while direct concatenation-based multi-modal methods fail to capture synergies and disparities between different modalities, resulting in limited ranges with feature holes; (2) in the classification and localization of map elements, only point information is used without the consideration of element infor-mation and neglects the interaction between point information and element information, leading to erroneous shapes and element entanglement with low accuracy. To address above issues, we introduce SuperMapNet for long-range and high-accuracy vectorized HD map construction. It uses both camera images and LiDAR point clouds as input, and first tightly couple semantic information from camera images and geometric information from LiDAR point clouds by a cross-attention based synergy enhancement module and a flow-based disparity alignment module for long-range BEV feature generation. And then, local features from point queries and global features from element queries are tightly coupled by three-level interactions for high-accuracy classification and localization, where Point2Point interaction learns local geometric information between points of the same element and of each point, Element2Element interaction learns relation constraints between different elements and semantic information of each elements, and Point2Element interaction learns complement element information for its constituent points. Experiments on the nuScenes and Argoverse2 datasets demonstrate superior performances, surpassing SOTAs over 14.9/8.8 mAP and 18.5/3.1 mAP under hard/easy settings, respectively. The code is made publicly available1.
- Abstract(参考訳): 自動走行にはベクトル化HDマップが不可欠である。
近年, 顕著な成果が報告されているが, 1) BEV の特徴の生成において, 単一モダリティに基づく手法は知覚能力に限界がある一方で, 直接結合に基づくマルチモーダル法は, 異なるモダリティ間の相乗効果と相乗効果を捉えることができず, 特徴穴を持つ範囲が限られていること, 2) 地図要素の分類と局所化において, 要素のインフォメーションを考慮せずに点情報のみを使用し, 点情報と要素情報との相互作用を無視し, 誤形状や要素の絡み合いを低い精度で行うこと, など, 重要な課題がある。
上記の問題に対処するため, 長距離かつ高精度なベクトル化HDマップ構築のためのSuperMapNetを導入する。
カメラ画像とLiDAR点雲の両方を入力とし、まずカメラ画像からのセマンティック情報とLiDAR点雲からの幾何情報とを、長距離BEV特徴生成のためのクロスアテンションベースのシナジー拡張モジュールとフローベース不均一アライメントモジュールによって密に結合する。
そして、ポイントクエリからの局所的な特徴と、要素クエリからのグローバルな特徴は、高精度な分類とローカライゼーションのための3段階の相互作用によって密結合され、ポイント2ポイントの相互作用は、同じ要素と各ポイントのポイント間の局所的な幾何学的情報、要素間の関係的制約を学習する要素2要素の相互作用は、各要素のセマンティック情報と、ポイント2要素の相互作用はその構成点の補的要素情報から学習する。
nuScenesとArgoverse2データセットの実験では、SOTAの14.9/8.8 mAPと18.5/3.1 mAPをそれぞれハード/イージーな設定で上回った。
コードは公開されています。
関連論文リスト
- InteractionMap: Improving Online Vectorized HDMap Construction with Interaction [0.4551615447454768]
State-of-the-art map vectorization法は主に、エンドツーエンドでHDマップを生成するDETRライクなフレームワークに基づいている。
本稿では,ローカル-グローバル情報インタラクションをフル活用して,従来の地図ベクトル化手法を改善したInteractionMapを提案する。
論文 参考訳(メタデータ) (2025-03-27T16:23:15Z) - MGMapNet: Multi-Granularity Representation Learning for End-to-End Vectorized HD Map Construction [75.93907511203317]
多粒性表現を持つ地図要素をモデル化するためのMGMapNet(Multi-Granularity Map Network)を提案する。
提案したMGMapNetは最先端のパフォーマンスを達成し,MapTRv2 を nuScenes で 5.3 mAP,Argoverse2 で 4.4 mAP で上回った。
論文 参考訳(メタデータ) (2024-10-10T09:05:23Z) - Multi-scale Feature Fusion with Point Pyramid for 3D Object Detection [18.41721888099563]
本稿では,POP-RCNN(Point Pyramid RCNN)を提案する。
提案手法は, 様々な既存フレームワークに適用して, 特に長距離検出において, 特徴の豊かさを高めることができる。
論文 参考訳(メタデータ) (2024-09-06T20:13:14Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - HIMap: HybrId Representation Learning for End-to-end Vectorized HD Map Construction [15.358170549842596]
State-of-the-art法は主に正確な点座標を回帰する点レベルの表現学習に基づいている。
本稿では,HybrId フレームワーク HIMap を提案する。
我々は、大規模な実験を行い、nuScenesとArgoverse2データセットの両方で、従来手法より一貫して優れています。
論文 参考訳(メタデータ) (2024-03-13T15:51:23Z) - Bidirectional Knowledge Reconfiguration for Lightweight Point Cloud
Analysis [74.00441177577295]
ポイントクラウド分析は計算システムのオーバーヘッドに直面し、モバイルやエッジデバイスでの利用を制限する。
本稿では,軽量点雲モデルのための特徴蒸留について検討する。
本研究では,教師から生徒への情報的文脈的知識を抽出するための双方向知識再構成を提案する。
論文 参考訳(メタデータ) (2023-10-08T11:32:50Z) - Two-stream Multi-level Dynamic Point Transformer for Two-person Interaction Recognition [45.0131792009999]
本稿では,2人インタラクション認識のための2ストリームマルチレベル動的ポイント変換器を提案する。
本モデルでは,局所空間情報,外観情報,動作情報を組み込むことで,対人インタラクションを認識するという課題に対処する。
我々のネットワークは、ほとんどの標準的な評価設定において最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2023-07-22T03:51:32Z) - PV-RCNN++: Semantical Point-Voxel Feature Interaction for 3D Object
Detection [22.6659359032306]
本稿では,PV-RCNN++と呼ばれる意味的特徴相互作用を用いた新しいオブジェクト検出ネットワークを提案する。
KITTIデータセットの実験によると、PV-RCNN++は81.60$%$, 40.18$%$, 68.21$%$ 3D mAP on Car, Pedestrian, Cyclistで達成され、最先端技術と同等またはそれ以上のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-08-29T08:14:00Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - PointFlow: Flowing Semantics Through Points for Aerial Image
Segmentation [96.76882806139251]
本論文では,FPN(Feature Pyramid Network)フレームワークに基づく点親和性伝播モジュールであるPointFlowを提案する。
密接な親和性学習ではなく、隣接する特徴間の選択された点にスパース親和性マップを生成する。
3つの異なる空中セグメンテーションデータセットの実験結果から,提案手法は最先端の汎用セグメンテーション法よりも効率的かつ効率的であることが示唆された。
論文 参考訳(メタデータ) (2021-03-11T09:42:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。