論文の概要: SparseMeXT Unlocking the Potential of Sparse Representations for HD Map Construction
- arxiv url: http://arxiv.org/abs/2505.08808v1
- Date: Mon, 12 May 2025 02:26:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 21:44:09.227309
- Title: SparseMeXT Unlocking the Potential of Sparse Representations for HD Map Construction
- Title(参考訳): HDマップ構築のためのスパース表現の可能性を解き放つスパースMeXT
- Authors: Anqing Jiang, Jinhao Chai, Yu Gao, Yiru Wang, Yuwen Heng, Zhigang Sun, Hao Sun, Zezhong Zhao, Li Sun, Jian Zhou, Lijuan Zhu, Shugong Xu, Hao Zhao,
- Abstract要約: 本稿では,スパースマップの特徴抽出に最適化された専用ネットワークアーキテクチャとスパース線分割補助タスクを提案する。
SparseMeXt-Tiny は平均精度 emphmAP を55.5% で、毎秒32フレーム/秒で、SparseMeXt-Base は65.2% mAP に達する。
SparseMeXt-Largeは68.9%のmAPを20fps以上で達成し、HDマップ構築におけるスパース表現の新しいベンチマークを確立した。
- 参考スコア(独自算出の注目度): 23.54276017556267
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in high-definition \emph{HD} map construction have demonstrated the effectiveness of dense representations, which heavily rely on computationally intensive bird's-eye view \emph{BEV} features. While sparse representations offer a more efficient alternative by avoiding dense BEV processing, existing methods often lag behind due to the lack of tailored designs. These limitations have hindered the competitiveness of sparse representations in online HD map construction. In this work, we systematically revisit and enhance sparse representation techniques, identifying key architectural and algorithmic improvements that bridge the gap with--and ultimately surpass--dense approaches. We introduce a dedicated network architecture optimized for sparse map feature extraction, a sparse-dense segmentation auxiliary task to better leverage geometric and semantic cues, and a denoising module guided by physical priors to refine predictions. Through these enhancements, our method achieves state-of-the-art performance on the nuScenes dataset, significantly advancing HD map construction and centerline detection. Specifically, SparseMeXt-Tiny reaches a mean average precision \emph{mAP} of 55.5% at 32 frames per second \emph{fps}, while SparseMeXt-Base attains 65.2% mAP. Scaling the backbone and decoder further, SparseMeXt-Large achieves an mAP of 68.9% at over 20 fps, establishing a new benchmark for sparse representations in HD map construction. These results underscore the untapped potential of sparse methods, challenging the conventional reliance on dense representations and redefining efficiency-performance trade-offs in the field.
- Abstract(参考訳): 近年の高精細化 \emph{HD} マップ構築の進歩は、高精細表現の有効性を示しており、これは計算集約的な鳥眼ビュー \emph{BEV} の特徴に大きく依存している。
スパース表現は、密集したBEV処理を避けることで、より効率的な代替手段を提供するが、既存の手法は、調整された設計の欠如のために遅れることが多い。
これらの制限は、オンラインHDマップ構築におけるスパース表現の競争力を妨げている。
本研究では,スパース表現手法を体系的に再検討し,ギャップを埋める重要なアーキテクチャとアルゴリズムの改善点を特定する。
本稿では,スパースマップの特徴抽出に最適化された専用ネットワークアーキテクチャ,幾何学的および意味論的手法をうまく活用するためのスパースセンスセグメント化補助タスク,および予測を洗練させるために物理先行者が案内する復調モジュールを紹介する。
これらの拡張により,本手法はnuScenesデータセット上での最先端性能を実現し,HDマップ構築と中心線検出を大幅に進歩させる。
具体的には、SparseMeXt-Tinyの平均精度は55.5%で、32フレーム/秒で32fps、SparseMeXt-Baseは65.2%である。
バックボーンとデコーダをさらに拡張したSparseMeXt-Largeは、20fps以上で68.9%のmAPを実現し、HDマップ構築におけるスパース表現の新しいベンチマークを確立した。
これらの結果はスパース手法の未解決の可能性を強調し、高密度表現への従来の依存に挑戦し、現場での効率性能トレードオフを再定義する。
関連論文リスト
- SegLocNet: Multimodal Localization Network for Autonomous Driving via Bird's-Eye-View Segmentation [0.0]
SegLocNetはセマンティックセグメンテーションを用いて正確なローカライゼーションを実現するマルチモーダルフリーなローカライゼーションネットワークである。
本手法は,都市環境におけるエゴポーズを,一般化に頼ることなく正確に推定することができる。
私たちのコードと事前訓練されたモデルは公開されます。
論文 参考訳(メタデータ) (2025-02-27T13:34:55Z) - Hi-Map: Hierarchical Factorized Radiance Field for High-Fidelity
Monocular Dense Mapping [51.739466714312805]
ニューラルラジアンス場(NeRF)に基づく新しいモノクリン高密度マッピング手法であるHi-Mapを導入する。
ハイマップは、RGB入力のみを用いた効率的かつ高忠実なマッピングを実現する能力において例外的である。
論文 参考訳(メタデータ) (2024-01-06T12:32:25Z) - DDP: Diffusion Model for Dense Visual Prediction [71.55770562024782]
本研究では,条件付き拡散パイプラインに基づく高密度視覚予測のための,シンプルで効率的かつ強力なフレームワークを提案する。
DDPと呼ばれるこの手法は、デノナイジング拡散過程を現代の知覚パイプラインに効率的に拡張する。
DDPは、従来の単段階識別法とは対照的に、動的推論や不確実性認識などの魅力的な特性を示す。
論文 参考訳(メタデータ) (2023-03-30T17:26:50Z) - InstaGraM: Instance-level Graph Modeling for Vectorized HD Map Learning [8.556482588459899]
オンラインハイデフィニション(HD)マップ構築は、ポーズの正確な推定において重要な役割を果たす。
オンラインHDマップ構築の最近の進歩は、ベクトル化表現について主に研究されている。
グラフモデリングを利用した新しいHDマップ学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-10T08:15:35Z) - Sparse Instance Activation for Real-Time Instance Segmentation [72.23597664935684]
本稿では,リアルタイムインスタンスセグメンテーションのための概念的・効率的・完全畳み込み型フレームワークを提案する。
SparseInstは非常に高速な推論速度を持ち、COCOベンチマークで40 FPSと37.9 APを達成した。
論文 参考訳(メタデータ) (2022-03-24T03:15:39Z) - Real-time Semantic Segmentation with Fast Attention [94.88466483540692]
本稿では,高解像度画像と映像をリアルタイムにセマンティックセグメンテーションするための新しいアーキテクチャを提案する。
提案したアーキテクチャは我々の空間的注意の速さに依存しており、これは一般的な自己注意機構の単純かつ効率的な修正である。
複数のデータセットに対する結果から,既存の手法に比べて精度と速度が向上し,優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-07T22:37:16Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。