論文の概要: MapNeXt: Revisiting Training and Scaling Practices for Online Vectorized
HD Map Construction
- arxiv url: http://arxiv.org/abs/2401.07323v1
- Date: Sun, 14 Jan 2024 16:14:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 19:00:38.072896
- Title: MapNeXt: Revisiting Training and Scaling Practices for Online Vectorized
HD Map Construction
- Title(参考訳): MapNeXt: オンラインベクトル化HDマップ構築のためのトレーニングとスケーリングの再開
- Authors: Toyota Li
- Abstract要約: 本稿では,次世代のHDマップ学習アーキテクチャであるMapNeXtを提案する。
MapNeXt-Hugeは、挑戦的なnuScenesベンチマークで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-Definition (HD) maps are pivotal to autopilot navigation. Integrating
the capability of lightweight HD map construction at runtime into a
self-driving system recently emerges as a promising direction. In this surge,
vision-only perception stands out, as a camera rig can still perceive the
stereo information, let alone its appealing signature of portability and
economy. The latest MapTR architecture solves the online HD map construction
task in an end-to-end fashion but its potential is yet to be explored. In this
work, we present a full-scale upgrade of MapTR and propose MapNeXt, the next
generation of HD map learning architecture, delivering major contributions from
the model training and scaling perspectives. After shedding light on the
training dynamics of MapTR and exploiting the supervision from map elements
thoroughly, MapNeXt-Tiny raises the mAP of MapTR-Tiny from 49.0% to 54.8%,
without any architectural modifications. Enjoying the fruit of map segmentation
pre-training, MapNeXt-Base further lifts the mAP up to 63.9% that has already
outperformed the prior art, a multi-modality MapTR, by 1.4% while being
$\sim1.8\times$ faster. Towards pushing the performance frontier to the next
level, we draw two conclusions on practical model scaling: increased query
favors a larger decoder network for adequate digestion; a large backbone
steadily promotes the final accuracy without bells and whistles. Building upon
these two rules of thumb, MapNeXt-Huge achieves state-of-the-art performance on
the challenging nuScenes benchmark. Specifically, we push the mapless
vision-only single-model performance to be over 78% for the first time,
exceeding the best model from existing methods by 16%.
- Abstract(参考訳): ハイディフィニション(HD)マップは自動操縦のナビゲーションに欠かせない。
実行時に軽量なHDマップ構築機能を自動運転システムに統合することは、最近、有望な方向として現れている。
カメラがステレオ情報を認識できるので、可搬性と経済性という魅力的なサインはさておき、視覚のみの知覚が際立っている。
最新のMapTRアーキテクチャは、オンラインHDマップ構築タスクをエンドツーエンドで解決するが、その可能性はまだ検討されていない。
本研究では,MapTRのフルスケールアップグレードを提案し,次世代のHDマップ学習アーキテクチャであるMapNeXtを提案する。
MapTRのトレーニングダイナミクスに光を当て、MapNeXt-TinyはMapTR-TinyのmAPを49.0%から54.8%に引き上げる。
マップセグメンテーションの成果を楽しみ、mapnext-baseは、以前の技術であるマルチモダリティmaptrを上回り、$\sim1.8\times$を高速にしながら、63.9%までマップを持ち上げる。
クエリの増加は適切な消化のためにデコーダネットワークを広く好んでおり、大きなバックボーンはベルやホイッスルを使わずに最終的な精度を着実に向上させる。
親指の2つのルールに基づいて、MapNeXt-Hugeは、挑戦的なnuScenesベンチマークで最先端のパフォーマンスを達成する。
具体的には、マップレスビジョンのみのシングルモデルパフォーマンスを初めて78%以上にプッシュし、既存のメソッドから最高のモデルを16%上回らせました。
関連論文リスト
- TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.84644266024571]
我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。
我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文 参考訳(メタデータ) (2024-11-22T06:13:42Z) - Enhancing Online Road Network Perception and Reasoning with Standard Definition Maps [14.535963852751635]
我々は,オンラインベクトル化HDマップ表現の開発において,軽量でスケーラブルな事前規格定義(SD)マップを活用することに注力する。
重要な発見は、SDマップエンコーダがモデル非依存であり、鳥の目視(BEV)エンコーダを利用する新しいアーキテクチャに迅速に適応できることである。
この結果から,オンライン地図作成タスクの先行作業としてSDマップを使用すると,コンバージェンスが大幅に向上し,オンラインセンターライン認識タスクの性能が30%向上する可能性が示唆された。
論文 参考訳(メタデータ) (2024-08-01T19:39:55Z) - Augmenting Lane Perception and Topology Understanding with Standard
Definition Navigation Maps [51.24861159115138]
Standard Definition (SD) マップは、より安価で、世界中でカバーでき、スケーラブルな代替手段を提供する。
本稿では,オンライン地図予測にSDマップを統合する新しいフレームワークを提案し,Transformer を用いたエンコーダ SD Map Representations を提案する。
この拡張は、現在の最先端のオンラインマップ予測手法におけるレーン検出とトポロジー予測を一貫して(最大60%まで)大幅に向上させる。
論文 参考訳(メタデータ) (2023-11-07T15:42:22Z) - MachMap: End-to-End Vectorized Solution for Compact HD-Map Construction [24.517848530666907]
本報告では,自動運転チャレンジ2023 - オンラインHDマップ構築における第1位獲得ソリューションを紹介する。
我々は,HDマップ構築のタスクをポイント検出パラダイムとして定式化する,MachMapと呼ばれる効果的なアーキテクチャを詳しく検討する。
論文 参考訳(メタデータ) (2023-06-17T09:06:48Z) - SNAP: Self-Supervised Neural Maps for Visual Positioning and Semantic
Understanding [57.108301842535894]
我々は、地上と頭上の画像からリッチなニューラル2Dマップを学習するディープネットワークSNAPを紹介する。
我々は、異なる入力から推定されるニューラルマップの整列をトレーニングし、何千万ものストリートビュー画像のカメラポーズでのみ監視する。
SNAPは、従来の手法の範囲を超えて、挑戦的な画像クエリの場所を解決できる。
論文 参考訳(メタデータ) (2023-06-08T17:54:47Z) - InstaGraM: Instance-level Graph Modeling for Vectorized HD Map Learning [6.062751776009753]
搭載センサ観測からHDマップ要素を検出するオンラインHDマップ学習フレームワークを提案する。
InstaGraMでは、HDマップのインスタンスレベルのグラフモデリングは、正確かつ高速なベクトル化HDマップ学習をもたらす。
提案するネットワークは,従来のモデルよりも最大13.7mAP,最大33.8倍高速である。
論文 参考訳(メタデータ) (2023-01-10T08:15:35Z) - HDMapNet: An Online HD Map Construction and Evaluation Framework [23.19001503634617]
HDマップの構築は自動運転にとって重要な問題である。
従来のHDマップは、多くのシナリオでは信頼性の低いセンチメートルレベルの正確な位置決めと結合している。
オンライン地図学習は、自動運転車に先立って意味と幾何学を提供するための、よりスケーラブルな方法である。
論文 参考訳(メタデータ) (2021-07-13T18:06:46Z) - HDMapGen: A Hierarchical Graph Generative Model of High Definition Maps [81.86923212296863]
HDマップは道路路面の正確な定義と交通ルールの豊富な意味を持つ地図である。
実際の道路トポロジやジオメトリはごくわずかで、自動運転スタックをテストする能力は著しく制限されています。
高品質で多様なHDマップを生成可能な階層グラフ生成モデルであるHDMapGenを提案する。
論文 参考訳(メタデータ) (2021-06-28T17:59:30Z) - MP3: A Unified Model to Map, Perceive, Predict and Plan [84.07678019017644]
MP3は、入力が生のセンサーデータと高レベルのコマンドであるマップレス運転に対するエンドツーエンドのアプローチである。
提案手法は, より安全で, 快適であり, 長期クローズループシミュレーションにおいて, ベースラインよりもコマンドを追従できることを示す。
論文 参考訳(メタデータ) (2021-01-18T00:09:30Z) - HDNET: Exploiting HD Maps for 3D Object Detection [99.49035895393934]
高精細度(hd)マップは、現代の3dオブジェクト検出器の性能と頑健性を高める強力な事前情報を提供する。
我々はHDマップから幾何学的特徴と意味的特徴を抽出する単一ステージ検出器を設計する。
地図は至る所では利用できないため、生のLiDARデータからフライ時の地図を推定するマップ予測モジュールも提案する。
論文 参考訳(メタデータ) (2020-12-21T21:59:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。