論文の概要: TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior
- arxiv url: http://arxiv.org/abs/2411.14751v1
- Date: Fri, 22 Nov 2024 06:13:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-25 15:04:33.154971
- Title: TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior
- Title(参考訳): TopoSD: SDMap以前のトポロジ強化レーンセグメンテーション
- Authors: Sen Yang, Minyue Jiang, Ziwei Fan, Xiaolu Xie, Xiao Tan, Yingying Li, Errui Ding, Liang Wang, Jingdong Wang,
- Abstract要約: 我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。
我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
- 参考スコア(独自算出の注目度): 70.84644266024571
- License:
- Abstract: Recent advances in autonomous driving systems have shifted towards reducing reliance on high-definition maps (HDMaps) due to the huge costs of annotation and maintenance. Instead, researchers are focusing on online vectorized HDMap construction using on-board sensors. However, sensor-only approaches still face challenges in long-range perception due to the restricted views imposed by the mounting angles of onboard cameras, just as human drivers also rely on bird's-eye-view navigation maps for a comprehensive understanding of road structures. To address these issues, we propose to train the perception model to "see" standard definition maps (SDMaps). We encode SDMap elements into neural spatial map representations and instance tokens, and then incorporate such complementary features as prior information to improve the bird's eye view (BEV) feature for lane geometry and topology decoding. Based on the lane segment representation framework, the model simultaneously predicts lanes, centrelines and their topology. To further enhance the ability of geometry prediction and topology reasoning, we also use a topology-guided decoder to refine the predictions by exploiting the mutual relationships between topological and geometric features. We perform extensive experiments on OpenLane-V2 datasets to validate the proposed method. The results show that our model outperforms state-of-the-art methods by a large margin, with gains of +6.7 and +9.1 on the mAP and topology metrics. Our analysis also reveals that models trained with SDMap noise augmentation exhibit enhanced robustness.
- Abstract(参考訳): 近年の自律運転システムの進歩は、注釈やメンテナンスの膨大なコストにより、HDMap(High-Definition Map)への依存を減らしつつある。
その代わり、研究者はオンラインのベクトル化HDMap構築にオンボードセンサーを使って焦点を当てている。
しかし、センサーのみのアプローチは、人間のドライバーが道路構造を網羅的に理解するために鳥の目視ナビゲーションマップにも依存しているように、オンボードカメラの取り付け角度が制限されているため、長距離認識の課題に直面している。
これらの問題に対処するために,標準定義地図(SDMaps)を「見る」よう知覚モデルを訓練することを提案する。
SDMap 要素をニューラル空間地図表現やインスタンストークンにエンコードし,先行情報のような補完的な特徴を組み込んで,車線幾何学やトポロジー復号のための鳥眼ビュー(BEV)機能を改善する。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
また、幾何学的特徴と幾何学的特徴の相互関係を利用して、トポロジー誘導デコーダを用いて予測を洗練させる。
提案手法を検証するために,OpenLane-V2データセットの広範な実験を行った。
その結果, このモデルでは, mAP およびトポロジ測定値において, 出力が +6.7 および +9.1 となり, 最先端の手法よりも高い結果が得られた。
また,SDMapの雑音増強モデルでは,頑健性が向上することが判明した。
関連論文リスト
- Enhancing Online Road Network Perception and Reasoning with Standard Definition Maps [14.535963852751635]
我々は,オンラインベクトル化HDマップ表現の開発において,軽量でスケーラブルな事前規格定義(SD)マップを活用することに注力する。
重要な発見は、SDマップエンコーダがモデル非依存であり、鳥の目視(BEV)エンコーダを利用する新しいアーキテクチャに迅速に適応できることである。
この結果から,オンライン地図作成タスクの先行作業としてSDマップを使用すると,コンバージェンスが大幅に向上し,オンラインセンターライン認識タスクの性能が30%向上する可能性が示唆された。
論文 参考訳(メタデータ) (2024-08-01T19:39:55Z) - Accelerating Online Mapping and Behavior Prediction via Direct BEV Feature Attention [30.190497345299004]
本稿では,オンライン地図推定手法の豊富な内部的特徴を明らかにするとともに,オンライン地図と軌跡予測をより緊密に統合する方法について述べる。
これにより、内部のBEV機能に直接アクセスすると、推論速度が最大73%速くなり、実際のnuScenesデータセット上では最大29%の正確な予測が得られます。
論文 参考訳(メタデータ) (2024-07-09T08:59:27Z) - Augmenting Lane Perception and Topology Understanding with Standard
Definition Navigation Maps [51.24861159115138]
Standard Definition (SD) マップは、より安価で、世界中でカバーでき、スケーラブルな代替手段を提供する。
本稿では,オンライン地図予測にSDマップを統合する新しいフレームワークを提案し,Transformer を用いたエンコーダ SD Map Representations を提案する。
この拡張は、現在の最先端のオンラインマップ予測手法におけるレーン検出とトポロジー予測を一貫して(最大60%まで)大幅に向上させる。
論文 参考訳(メタデータ) (2023-11-07T15:42:22Z) - Neural Map Prior for Autonomous Driving [17.198729798817094]
高精細(HD)セマンティックマップは、自動運転車が都市環境をナビゲートするために不可欠である。
オフラインのHDマップを作成する従来の方法には、労働集約的な手動アノテーションプロセスが含まれる。
近年,オンラインセンサを用いた局所地図作成手法が提案されている。
本研究では,グローバルマップのニューラル表現であるニューラルマッププライオリティ(NMP)を提案する。
論文 参考訳(メタデータ) (2023-04-17T17:58:40Z) - Monocular BEV Perception of Road Scenes via Front-to-Top View Projection [57.19891435386843]
本稿では,鳥の目視で道路配置と車両占有率によって形成された局所地図を再構築する新しい枠組みを提案する。
我々のモデルは1つのGPU上で25FPSで動作し、リアルタイムパノラマHDマップの再構築に有効である。
論文 参考訳(メタデータ) (2022-11-15T13:52:41Z) - HDMapGen: A Hierarchical Graph Generative Model of High Definition Maps [81.86923212296863]
HDマップは道路路面の正確な定義と交通ルールの豊富な意味を持つ地図である。
実際の道路トポロジやジオメトリはごくわずかで、自動運転スタックをテストする能力は著しく制限されています。
高品質で多様なHDマップを生成可能な階層グラフ生成モデルであるHDMapGenを提案する。
論文 参考訳(メタデータ) (2021-06-28T17:59:30Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - DAGMapper: Learning to Map by Discovering Lane Topology [84.12949740822117]
我々は、分岐とマージによるトポロジー変化を含む多くのレーンを持つ複雑な高速道路のレーン境界を描くことに集中する。
グラフのノードがレーン境界の局所領域の幾何学的および位相的特性を符号化する有向非巡回グラフィカルモデル(DAG)における推論として問題を定式化する。
2つの異なる州における2つの幹線道路における我々のアプローチの有効性を示し、高い精度とリコールと89%の正しいトポロジーを示す。
論文 参考訳(メタデータ) (2020-12-22T21:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。