論文の概要: RelMap: Enhancing Online Map Construction with Class-Aware Spatial Relation and Semantic Priors
- arxiv url: http://arxiv.org/abs/2507.21567v2
- Date: Fri, 26 Sep 2025 00:32:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 14:23:57.549901
- Title: RelMap: Enhancing Online Map Construction with Class-Aware Spatial Relation and Semantic Priors
- Title(参考訳): RelMap: クラス対応空間関係とセマンティックプライオリティによるオンラインマップ構築の強化
- Authors: Tianhui Cai, Yun Zhang, Zewei Zhou, Zhiyu Huang, Jiaqi Ma,
- Abstract要約: 本稿では,オンラインHDマップ構築を改善するために,空間関係とセマンティック先行の両方を明示的にモデル化するエンドツーエンドフレームワークを提案する。
RelMapは、単一フレームと時間知覚の両方のバックボーンと互換性があり、nuScenesとArgoverse 2データセットの両方で最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 15.838247620359603
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Online high-definition (HD) map construction is crucial for scaling autonomous driving systems. While Transformer-based methods have become prevalent in online HD map construction, most existing approaches overlook the inherent spatial dependencies and semantic relationships among map elements, which constrains their accuracy and generalization capabilities. To address this, we propose RelMap, an end-to-end framework that explicitly models both spatial relations and semantic priors to enhance online HD map construction. Specifically, we introduce a Class-aware Spatial Relation Prior, which explicitly encodes relative positional dependencies between map elements using a learnable class-aware relation encoder. Additionally, we design a Mixture-of-Experts-based Semantic Prior, which routes features to class-specific experts based on predicted class probabilities, refining instance feature decoding. RelMap is compatible with both single-frame and temporal perception backbones, achieving state-of-the-art performance on both the nuScenes and Argoverse 2 datasets.
- Abstract(参考訳): オンラインハイデフィニション(HD)マップの構築は、自動運転システムのスケーリングに不可欠である。
トランスフォーマーベースの手法は,オンラインHDマップ構築において普及しているが,既存の手法の多くは,その精度と一般化能力を制約するマップ要素間の空間的依存関係や意味的関係を見落としている。
これを解決するために、オンラインHDマップ構築を強化するために、空間関係とセマンティック先行の両方を明示的にモデル化するエンドツーエンドフレームワークであるRelMapを提案する。
具体的には、学習可能なクラス認識関係エンコーダを用いて、マップ要素間の相対的な位置依存性を明示的に符号化するクラス認識空間関係優先法を提案する。
さらに、予測されたクラス確率に基づいて、特徴をクラス固有の専門家にルーティングする、Mixture-of-ExpertsベースのSemantic Priorを設計する。
RelMapは、単一フレームと時間知覚の両方のバックボーンと互換性があり、nuScenesとArgoverse 2データセットの両方で最先端のパフォーマンスを達成する。
関連論文リスト
- Coherent Online Road Topology Estimation and Reasoning with Standard-Definition Maps [26.036008442130587]
ほとんどの自動運転車はHD(High-Definition)マップの可用性に依存している。
現在の研究は、搭載センサーからHDマップ要素を直接予測することで、この制約に対処することを目的としている。
本稿では,道路境界だけでなく,レーンセグメントとその対応するトポロジを予測するためのコヒーレントなアプローチを提案する。
論文 参考訳(メタデータ) (2025-07-02T06:26:17Z) - InteractionMap: Improving Online Vectorized HDMap Construction with Interaction [0.4551615447454768]
State-of-the-art map vectorization法は主に、エンドツーエンドでHDマップを生成するDETRライクなフレームワークに基づいている。
本稿では,ローカル-グローバル情報インタラクションをフル活用して,従来の地図ベクトル化手法を改善したInteractionMapを提案する。
論文 参考訳(メタデータ) (2025-03-27T16:23:15Z) - IC-Mapper: Instance-Centric Spatio-Temporal Modeling for Online Vectorized Map Construction [18.975185033472968]
IC-Mapperは2つの主要なコンポーネントで構成されるインスタンス中心のオンラインマッピングフレームワークである。
空間次元から歴史的グローバルマップの点サンプリングを行い、現在のフレームに対応するインスタンスの検出結果と統合して、地図のリアルタイム展開と更新を行う。
論文 参考訳(メタデータ) (2025-03-05T20:28:34Z) - TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.84644266024571]
我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。
我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文 参考訳(メタデータ) (2024-11-22T06:13:42Z) - GenMapping: Unleashing the Potential of Inverse Perspective Mapping for Robust Online HD Map Construction [20.1127163541618]
我々はGenMappingというユニバーサルマップ生成フレームワークを設計した。
このフレームワークは、主および二重補助枝を含む三進的なシナジーアーキテクチャで構築されている。
実験結果の網羅的な配列から,提案手法はセマンティックマッピングとベクトル化マッピングの両方において最先端の手法を超越し,高速な推論速度を維持した。
論文 参考訳(メタデータ) (2024-09-13T10:15:28Z) - MapTRv2: An End-to-End Framework for Online Vectorized HD Map Construction [40.07726377230152]
High-definition (HD) マップは、運転シーンの豊富な正確な静的環境情報を提供する。
オンラインベクトル化HDマップ構築のためのエンドツーエンドフレームワークである textbfMap textbfTRansformer を提案する。
論文 参考訳(メタデータ) (2023-08-10T17:56:53Z) - How To Not Train Your Dragon: Training-free Embodied Object Goal
Navigation with Semantic Frontiers [94.46825166907831]
Embodied AIにおけるオブジェクトゴールナビゲーション問題に対処するためのトレーニング不要のソリューションを提案する。
本手法は,古典的な視覚的同時ローカライゼーションとマッピング(V-SLAM)フレームワークに基づく,構造化されたシーン表現を構築する。
本手法は,言語先行情報とシーン統計に基づいてシーングラフのセマンティクスを伝搬し,幾何学的フロンティアに意味知識を導入する。
論文 参考訳(メタデータ) (2023-05-26T13:38:33Z) - BEVBert: Multimodal Map Pre-training for Language-guided Navigation [75.23388288113817]
視覚・言語ナビゲーション(VLN)における空間認識型マップベース事前学習パラダイムを提案する。
我々は,グローバルなトポロジカルマップにおけるナビゲーション依存性をモデル化しながら,不完全な観測を明示的に集約し,重複を取り除くための局所距離マップを構築した。
ハイブリッドマップをベースとして,マルチモーダルマップ表現を学習するための事前学習フレームワークを考案し,空間認識型クロスモーダル推論を強化し,言語誘導ナビゲーションの目標を導出する。
論文 参考訳(メタデータ) (2022-12-08T16:27:54Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Temporally-Consistent Surface Reconstruction using Metrically-Consistent
Atlases [131.50372468579067]
そこで本稿では,時間変化点雲列から時間一貫性のある面列を復元する手法を提案する。
我々は、再構成された表面をニューラルネットワークによって計算されたアトラスとして表現し、フレーム間の対応性を確立することができる。
当社のアプローチは、いくつかの挑戦的なデータセットにおいて、最先端のものよりも優れています。
論文 参考訳(メタデータ) (2021-11-12T17:48:25Z) - Learning Lane Graph Representations for Motion Forecasting [92.88572392790623]
生の地図データからレーングラフを構築し,地図構造を保存する。
我々は,アクター・トゥ・レーン,レーン・トゥ・レーン,レーン・トゥ・アクター,アクター・トゥ・アクターの4種類のインタラクションからなる融合ネットワークを利用する。
提案手法は,大規模Argoverse運動予測ベンチマークにおいて,最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-07-27T17:59:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。