論文の概要: RelMap: Enhancing Online Map Construction with Class-Aware Spatial Relation and Semantic Priors
- arxiv url: http://arxiv.org/abs/2507.21567v1
- Date: Tue, 29 Jul 2025 07:58:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:55.855939
- Title: RelMap: Enhancing Online Map Construction with Class-Aware Spatial Relation and Semantic Priors
- Title(参考訳): RelMap: クラス対応空間関係とセマンティックプライオリティによるオンラインマップ構築の強化
- Authors: Tianhui Cai, Yun Zhang, Zewei Zhou, Zhiyu Huang, Jiaqi Ma,
- Abstract要約: 本稿では,空間的関係やセマンティックな先行要素を組み込むことで,オンライン地図構築を強化するエンド・ツー・エンドのフレームワークを提案する。
本手法は, 単一フレームと時間知覚の両バックボーンと互換性があり, nuScenes と Argoverse 2 の両データセットの最先端性能を実現している。
- 参考スコア(独自算出の注目度): 13.26774106477855
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Online high-definition (HD) map construction plays an increasingly important role in scaling autonomous driving systems. Transformer-based methods have become prevalent in online HD map construction; however, existing approaches often neglect the inherent spatial and semantic relationships among map elements, which limits their accuracy and generalization. To address this, we propose RelMap, an end-to-end framework that enhances online map construction by incorporating spatial relations and semantic priors. We introduce a Class-aware Spatial Relation Prior, which explicitly encodes relative positional dependencies between map elements using a learnable class-aware relation encoder. Additionally, we propose a Mixture-of-Experts (MoE)-based Semantic Prior, which routes features to class-specific experts based on predicted class probabilities, refining instance feature decoding. Our method is compatible with both single-frame and temporal perception backbones, achieving state-of-the-art performance on both the nuScenes and Argoverse 2 datasets.
- Abstract(参考訳): オンラインハイデフィニション(HD)マップの構築は、自律運転システムのスケーリングにおいて、ますます重要な役割を担っている。
トランスフォーマーベースの手法は、オンラインHDマップ構築において普及しているが、既存の手法では、その正確さと一般化を制限するマップ要素間の空間的および意味的関係を無視することが多い。
そこで本稿では,空間的関係とセマンティックな前提を組み込んだオンライン地図構築を支援するエンドツーエンドフレームワークであるRelMapを提案する。
学習可能なクラス認識関係エンコーダを用いて,マップ要素間の相対的な位置依存性を明示的に符号化する。
また,Mixture-of-Experts(MoE)をベースとしたSemantic Priorを提案する。
本手法は, 単一フレームと時間知覚の両バックボーンと互換性があり, nuScenes と Argoverse 2 の両データセットの最先端性能を実現している。
関連論文リスト
- Coherent Online Road Topology Estimation and Reasoning with Standard-Definition Maps [26.036008442130587]
ほとんどの自動運転車はHD(High-Definition)マップの可用性に依存している。
現在の研究は、搭載センサーからHDマップ要素を直接予測することで、この制約に対処することを目的としている。
本稿では,道路境界だけでなく,レーンセグメントとその対応するトポロジを予測するためのコヒーレントなアプローチを提案する。
論文 参考訳(メタデータ) (2025-07-02T06:26:17Z) - InteractionMap: Improving Online Vectorized HDMap Construction with Interaction [0.4551615447454768]
State-of-the-art map vectorization法は主に、エンドツーエンドでHDマップを生成するDETRライクなフレームワークに基づいている。
本稿では,ローカル-グローバル情報インタラクションをフル活用して,従来の地図ベクトル化手法を改善したInteractionMapを提案する。
論文 参考訳(メタデータ) (2025-03-27T16:23:15Z) - TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.84644266024571]
我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。
我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文 参考訳(メタデータ) (2024-11-22T06:13:42Z) - GenMapping: Unleashing the Potential of Inverse Perspective Mapping for Robust Online HD Map Construction [20.1127163541618]
我々はGenMappingというユニバーサルマップ生成フレームワークを設計した。
このフレームワークは、主および二重補助枝を含む三進的なシナジーアーキテクチャで構築されている。
実験結果の網羅的な配列から,提案手法はセマンティックマッピングとベクトル化マッピングの両方において最先端の手法を超越し,高速な推論速度を維持した。
論文 参考訳(メタデータ) (2024-09-13T10:15:28Z) - MapTRv2: An End-to-End Framework for Online Vectorized HD Map Construction [40.07726377230152]
High-definition (HD) マップは、運転シーンの豊富な正確な静的環境情報を提供する。
オンラインベクトル化HDマップ構築のためのエンドツーエンドフレームワークである textbfMap textbfTRansformer を提案する。
論文 参考訳(メタデータ) (2023-08-10T17:56:53Z) - How To Not Train Your Dragon: Training-free Embodied Object Goal
Navigation with Semantic Frontiers [94.46825166907831]
Embodied AIにおけるオブジェクトゴールナビゲーション問題に対処するためのトレーニング不要のソリューションを提案する。
本手法は,古典的な視覚的同時ローカライゼーションとマッピング(V-SLAM)フレームワークに基づく,構造化されたシーン表現を構築する。
本手法は,言語先行情報とシーン統計に基づいてシーングラフのセマンティクスを伝搬し,幾何学的フロンティアに意味知識を導入する。
論文 参考訳(メタデータ) (2023-05-26T13:38:33Z) - BEVBert: Multimodal Map Pre-training for Language-guided Navigation [75.23388288113817]
視覚・言語ナビゲーション(VLN)における空間認識型マップベース事前学習パラダイムを提案する。
我々は,グローバルなトポロジカルマップにおけるナビゲーション依存性をモデル化しながら,不完全な観測を明示的に集約し,重複を取り除くための局所距離マップを構築した。
ハイブリッドマップをベースとして,マルチモーダルマップ表現を学習するための事前学習フレームワークを考案し,空間認識型クロスモーダル推論を強化し,言語誘導ナビゲーションの目標を導出する。
論文 参考訳(メタデータ) (2022-12-08T16:27:54Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Temporally-Consistent Surface Reconstruction using Metrically-Consistent
Atlases [131.50372468579067]
そこで本稿では,時間変化点雲列から時間一貫性のある面列を復元する手法を提案する。
我々は、再構成された表面をニューラルネットワークによって計算されたアトラスとして表現し、フレーム間の対応性を確立することができる。
当社のアプローチは、いくつかの挑戦的なデータセットにおいて、最先端のものよりも優れています。
論文 参考訳(メタデータ) (2021-11-12T17:48:25Z) - Learning Lane Graph Representations for Motion Forecasting [92.88572392790623]
生の地図データからレーングラフを構築し,地図構造を保存する。
我々は,アクター・トゥ・レーン,レーン・トゥ・レーン,レーン・トゥ・アクター,アクター・トゥ・アクターの4種類のインタラクションからなる融合ネットワークを利用する。
提案手法は,大規模Argoverse運動予測ベンチマークにおいて,最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-07-27T17:59:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。