論文の概要: MapGCLR: Geospatial Contrastive Learning of Representations for Online Vectorized HD Map Construction
- arxiv url: http://arxiv.org/abs/2603.10688v1
- Date: Wed, 11 Mar 2026 11:58:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:32.927821
- Title: MapGCLR: Geospatial Contrastive Learning of Representations for Online Vectorized HD Map Construction
- Title(参考訳): MapGCLR: オンラインベクトル化HDマップ構築のための表現の地理空間的コントラスト学習
- Authors: Jonas Merkert, Alexander Blumberg, Jan-Hendrik Pauls, Christoph Stiller,
- Abstract要約: 自動運転車は周囲の世界を理解するために地図情報に依存している。
よりスケーラブルな代替手段は、オンラインのHDマップ構築にある。
本研究は、ベクトル化されたオンラインHDマップ構築モデルにおいて、潜伏鳥眼ビュー(BEV)特徴グリッド表現を改善することに焦点を当てる。
我々は、単一トラバーサルラベル付きデータの縮小セットを用いて教師付き同じモデルを訓練し、マルチトラバーサル要求に従ってより広範なラベル付きデータセットに基づいて自己教師する。
- 参考スコア(独自算出の注目度): 44.37176678126708
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous vehicles rely on map information to understand the world around them. However, the creation and maintenance of offline high-definition (HD) maps remains costly. A more scalable alternative lies in online HD map construction, which only requires map annotations at training time. To further reduce the need for annotating vast training labels, self-supervised training provides an alternative. This work focuses on improving the latent birds-eye-view (BEV) feature grid representation within a vectorized online HD map construction model by enforcing geospatial consistency between overlapping BEV feature grids as part of a contrastive loss function. To ensure geospatial overlap for contrastive pairs, we introduce an approach to analyze the overlap between traversals within a given dataset and generate subsidiary dataset splits following adjustable multi-traversal requirements. We train the same model supervised using a reduced set of single-traversal labeled data and self-supervised on a broader unlabeled set of data following our multi-traversal requirements, effectively implementing a semi-supervised approach. Our approach outperforms the supervised baseline across the board, both quantitatively in terms of the downstream tasks vectorized map perception performance and qualitatively in terms of segmentation in the principal component analysis (PCA) visualization of the BEV feature space.
- Abstract(参考訳): 自動運転車は周囲の世界を理解するために地図情報に依存している。
しかし、オフライン高精細(HD)マップの作成とメンテナンスはコストがかかるままである。
よりスケーラブルな代替手段は、オンラインのHDマップ構築にある。
巨大なトレーニングラベルを注釈付けする必要性をさらに軽減するために、自己教師型トレーニングは代替手段を提供する。
本研究は,比較損失関数の一部として重なり合うBEV特徴格子間の空間的整合性を実現することにより,ベクトル化されたオンラインHDマップ構築モデルにおける潜伏鳥眼ビュー(BEV)特徴格子表現の改善に焦点を当てる。
対照的な対の空間的重なりを確実にするため、与えられたデータセット内のトラバーサル間の重なりを解析し、調整可能なマルチトラバーサル要求に従って、補助的データセット分割を生成するアプローチを導入する。
我々は、単一トラバーサルラベル付きデータの縮小セットを用いて教師付き同じモデルを訓練し、マルチトラバーサル要求に従ってより広範なラベル付きデータセットに基づいて自己監督を行い、半教師付きアプローチを効果的に実装する。
提案手法は,BEV特徴空間の主成分分析(PCA)の可視化において,下流タスクのベクトル化マップ認識性能と定性的なセグメンテーションの両面において,教師付きベースラインよりも優れている。
関連論文リスト
- CSMapping: Scalable Crowdsourced Semantic Mapping and Topology Inference for Autonomous Driving [23.921417146230738]
CSMappingは正確なセマンティックマップとトポロジカル道路中心線を生成する。
nuScenes、Argoverse 2、および大規模プロプライエタリデータセットに関する実験は、最先端のセマンティクスとトポロジマッピングのパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-12-03T07:06:18Z) - SegLocNet: Multimodal Localization Network for Autonomous Driving via Bird's-Eye-View Segmentation [0.0]
SegLocNetはセマンティックセグメンテーションを用いて正確なローカライゼーションを実現するマルチモーダルフリーなローカライゼーションネットワークである。
本手法は,都市環境におけるエゴポーズを,一般化に頼ることなく正確に推定することができる。
私たちのコードと事前訓練されたモデルは公開されます。
論文 参考訳(メタデータ) (2025-02-27T13:34:55Z) - Without Paired Labeled Data: End-to-End Self-Supervised Learning for Drone-view Geo-Localization [20.603433987118837]
ドローンビュージオローカライゼーション(DVGL)は、GPSタグ付き衛星画像を取得することで、ドローンの正確なローカライゼーションを実現することを目的としている。
既存の手法は、教師あり学習のために、厳密にペアリングされたドローン衛星画像に大きく依存している。
浅いバックボーンネットワークを用いたエンドツーエンドの自己教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2025-02-17T02:53:08Z) - VQ-Map: Bird's-Eye-View Map Layout Estimation in Tokenized Discrete Space via Vector Quantization [108.68014173017583]
Bird's-eye-view (BEV) マップのレイアウト推定には、エゴ車の周囲の環境要素のセマンティクスを正確に完全に理解する必要がある。
本稿では,Vector Quantized-Variational AutoEncoder (VQ-VAE) に似た生成モデルを用いて,トークン化された離散空間における高レベルのBEVセマンティクスの事前知識を取得することを提案する。
得られたBEVトークンには,異なるBEV要素のセマンティクスを包含したコードブックが組み込まれているため,スパースバックボーン画像特徴と得られたBEVトークンとを直接一致させることができる。
論文 参考訳(メタデータ) (2024-11-03T16:09:47Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - EgoVM: Achieving Precise Ego-Localization using Lightweight Vectorized
Maps [9.450650025266379]
本稿では,従来の最先端手法に匹敵するローカライズ精度を実現するエンド・ツー・エンドのローカライズネットワークであるEgoVMを提案する。
我々は、学習可能なセマンティック埋め込みを用いて、マップ要素のセマンティックタイプを符号化し、セマンティックセマンティックセグメンテーションでそれらを監督する。
本研究では,頑健なヒストグラムに基づくポーズ解法を用いて,候補ポーズを徹底的に探索することで最適なポーズを推定する。
論文 参考訳(メタデータ) (2023-07-18T06:07:25Z) - BEVBert: Multimodal Map Pre-training for Language-guided Navigation [75.23388288113817]
視覚・言語ナビゲーション(VLN)における空間認識型マップベース事前学習パラダイムを提案する。
我々は,グローバルなトポロジカルマップにおけるナビゲーション依存性をモデル化しながら,不完全な観測を明示的に集約し,重複を取り除くための局所距離マップを構築した。
ハイブリッドマップをベースとして,マルチモーダルマップ表現を学習するための事前学習フレームワークを考案し,空間認識型クロスモーダル推論を強化し,言語誘導ナビゲーションの目標を導出する。
論文 参考訳(メタデータ) (2022-12-08T16:27:54Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Exploiting latent representation of sparse semantic layers for improved
short-term motion prediction with Capsule Networks [0.12183405753834559]
本稿では,HD(High-Definition)マップの小さな領域に対応するスパースなセマンティクス層の階層的表現を学習する文脈において,Capsule Networks(CapsNets)の利用を検討する。
CapsNetsに基づくアーキテクチャを使用することで、検出された画像内の特徴間の階層的関係を維持すると同時に、プール操作によってしばしば発生する空間データの損失を防ぐことができる。
本モデルでは,ネットワーク全体の規模を大幅に削減しつつ,予測に関する最近の研究よりも大幅な改善を実現していることを示す。
論文 参考訳(メタデータ) (2021-03-02T11:13:43Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。