論文の概要: MapDiffusion: Generative Diffusion for Vectorized Online HD Map Construction and Uncertainty Estimation in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2507.21423v1
- Date: Tue, 29 Jul 2025 01:16:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:55.463135
- Title: MapDiffusion: Generative Diffusion for Vectorized Online HD Map Construction and Uncertainty Estimation in Autonomous Driving
- Title(参考訳): MapDiffusion: 自動走行におけるベクトルオンラインHDマップ構築と不確実性推定のための生成拡散
- Authors: Thomas Monninger, Zihan Zhang, Zhipeng Mo, Md Zafar Anwar, Steffen Staab, Sihao Ding,
- Abstract要約: 自律運転はセンサデータから静的環境を理解する必要がある。
伝統的な地図構築モデルは決定論的点推定を提供する。
本研究では,ベクトル化可能な地図の完全な分布を学習する新しい生成手法であるMapDiffusionを提案する。
- 参考スコア(独自算出の注目度): 24.962900390344235
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous driving requires an understanding of the static environment from sensor data. Learned Bird's-Eye View (BEV) encoders are commonly used to fuse multiple inputs, and a vector decoder predicts a vectorized map representation from the latent BEV grid. However, traditional map construction models provide deterministic point estimates, failing to capture uncertainty and the inherent ambiguities of real-world environments, such as occlusions and missing lane markings. We propose MapDiffusion, a novel generative approach that leverages the diffusion paradigm to learn the full distribution of possible vectorized maps. Instead of predicting a single deterministic output from learned queries, MapDiffusion iteratively refines randomly initialized queries, conditioned on a BEV latent grid, to generate multiple plausible map samples. This allows aggregating samples to improve prediction accuracy and deriving uncertainty estimates that directly correlate with scene ambiguity. Extensive experiments on the nuScenes dataset demonstrate that MapDiffusion achieves state-of-the-art performance in online map construction, surpassing the baseline by 5% in single-sample performance. We further show that aggregating multiple samples consistently improves performance along the ROC curve, validating the benefit of distribution modeling. Additionally, our uncertainty estimates are significantly higher in occluded areas, reinforcing their value in identifying regions with ambiguous sensor input. By modeling the full map distribution, MapDiffusion enhances the robustness and reliability of online vectorized HD map construction, enabling uncertainty-aware decision-making for autonomous vehicles in complex environments.
- Abstract(参考訳): 自律運転はセンサデータから静的環境を理解する必要がある。
Learned Bird's-Eye View (BEV)エンコーダは複数の入力を融合するために一般的に用いられ、ベクトルデコーダは潜伏したBEVグリッドからベクトル化されたマップ表現を予測する。
しかし、伝統的な地図構築モデルは決定論的な点推定を提供し、不確実性や閉塞や車線標識の欠如といった現実世界の環境固有の曖昧さを捉えていない。
本研究では,拡散パラダイムを利用してベクトル化可能な地図の完全な分布を学習する新しい生成手法であるMapDiffusionを提案する。
学習したクエリから1つの決定論的出力を予測する代わりに、MapDiffusionは、ランダムに初期化されたクエリをBEV潜在グリッドに条件付きで反復的に洗練し、複数の可算マップサンプルを生成する。
これにより、サンプルの集約により予測精度が向上し、シーンのあいまいさと直接相関する不確実性推定が導出される。
nuScenesデータセットの大規模な実験は、MapDiffusionがオンラインマップ構築における最先端のパフォーマンスを達成し、単一サンプルのパフォーマンスでベースラインを5%超えることを示した。
さらに、複数のサンプルを集約することで、ROC曲線に沿った性能が一貫して向上し、分散モデリングの利点が検証されることを示す。
さらに,不確実性評価は閉鎖領域において有意に高く,不明瞭なセンサ入力を持つ領域の同定においてその価値を補強する。
完全なマップ分布をモデル化することにより、MapDiffusionは、オンラインベクトル化HDマップ構築の堅牢性と信頼性を高め、複雑な環境下での自動運転車の不確実性を考慮した意思決定を可能にする。
関連論文リスト
- Uncertainty-Instructed Structure Injection for Generalizable HD Map Construction [17.16231247910372]
UIGenMapは、一般化可能なHDマップベクトル化のための不確実な構造注入手法である。
本稿では、視線ビュー(PV)検出ブランチを導入し、構造的特徴を明示する。
地理的に不整合(geo-based)なデータに挑戦する実験は、UIGenMapが優れたパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-03-29T15:01:38Z) - Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - SemVecNet: Generalizable Vector Map Generation for Arbitrary Sensor Configurations [3.8472678261304587]
センサ構成への一般化を改善したベクトルマップ生成のためのモジュールパイプラインを提案する。
センサ構成に頑健なBEVセマンティックマップを採用することにより,提案手法は一般化性能を大幅に改善する。
論文 参考訳(メタデータ) (2024-04-30T23:45:16Z) - Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。
近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。
本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-18T09:52:14Z) - EgoVM: Achieving Precise Ego-Localization using Lightweight Vectorized
Maps [9.450650025266379]
本稿では,従来の最先端手法に匹敵するローカライズ精度を実現するエンド・ツー・エンドのローカライズネットワークであるEgoVMを提案する。
我々は、学習可能なセマンティック埋め込みを用いて、マップ要素のセマンティックタイプを符号化し、セマンティックセマンティックセグメンテーションでそれらを監督する。
本研究では,頑健なヒストグラムに基づくポーズ解法を用いて,候補ポーズを徹底的に探索することで最適なポーズを推定する。
論文 参考訳(メタデータ) (2023-07-18T06:07:25Z) - Online Map Vectorization for Autonomous Driving: A Rasterization
Perspective [58.71769343511168]
より優れた感度を有し,現実の自律運転シナリオに適した,新化に基づく評価指標を提案する。
また、精度の高い出力に微分可能化を適用し、HDマップの幾何学的監視を行う新しいフレームワークであるMapVR(Map Vectorization via Rasterization)を提案する。
論文 参考訳(メタデータ) (2023-06-18T08:51:14Z) - Generating detailed saliency maps using model-agnostic methods [0.0]
本稿では, モデルに依存しない RISE 法に着目し, グリッドベースアプローチの欠点を詳細に考察する。
VRISE (Voronoi-RISE) と呼ばれる修正は、大きなオクルージョンを用いて生成された地図の精度を向上させることを目的としている。
ILSVRC2012の検証分割において, VRISE と RISE が生成したサリエンシマップの精度を比較した。
論文 参考訳(メタデータ) (2022-09-04T21:34:46Z) - Robust Monocular Localization in Sparse HD Maps Leveraging Multi-Task
Uncertainty Estimation [28.35592701148056]
スライドウインドウポーズグラフに基づく新しい単分子局在化手法を提案する。
効率的なマルチタスク不確実性認識モジュールを提案する。
我々の手法は、挑戦的な都市シナリオにおけるロバストで正確な6Dローカライズを可能にする。
論文 参考訳(メタデータ) (2021-10-20T13:46:15Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。