論文の概要: MambaMap: Online Vectorized HD Map Construction using State Space Model
- arxiv url: http://arxiv.org/abs/2507.20224v1
- Date: Sun, 27 Jul 2025 11:09:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:57.277466
- Title: MambaMap: Online Vectorized HD Map Construction using State Space Model
- Title(参考訳): MambaMap: 状態空間モデルを用いたオンラインベクトルHDマップの構築
- Authors: Ruizi Yang, Xiaolu Liu, Junbo Chen, Jianke Zhu,
- Abstract要約: MambaMapは、オンラインベクター化されたHDマップを構築するために、状態空間の長い時間的特徴を効率的に融合する新しいフレームワークである。
具体的には、MambaMapにはメモリバンクが組み込まれており、過去のフレームから情報を保存して活用している。
さらに,BEVとインスタンスレベルの特徴抽出を強化するために,革新的な多方向・時空間走査方式を設計する。
- 参考スコア(独自算出の注目度): 11.15033113060733
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-definition (HD) maps are essential for autonomous driving, as they provide precise road information for downstream tasks. Recent advances highlight the potential of temporal modeling in addressing challenges like occlusions and extended perception range. However, existing methods either fail to fully exploit temporal information or incur substantial computational overhead in handling extended sequences. To tackle these challenges, we propose MambaMap, a novel framework that efficiently fuses long-range temporal features in the state space to construct online vectorized HD maps. Specifically, MambaMap incorporates a memory bank to store and utilize information from historical frames, dynamically updating BEV features and instance queries to improve robustness against noise and occlusions. Moreover, we introduce a gating mechanism in the state space, selectively integrating dependencies of map elements in high computational efficiency. In addition, we design innovative multi-directional and spatial-temporal scanning strategies to enhance feature extraction at both BEV and instance levels. These strategies significantly boost the prediction accuracy of our approach while ensuring robust temporal consistency. Extensive experiments on the nuScenes and Argoverse2 datasets demonstrate that our proposed MambaMap approach outperforms state-of-the-art methods across various splits and perception ranges. Source code will be available at https://github.com/ZiziAmy/MambaMap.
- Abstract(参考訳): 高精細(HD)マップは、下流タスクの正確な道路情報を提供するため、自動運転に不可欠である。
近年の進歩は、閉塞や知覚範囲の拡大といった課題に対処する際の時間的モデリングの可能性を強調している。
しかし、既存の手法は時間的情報を完全に活用できないか、拡張シーケンスを扱う際にかなりの計算オーバーヘッドを発生させるかのいずれかである。
これらの課題に対処するため,オンラインベクトル化HDマップを構築するために,状態空間における時間的長期的特徴を効率的に融合する新しいフレームワークであるMambaMapを提案する。
具体的には、メモリバンクを組み込んで、履歴フレームからの情報を保存し、活用し、BEV機能とインスタンスクエリを動的に更新することで、ノイズや閉塞に対する堅牢性を改善する。
さらに,状態空間にゲーティング機構を導入し,マップ要素の依存関係を高い計算効率で選択的に統合する。
さらに,BEVとインスタンスレベルの特徴抽出を強化するために,革新的な多方向・時空間走査方式を設計する。
これらの戦略は、堅牢な時間的一貫性を確保しながら、我々のアプローチの予測精度を大幅に向上させる。
nuScenesとArgoverse2データセットの大規模な実験により、提案したMambaMapアプローチは、様々な分割や知覚範囲で最先端の手法より優れていることが示された。
ソースコードはhttps://github.com/ZiziAmy/MambaMap.comで入手できる。
関連論文リスト
- RTMap: Real-Time Recursive Mapping with Change Detection and Localization [8.343318095882232]
RTMapは、自己進化メモリとして、マルチトラバースHDマップを継続的にクラウドソーシングする。
オンボードエージェントでは、RTMapはエンドツーエンドの方法で、同時に3つのコア課題に対処する。
いくつかの公道自動運転データセットの実験は、事前支援された地図の品質と位置決め精度の両方において、我々の確固たる性能を実証している。
論文 参考訳(メタデータ) (2025-07-01T17:32:30Z) - MapExpert: Online HD Map Construction with Simple and Efficient Sparse Map Element Expert [7.086030137483952]
専門家によるオンラインHDマップ手法であるMapExpertを紹介した。
MapExpertは、ルータが配布するスパースの専門家を利用して、様々な非キュビックマップ要素を正確に記述します。
論文 参考訳(メタデータ) (2024-12-17T09:19:44Z) - Unveiling the Hidden: Online Vectorized HD Map Construction with Clip-Level Token Interaction and Propagation [14.480713752871521]
MapUnveilerは、クリップレベルのベクトル化HDマップ構築の新しいパラダイムである。
これは、高密度の画像表現と効率的なクリップトークンを関連付けることで、クリップ入力内の隠蔽マップ要素を公開する。
MapUnveilerはクリップトークンの伝搬を通じてクリップ間の情報を関連付け、長期の時間マップ情報を有効に活用する。
論文 参考訳(メタデータ) (2024-11-17T08:38:18Z) - Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文 参考訳(メタデータ) (2024-10-10T10:10:03Z) - HRVMamba: High-Resolution Visual State Space Model for Dense Prediction [60.80423207808076]
効率的なハードウェアを意識した設計のステートスペースモデル(SSM)は、コンピュータビジョンタスクにおいて大きな可能性を証明している。
これらのモデルは、誘導バイアスの不足、長距離の忘れ、低解像度の出力表現の3つの主要な課題によって制約されている。
本稿では, 変形可能な畳み込みを利用して, 長距離忘れ問題を緩和する動的ビジュアル状態空間(DVSS)ブロックを提案する。
また,DVSSブロックに基づく高分解能視覚空間モデル(HRVMamba)を導入し,プロセス全体を通して高分解能表現を保存する。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - MemFusionMap: Working Memory Fusion for Online Vectorized HD Map Construction [6.743612231580936]
オンラインHDマップ構築のための時間的推論機能を強化した新しい時間的融合モデルを提案する。
具体的には,動作メモリの融合モジュールにコントリビュートして,モデルメモリの容量を向上し,フレームの履歴を解析する。
また、時間重なり情報と車両軌道についてモデルに明確に通知する新しい時間重なりヒートマップを設計する。
論文 参考訳(メタデータ) (2024-09-26T03:16:39Z) - SIGMA: Selective Gated Mamba for Sequential Recommendation [56.85338055215429]
最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-08-21T09:12:59Z) - ADMap: Anti-disturbance framework for reconstructing online vectorized
HD map [9.218463154577616]
本稿では, 反ゆらぎマップ再構築フレームワーク (ADMap) を提案する。
点次ジッタを緩和するため、このフレームワークは、マルチスケール知覚ネック、インスタンスインタラクティブアテンション(IIA)、ベクトル方向差損失(VDDL)の3つのモジュールで構成されている。
論文 参考訳(メタデータ) (2024-01-24T01:37:27Z) - StreamMapNet: Streaming Mapping Network for Vectorized Online HD Map
Construction [36.1596833523566]
本稿では,ビデオの時系列時間的モデリングに適応した新しいオンラインマッピングパイプラインであるStreamMapNetを紹介する。
StreamMapNetは、高安定性の大規模ローカルHDマップの構築を支援するマルチポイントアテンションと時間情報を利用する。
論文 参考訳(メタデータ) (2023-08-24T05:22:43Z) - Online Map Vectorization for Autonomous Driving: A Rasterization
Perspective [58.71769343511168]
より優れた感度を有し,現実の自律運転シナリオに適した,新化に基づく評価指標を提案する。
また、精度の高い出力に微分可能化を適用し、HDマップの幾何学的監視を行う新しいフレームワークであるMapVR(Map Vectorization via Rasterization)を提案する。
論文 参考訳(メタデータ) (2023-06-18T08:51:14Z) - AdaFuse: Adaptive Temporal Fusion Network for Efficient Action
Recognition [68.70214388982545]
テンポラルモデリングは、効率的なビデオアクション認識の鍵である。
我々はAdaFuseと呼ばれる適応時間融合ネットワークを導入し、現在の特徴マップと過去の特徴マップからチャネルを融合する。
我々の手法は、最先端の手法に匹敵する精度で、約40%の計算節約を達成できる。
論文 参考訳(メタデータ) (2021-02-10T23:31:02Z) - DS-Net: Dynamic Spatiotemporal Network for Video Salient Object
Detection [78.04869214450963]
時間情報と空間情報のより効果的な融合のための新しい動的時空間ネットワーク(DSNet)を提案する。
提案手法は最先端アルゴリズムよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-09T06:42:30Z) - Radar-based Dynamic Occupancy Grid Mapping and Object Detection [55.74894405714851]
近年、古典的占有グリッドマップのアプローチが動的占有グリッドマップに拡張されている。
本稿では,従来のアプローチのさらなる発展について述べる。
複数のレーダセンサのデータを融合し、グリッドベースの物体追跡・マッピング手法を適用する。
論文 参考訳(メタデータ) (2020-08-09T09:26:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。