論文の概要: FastMap: Fast Queries Initialization Based Vectorized HD Map Reconstruction Framework
- arxiv url: http://arxiv.org/abs/2503.05492v1
- Date: Fri, 07 Mar 2025 15:01:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-10 12:23:59.235334
- Title: FastMap: Fast Queries Initialization Based Vectorized HD Map Reconstruction Framework
- Title(参考訳): FastMap: 高速クエリ初期化に基づくベクトル化HDマップ再構成フレームワーク
- Authors: Haotian Hu, Jingwei Xu, Fanyi Wang, Toyota Li, Yaonong Wang, Laifeng Hu, Zhiwang Zhang,
- Abstract要約: FastMapは、既存のアプローチにおけるデコーダの冗長性を減らすために設計された革新的なフレームワークである。
我々のフレームワークは、ランダムにクエリを初期化する従来の手法を排除し、代わりにヒートマップ誘導クエリ生成モジュールを組み込む。
FastMapはnuScenesとArgoverse2両方のデータセットで最先端のパフォーマンスを実現し、デコーダはベースラインよりも3.2高速で動作する。
- 参考スコア(独自算出の注目度): 8.28438975701346
- License:
- Abstract: Reconstruction of high-definition maps is a crucial task in perceiving the autonomous driving environment, as its accuracy directly impacts the reliability of prediction and planning capabilities in downstream modules. Current vectorized map reconstruction methods based on the DETR framework encounter limitations due to the redundancy in the decoder structure, necessitating the stacking of six decoder layers to maintain performance, which significantly hampers computational efficiency. To tackle this issue, we introduce FastMap, an innovative framework designed to reduce decoder redundancy in existing approaches. FastMap optimizes the decoder architecture by employing a single-layer, two-stage transformer that achieves multilevel representation capabilities. Our framework eliminates the conventional practice of randomly initializing queries and instead incorporates a heatmap-guided query generation module during the decoding phase, which effectively maps image features into structured query vectors using learnable positional encoding. Additionally, we propose a geometry-constrained point-to-line loss mechanism for FastMap, which adeptly addresses the challenge of distinguishing highly homogeneous features that often arise in traditional point-to-point loss computations. Extensive experiments demonstrate that FastMap achieves state-of-the-art performance in both nuScenes and Argoverse2 datasets, with its decoder operating 3.2 faster than the baseline. Code and more demos are available at https://github.com/hht1996ok/FastMap.
- Abstract(参考訳): 高精細度マップの再構築は、下流モジュールの予測と計画能力の信頼性に直接影響するため、自律運転環境を理解する上で重要な課題である。
DETRフレームワークに基づく現在のベクトル化マップ再構成手法は、デコーダ構造の冗長性による限界に遭遇し、性能を維持するために6つのデコーダ層の積み重ねが必要であり、計算効率を著しく損なう。
この問題に対処するために,既存のアプローチにおけるデコーダの冗長性を低減するために設計された,革新的なフレームワークであるFastMapを紹介した。
FastMapは、マルチレベル表現機能を実現するシングルレイヤの2段階トランスフォーマーを使用することで、デコーダアーキテクチャを最適化する。
このフレームワークは、ランダムにクエリを初期化する従来の手法を排除し、デコードフェーズ中にヒートマップ誘導クエリ生成モジュールを組み込むことで、画像特徴を学習可能な位置符号化を用いて構造化クエリベクトルに効果的にマッピングする。
さらに,従来のポイント・ツー・ポイント・ロス計算でしばしば発生する,高度に均質な特徴を識別するという課題に対して,幾何制約によるFastMapのポイント・ツー・ライン・ロス機構を提案する。
大規模な実験により、FastMapはnuScenesとArgoverse2データセットの両方で最先端のパフォーマンスを実現しており、デコーダはベースラインよりも3.2高速である。
コードやデモはhttps://github.com/hht 1996ok/FastMap.comで公開されている。
関連論文リスト
- ADMap: Anti-disturbance framework for reconstructing online vectorized
HD map [9.218463154577616]
本稿では, 反ゆらぎマップ再構築フレームワーク (ADMap) を提案する。
点次ジッタを緩和するため、このフレームワークは、マルチスケール知覚ネック、インスタンスインタラクティブアテンション(IIA)、ベクトル方向差損失(VDDL)の3つのモジュールで構成されている。
論文 参考訳(メタデータ) (2024-01-24T01:37:27Z) - StreamMapNet: Streaming Mapping Network for Vectorized Online HD Map
Construction [36.1596833523566]
本稿では,ビデオの時系列時間的モデリングに適応した新しいオンラインマッピングパイプラインであるStreamMapNetを紹介する。
StreamMapNetは、高安定性の大規模ローカルHDマップの構築を支援するマルチポイントアテンションと時間情報を利用する。
論文 参考訳(メタデータ) (2023-08-24T05:22:43Z) - ASAG: Building Strong One-Decoder-Layer Sparse Detectors via Adaptive
Sparse Anchor Generation [50.01244854344167]
適応スパースアンカージェネレータ(ASAG)の提案により、スパース検出器と密度検出器のパフォーマンスギャップを橋渡しする。
ASAGは、グリッドではなくパッチの動的なアンカーを予測することで、機能競合の問題を軽減する。
提案手法は高密度な手法より優れ,高速かつ高精度なトレードオフを実現する。
論文 参考訳(メタデータ) (2023-08-18T02:06:49Z) - InsMapper: Exploring Inner-instance Information for Vectorized HD
Mapping [41.59891369655983]
InsMapperは、トランスフォーマーによるベクトル化された高精細マッピングのインナーインスタンス情報を利用する。
InsMapperは従来の最先端の手法を超越し、その有効性と汎用性を示している。
論文 参考訳(メタデータ) (2023-08-16T17:58:28Z) - MapTRv2: An End-to-End Framework for Online Vectorized HD Map Construction [40.07726377230152]
High-definition (HD) マップは、運転シーンの豊富な正確な静的環境情報を提供する。
オンラインベクトル化HDマップ構築のためのエンドツーエンドフレームワークである textbfMap textbfTRansformer を提案する。
論文 参考訳(メタデータ) (2023-08-10T17:56:53Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - MapTR: Structured Modeling and Learning for Online Vectorized HD Map
Construction [33.30177029735497]
MapTRは、効率的なオンラインベクトル化HDマップ構築のための構造化エンドツーエンドフレームワークである。
MapTRは既存のベクトル化マップ構築手法の中で最高の性能と効率を達成する。
論文 参考訳(メタデータ) (2022-08-30T17:55:59Z) - Learning to Localize Through Compressed Binary Maps [83.03367511221437]
私たちは、地図表現をローカリゼーションタスクに最適なように圧縮することを学びます。
本実験により,汎用コーデック上での2桁のストレージ要求を削減できるタスク固有圧縮を学習できることが示唆された。
論文 参考訳(メタデータ) (2020-12-20T14:47:15Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - Cross-Descriptor Visual Localization and Mapping [81.16435356103133]
視覚のローカライゼーションとマッピングは、Mixed Realityとロボティクスシステムの大部分を支える重要な技術である。
特徴表現の連続的な更新を必要とする局所化とマッピングのための3つの新しいシナリオを提案する。
我々のデータ駆動型アプローチは特徴記述子型に非依存であり、計算要求が低く、記述アルゴリズムの数と線形にスケールする。
論文 参考訳(メタデータ) (2020-12-02T18:19:51Z) - EfficientFCN: Holistically-guided Decoding for Semantic Segmentation [49.27021844132522]
最先端セマンティックセマンティックセグメンテーションアルゴリズムは主に拡張されたFully Convolutional Networks (DilatedFCN)に基づいている
本稿では,拡張畳み込みのないイメージネット事前学習ネットワークをバックボーンとする,効率的なFCNを提案する。
このようなフレームワークは、計算コストの1/3しか持たない最先端の手法に比べて、同等またはそれ以上の性能を達成する。
論文 参考訳(メタデータ) (2020-08-24T14:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。