論文の概要: MemFusionMap: Working Memory Fusion for Online Vectorized HD Map Construction
- arxiv url: http://arxiv.org/abs/2409.18737v1
- Date: Thu, 26 Sep 2024 03:16:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-01 14:25:07.519313
- Title: MemFusionMap: Working Memory Fusion for Online Vectorized HD Map Construction
- Title(参考訳): MemFusionMap: オンラインベクトルHDマップ構築のためのワーキングメモリフュージョン
- Authors: Jingyu Song, Xudong Chen, Liupei Lu, Jie Li, Katherine A. Skinner,
- Abstract要約: オンラインHDマップ構築のための時間的推論機能を強化した新しい時間的融合モデルを提案する。
具体的には、履歴フレーム間の推論のために、モデルのメモリ容量を改善するワーキングメモリ融合モジュールをコントリビュートする。
また、時間重なり情報と車両軌道についてモデルに明確に通知する新しい時間重なりヒートマップを設計する。
- 参考スコア(独自算出の注目度): 6.743612231580936
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-definition (HD) maps provide environmental information for autonomous driving systems and are essential for safe planning. While existing methods with single-frame input achieve impressive performance for online vectorized HD map construction, they still struggle with complex scenarios and occlusions. We propose MemFusionMap, a novel temporal fusion model with enhanced temporal reasoning capabilities for online HD map construction. Specifically, we contribute a working memory fusion module that improves the model's memory capacity to reason across history frames. We also design a novel temporal overlap heatmap to explicitly inform the model about the temporal overlap information and vehicle trajectory in the Bird's Eye View space. By integrating these two designs, MemFusionMap significantly outperforms existing methods while also maintaining a versatile design for scalability. We conduct extensive evaluation on open-source benchmarks and demonstrate a maximum improvement of 5.4% in mAP over state-of-the-art methods. The code for MemFusionMap will be made open-source upon publication of this paper.
- Abstract(参考訳): ハイデフィニション(HD)マップは、自律運転システムに環境情報を提供し、安全な計画に不可欠である。
単一フレーム入力を持つ既存の手法は,オンラインベクトル化HDマップ構築において優れた性能を発揮するが,複雑なシナリオやオクルージョンに苦慮している。
オンラインHDマップ構築のための時間的推論機能を強化した新しい時間的融合モデルであるMemFusionMapを提案する。
具体的には、履歴フレーム間の推論のために、モデルのメモリ容量を改善するワーキングメモリ融合モジュールをコントリビュートする。
また,バードアイビュー空間における時間重なり情報と車両軌道について,モデルに明確に通知する新しい時間重なりヒートマップを設計する。
これらの2つの設計を統合することで、MemFusionMapは既存のメソッドよりも大幅に優れ、スケーラビリティのための汎用的な設計を維持している。
我々は、オープンソースのベンチマークで広範囲に評価を行い、最先端の手法に比べて、mAPの最大5.4%の改善を実証する。
MemFusionMapのコードは、この記事の公開時にオープンソース化される。
関連論文リスト
- LGmap: Local-to-Global Mapping Network for Online Long-Range Vectorized HD Map Construction [0.3883607294385062]
本報告では,自律グランドチャレンジ2024の1位獲得ソリューションであるマップレスドライビングを紹介する。
本稿では,長距離時間モデルに適応した新しいオンラインマッピングパイプラインLGmapを提案する。
本手法はMapless Driving OpenLaneV2テストセットにおいて0.66UniScoreを実現する。
論文 参考訳(メタデータ) (2024-06-20T04:29:58Z) - StreamMapNet: Streaming Mapping Network for Vectorized Online HD Map
Construction [36.1596833523566]
本稿では,ビデオの時系列時間的モデリングに適応した新しいオンラインマッピングパイプラインであるStreamMapNetを紹介する。
StreamMapNetは、高安定性の大規模ローカルHDマップの構築を支援するマルチポイントアテンションと時間情報を利用する。
論文 参考訳(メタデータ) (2023-08-24T05:22:43Z) - MapTRv2: An End-to-End Framework for Online Vectorized HD Map
Construction [32.74879918300096]
High-definition (HD) マップは、運転シーンの豊富な正確な静的環境情報を提供する。
オンラインベクトル化HDマップ構築のためのエンドツーエンドフレームワークである textbfMap textbfTRansformer を提案する。
論文 参考訳(メタデータ) (2023-08-10T17:56:53Z) - TAPIR: Tracking Any Point with per-frame Initialization and temporal
Refinement [64.11385310305612]
本稿では,ビデオシーケンスを通して任意の物理面上の問合せ点を効果的に追跡する,TAP(Tracking Any Point)の新しいモデルを提案する。
提案手法では,(1)他のフレームの問合せ点に対する適切な候補点マッチングを独立に特定するマッチング段階と,(2)局所的相関に基づいてトラジェクトリと問合せの両方を更新する改良段階の2段階を用いる。
結果として得られたモデルは、DAVISにおける平均約20%の絶対平均ジャカード(AJ)改善によって示されるように、TAP-Vidベンチマークにおける大きなマージンで、すべてのベースライン手法を上回ります。
論文 参考訳(メタデータ) (2023-06-14T17:07:51Z) - NeMO: Neural Map Growing System for Spatiotemporal Fusion in
Bird's-Eye-View and BDD-Map Benchmark [9.430779563669908]
視覚中心のBird's-Eye View表現は自律運転システムに不可欠である。
この研究は、読みやすく、説明可能なビッグマップを利用してローカルマップを生成するための、NeMOという新しいパラダイムを概説する。
すべてのBEVグリッドの特徴分布が同じパターンに従うと仮定して、すべてのグリッドに対して共有重み付きニューラルネットワークを採用して、ビッグマップを更新する。
論文 参考訳(メタデータ) (2023-06-07T15:46:15Z) - SuperFusion: Multilevel LiDAR-Camera Fusion for Long-Range HD Map
Generation and Prediction [21.061273391348376]
我々は,複数のレベルでLiDARとカメラデータの融合を利用したSuperFusionという新しいネットワークを提案する。
その結果,提案手法により予測される長距離HDマップを用いることで,自動運転車の経路計画を改善することができることがわかった。
論文 参考訳(メタデータ) (2022-11-28T18:59:02Z) - Monocular BEV Perception of Road Scenes via Front-to-Top View Projection [57.19891435386843]
本稿では,鳥の目視で道路配置と車両占有率によって形成された局所地図を再構築する新しい枠組みを提案する。
我々のモデルは1つのGPU上で25FPSで動作し、リアルタイムパノラマHDマップの再構築に有効である。
論文 参考訳(メタデータ) (2022-11-15T13:52:41Z) - IterMVS: Iterative Probability Estimation for Efficient Multi-View
Stereo [71.84742490020611]
IterMVSは高解像度マルチビューステレオのための新しいデータ駆動方式である。
隠れ状態の深さの画素単位の確率分布を符号化するGRUに基づく新しい推定器を提案する。
DTU, タンク&テンプル, ETH3Dにおける本手法の有効性と有効性を検証する。
論文 参考訳(メタデータ) (2021-12-09T18:58:02Z) - HDMapGen: A Hierarchical Graph Generative Model of High Definition Maps [81.86923212296863]
HDマップは道路路面の正確な定義と交通ルールの豊富な意味を持つ地図である。
実際の道路トポロジやジオメトリはごくわずかで、自動運転スタックをテストする能力は著しく制限されています。
高品質で多様なHDマップを生成可能な階層グラフ生成モデルであるHDMapGenを提案する。
論文 参考訳(メタデータ) (2021-06-28T17:59:30Z) - Multi-Scale Boosted Dehazing Network with Dense Feature Fusion [92.92572594942071]
U-Netアーキテクチャに基づくDense Feature Fusionを用いたマルチスケールブーストデハージングネットワークを提案する。
提案モデルでは,ベンチマークデータセットや実世界のハジー画像に対する最先端のアプローチに対して,好意的に機能することを示す。
論文 参考訳(メタデータ) (2020-04-28T09:34:47Z) - RoutedFusion: Learning Real-time Depth Map Fusion [73.0378509030908]
深度マップ融合のための新しいリアルタイム能動機械学習手法を提案する。
本稿では,通常の核融合エラーを考慮に入れた非線形更新を予測できるニューラルネットワークを提案する。
本ネットワークは2次元深度ルーティングネットワークと3次元深度融合ネットワークから構成されており,センサ固有のノイズや外れ値の処理を効率的に行う。
論文 参考訳(メタデータ) (2020-01-13T16:46:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。