論文の概要: PseudoMapTrainer: Learning Online Mapping without HD Maps
- arxiv url: http://arxiv.org/abs/2508.18788v1
- Date: Tue, 26 Aug 2025 08:13:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.749715
- Title: PseudoMapTrainer: Learning Online Mapping without HD Maps
- Title(参考訳): PseudoMapTrainer:HDマップなしでオンラインマッピングを学ぶ
- Authors: Christian Löwens, Thorben Funke, Jingchao Xie, Alexandru Paul Condurache,
- Abstract要約: PseudoMapTrainerは、ラベルのないセンサデータから生成された擬似ラベルを使用する、オンラインマッピングの新しいアプローチである。
路面をマルチカメラ画像から再構成することで,これらの擬似ラベルを導出する。
擬似ラベルは、オンラインモデルを半教師付きで事前学習するのに有効である。
- 参考スコア(独自算出の注目度): 41.789167930501016
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online mapping models show remarkable results in predicting vectorized maps from multi-view camera images only. However, all existing approaches still rely on ground-truth high-definition maps during training, which are expensive to obtain and often not geographically diverse enough for reliable generalization. In this work, we propose PseudoMapTrainer, a novel approach to online mapping that uses pseudo-labels generated from unlabeled sensor data. We derive those pseudo-labels by reconstructing the road surface from multi-camera imagery using Gaussian splatting and semantics of a pre-trained 2D segmentation network. In addition, we introduce a mask-aware assignment algorithm and loss function to handle partially masked pseudo-labels, allowing for the first time the training of online mapping models without any ground-truth maps. Furthermore, our pseudo-labels can be effectively used to pre-train an online model in a semi-supervised manner to leverage large-scale unlabeled crowdsourced data. The code is available at github.com/boschresearch/PseudoMapTrainer.
- Abstract(参考訳): オンラインマッピングモデルは、多視点カメラ画像のみからベクトル化マップを予測する際、顕著な結果を示す。
しかし、既存のすべてのアプローチは、訓練中は地道な高精細地図に依存しており、これは入手するのに高価であり、信頼性の高い一般化に十分な地理的に多様でないことが多い。
本研究ではPseudoMapTrainerを提案する。PseudoMapTrainerは、ラベルのないセンサデータから生成された擬似ラベルを利用するオンラインマッピングの新しいアプローチである。
我々は、ガウススプラッティングと事前訓練された2次元セグメンテーションネットワークのセグメンテーションを用いたマルチカメラ画像から路面を再構成することにより、これらの擬似ラベルを導出する。
さらに,マスク付き擬似ラベルを部分的に処理するためのマスク対応代入アルゴリズムと損失関数を導入し,地平線地図のないオンライン地図モデルのトレーニングを初めて行う。
さらに、我々の擬似ラベルは、大規模な未ラベルのクラウドソースデータを活用するために、オンラインモデルを半教師付きで事前学習するために効果的に使用できる。
コードはgithub.com/boschresearch/PseudoMapTrainerで入手できる。
関連論文リスト
- Semantic Segmentation for Sequential Historical Maps by Learning from Only One Map [0.4915744683251151]
深層学習に基づくセマンティックセグメンテーションを用いたデジタル化の自動化手法を提案する。
このプロセスにおける重要な課題は、ディープニューラルネットワークのトレーニングに必要な地味なアノテーションの欠如である。
モデル微調整のための弱教師付き年齢追跡戦略を導入する。
論文 参考訳(メタデータ) (2025-01-03T14:55:22Z) - Neural Semantic Surface Maps [52.61017226479506]
本稿では,2つの属とゼロの形状の地図を自動計算する手法を提案する。
提案手法は,手動のアノテーションや3Dトレーニングデータ要求を排除し,意味的表面-表面マップを生成する。
論文 参考訳(メタデータ) (2023-09-09T16:21:56Z) - SNAP: Self-Supervised Neural Maps for Visual Positioning and Semantic
Understanding [57.108301842535894]
我々は、地上と頭上の画像からリッチなニューラル2Dマップを学習するディープネットワークSNAPを紹介する。
我々は、異なる入力から推定されるニューラルマップの整列をトレーニングし、何千万ものストリートビュー画像のカメラポーズでのみ監視する。
SNAPは、従来の手法の範囲を超えて、挑戦的な画像クエリの場所を解決できる。
論文 参考訳(メタデータ) (2023-06-08T17:54:47Z) - Is Cross-modal Information Retrieval Possible without Training? [4.616703548353372]
Procrustes問題に対する解の最小二乗と特異値分解(SVD)から計算した単純な写像をとる。
すなわち、テキストのようなあるモダリティの情報が与えられた場合、このマッピングは、画像のような別のモダリティにおける意味的に等価なデータ項目を見つけるのに役立ちます。
既訓練の深層学習モデルを用いて,テキスト・ツー・イメージ検索と画像・トゥ・テキスト検索のタスクにおいて,上記の単純なモーダル・マッピングを実験した。
論文 参考訳(メタデータ) (2023-04-20T02:36:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。