Fugu-MT 論文翻訳(概要): SemVecNet: Generalizable Vector Map Generation for Arbitrary Sensor Configurations

論文の概要: SemVecNet: Generalizable Vector Map Generation for Arbitrary Sensor Configurations

arxiv url: http://arxiv.org/abs/2405.00250v1
Date: Tue, 30 Apr 2024 23:45:16 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-02 16:47:02.577166
Title: SemVecNet: Generalizable Vector Map Generation for Arbitrary Sensor Configurations
Title（参考訳）: SemVecNet: 任意センサ構成のための一般化可能なベクトルマップ生成
Authors: Narayanan Elavathur Ranganatha, Hengyuan Zhang, Shashank Venkatramani, Jing-Yan Liao, Henrik I. Christensen,
Abstract要約: センサ構成への一般化を改善したベクトルマップ生成のためのモジュールパイプラインを提案する。センサ構成に頑健なBEVセマンティックマップを採用することにより,提案手法は一般化性能を大幅に改善する。
参考スコア（独自算出の注目度）: 3.8472678261304587
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Vector maps are essential in autonomous driving for tasks like localization and planning, yet their creation and maintenance are notably costly. While recent advances in online vector map generation for autonomous vehicles are promising, current models lack adaptability to different sensor configurations. They tend to overfit to specific sensor poses, leading to decreased performance and higher retraining costs. This limitation hampers their practical use in real-world applications. In response to this challenge, we propose a modular pipeline for vector map generation with improved generalization to sensor configurations. The pipeline leverages probabilistic semantic mapping to generate a bird's-eye-view (BEV) semantic map as an intermediate representation. This intermediate representation is then converted to a vector map using the MapTRv2 decoder. By adopting a BEV semantic map robust to different sensor configurations, our proposed approach significantly improves the generalization performance. We evaluate the model on datasets with sensor configurations not used during training. Our evaluation sets includes larger public datasets, and smaller scale private data collected on our platform. Our model generalizes significantly better than the state-of-the-art methods.
Abstract（参考訳）: ベクトルマップは、ローカライゼーションや計画といったタスクの自律運転には不可欠だが、その作成とメンテナンスには特にコストがかかる。自動運転車のオンラインベクターマップ生成の最近の進歩は有望だが、現在のモデルは異なるセンサー構成への適応性に欠けている。特定のセンサーのポーズに過度に適合する傾向があり、性能が低下し、トレーニングコストが上昇する。この制限は、現実世界のアプリケーションでの使用を妨げている。この課題に対応するために,センサ構成への一般化を改良したベクトルマップ生成のためのモジュールパイプラインを提案する。パイプラインは確率論的セマンティックマッピングを利用して、中間表現として鳥の目視(BEV)セマンティックマップを生成する。この中間表現は、MapTRv2デコーダを使用してベクトルマップに変換される。センサ構成に頑健なBEVセマンティックマップを採用することにより,提案手法は一般化性能を大幅に改善する。トレーニング中に使用しないセンサ構成のデータセット上でモデルを評価した。評価セットには、より大きな公開データセットと、プラットフォーム上で収集された小規模なプライベートデータが含まれています。我々のモデルは最先端の手法よりもはるかに良く一般化する。

関連論文リスト

Uncertainty-Instructed Structure Injection for Generalizable HD Map Construction [17.16231247910372]
UIGenMapは、一般化可能なHDマップベクトル化のための不確実な構造注入手法である。本稿では、視線ビュー(PV)検出ブランチを導入し、構造的特徴を明示する。地理的に不整合(geo-based)なデータに挑戦する実験は、UIGenMapが優れたパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (2025-03-29T15:01:38Z)
AugMapNet: Improving Spatial Latent Structure via BEV Grid Augmentation for Enhanced Vectorized Online HD Map Construction [10.651014925267859]
AugMapNetは、潜伏したBEV表現を大幅に強化する新しいテクニックである。 nuScenesとArgoverse2データセットの実験では、ベクトル化されたマップ予測性能が大幅に改善された。遅延BEVグリッドの詳細な解析により、AugMapNetのより構造化された遅延空間が確認できる。
論文参考訳（メタデータ） (2025-03-17T17:55:32Z)
TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.84644266024571]
我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文参考訳（メタデータ） (2024-11-22T06:13:42Z)
OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。 OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文参考訳（メタデータ） (2024-09-14T07:44:22Z)
Progressive Query Refinement Framework for Bird's-Eye-View Semantic Segmentation from Surrounding Images [3.495246564946556]
本稿では, 自律運転のためのバードズ・アイビュー(BEV)セマンティックセマンティックセグメンテーションにMR(Multi-Resolution)の概念を導入する。本稿では,画像間と特徴レベル間の相互作用を促進する視覚的特徴相互作用ネットワークを提案する。大規模な実世界のデータセットを用いて、我々のモデルを評価する。
論文参考訳（メタデータ） (2024-07-24T05:00:31Z)
Accelerating Online Mapping and Behavior Prediction via Direct BEV Feature Attention [30.190497345299004]
本稿では,オンライン地図推定手法の豊富な内部的特徴を明らかにするとともに,オンライン地図と軌跡予測をより緊密に統合する方法について述べる。これにより、内部のBEV機能に直接アクセスすると、推論速度が最大73%速くなり、実際のnuScenesデータセット上では最大29%の正確な予測が得られます。
論文参考訳（メタデータ） (2024-07-09T08:59:27Z)
EgoVM: Achieving Precise Ego-Localization using Lightweight Vectorized Maps [9.450650025266379]
本稿では,従来の最先端手法に匹敵するローカライズ精度を実現するエンド・ツー・エンドのローカライズネットワークであるEgoVMを提案する。我々は、学習可能なセマンティック埋め込みを用いて、マップ要素のセマンティックタイプを符号化し、セマンティックセマンティックセグメンテーションでそれらを監督する。本研究では,頑健なヒストグラムに基づくポーズ解法を用いて,候補ポーズを徹底的に探索することで最適なポーズを推定する。
論文参考訳（メタデータ） (2023-07-18T06:07:25Z)
Online Map Vectorization for Autonomous Driving: A Rasterization Perspective [58.71769343511168]
より優れた感度を有し,現実の自律運転シナリオに適した,新化に基づく評価指標を提案する。また、精度の高い出力に微分可能化を適用し、HDマップの幾何学的監視を行う新しいフレームワークであるMapVR(Map Vectorization via Rasterization)を提案する。
論文参考訳（メタデータ） (2023-06-18T08:51:14Z)
Energy-Based Models for Cross-Modal Localization using Convolutional Transformers [52.27061799824835]
GPSのない衛星画像に対して、距離センサを搭載した地上車両を位置決めする新しい枠組みを提案する。本稿では, 畳み込み変換器を用いて, 高精度な計量レベルの局所化を行う手法を提案する。我々は、エンドツーエンドでモデルをトレーニングし、KITTI、Pandaset、カスタムデータセットの最先端技術よりも高い精度でアプローチを実証する。
論文参考訳（メタデータ） (2023-06-06T21:27:08Z)
Pedestrian Detection: Domain Generalization, CNNs, Transformers and Beyond [82.37430109152383]
その結果、現在の歩行者検知器は、クロスデータセット評価において、たとえ小さな領域シフトであっても処理が不十分であることがわかった。限定的な一般化は、その方法と現在のデータ源の2つの主要な要因に帰着する。本稿では、一般化を改善する進歩的な微調整戦略を提案する。
論文参考訳（メタデータ） (2022-01-10T06:00:26Z)
VectorNet: Encoding HD Maps and Agent Dynamics from Vectorized Representation [74.56282712099274]
本稿では,ベクトルで表される個々の道路成分の空間的局所性を利用する階層型グラフニューラルネットワークであるVectorNetを紹介する。ベクトル化高定義(HD)マップとエージェントトラジェクトリの操作により、ロッキーなレンダリングや計算集約的なConvNetエンコーディングのステップを避けることができる。我々は、社内行動予測ベンチマークと最近リリースされたArgoverse予測データセットでVectorNetを評価した。
論文参考訳（メタデータ） (2020-05-08T19:07:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。