論文の概要: RoadPainter: Points Are Ideal Navigators for Topology transformER
- arxiv url: http://arxiv.org/abs/2407.15349v1
- Date: Mon, 22 Jul 2024 03:23:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-23 16:20:27.994423
- Title: RoadPainter: Points Are Ideal Navigators for Topology transformER
- Title(参考訳): RoadPainter: ポイントはトポロジートランスフォーマーの理想的なナビゲータ
- Authors: Zhongxing Ma, Shuang Liang, Yongkun Wen, Weixin Lu, Guowei Wan,
- Abstract要約: トポロジ推論は、道路シーンの正確な理解を提供することを目的としており、自律システムは安全かつ効率的なルートを特定できる。
多視点画像を用いた車線中心線のトポロジの検出と推論のための革新的なアプローチであるRoadPainterを提案する。
- 参考スコア(独自算出の注目度): 10.179711440042123
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Topology reasoning aims to provide a precise understanding of road scenes, enabling autonomous systems to identify safe and efficient routes. In this paper, we present RoadPainter, an innovative approach for detecting and reasoning the topology of lane centerlines using multi-view images. The core concept behind RoadPainter is to extract a set of points from each centerline mask to improve the accuracy of centerline prediction. We start by implementing a transformer decoder that integrates a hybrid attention mechanism and a real-virtual separation strategy to predict coarse lane centerlines and establish topological associations. Then, we generate centerline instance masks guided by the centerline points from the transformer decoder. Moreover, we derive an additional set of points from each mask and combine them with previously detected centerline points for further refinement. Additionally, we introduce an optional module that incorporates a Standard Definition (SD) map to further optimize centerline detection and enhance topological reasoning performance. Experimental evaluations on the OpenLane-V2 dataset demonstrate the state-of-the-art performance of RoadPainter.
- Abstract(参考訳): トポロジ推論は、道路シーンの正確な理解を提供することを目的としており、自律システムは安全かつ効率的なルートを特定できる。
本稿では,多視点画像を用いた車線中心線のトポロジの検出と推論のための革新的なアプローチであるRoadPainterを提案する。
RoadPainterの背後にある中核的な概念は、中心線予測の精度を向上させるために、各中心線マスクから点の集合を抽出することである。
まず,ハイブリットアテンション機構と実空間分離戦略を統合したトランスフォーマーデコーダを実装し,粗い車線の中心線を予測し,トポロジカルな関連性を確立する。
次に、トランスデコーダから中心点に導かれる中心点のインスタンスマスクを生成する。
さらに,各マスクから追加の点集合を導出し,以前に検出した中心点と組み合わせてさらなる改良を行う。
さらに,標準定義 (SD) マップを組み込んだオプションモジュールを導入し,中心点検出をさらに最適化し,位相的推論性能を向上させる。
OpenLane-V2データセットの実験的評価は、RoadPainterの最先端性能を示している。
関連論文リスト
- TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.84644266024571]
我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。
我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文 参考訳(メタデータ) (2024-11-22T06:13:42Z) - Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文 参考訳(メタデータ) (2024-10-10T10:10:03Z) - LMT-Net: Lane Model Transformer Network for Automated HD Mapping from Sparse Vehicle Observations [11.395749549636868]
Lane Model Transformer Network (LMT-Net) は、エンコーダとデコーダのニューラルネットワークアーキテクチャであり、ポリリン符号化を実行し、レーンペアとその接続性を予測する。
我々は、複数の車両観測と、地上真実(GT)としての人間のアノテーションからなる内部データセット上でのLMT-Netの性能を評価する。
論文 参考訳(メタデータ) (2024-09-19T02:14:35Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - LineMarkNet: Line Landmark Detection for Valet Parking [13.563702256927135]
我々は,サラウンドビューカメラからラインランドマークを検出するディープネットワーク(LineMarkNet)を開発した。
次に、複数行のランドマークを検出するためにマルチタスクデコーダを使用します。
実験結果から,本フレームワークは複数の線検出手法と比較して性能が向上していることがわかった。
論文 参考訳(メタデータ) (2023-09-19T09:43:29Z) - TopoMask: Instance-Mask-Based Formulation for the Road Topology Problem
via Transformer-Based Architecture [4.970364068620607]
道路トポロジにおける中心線予測のためのTopoMaskを紹介する。
TopoMaskはOpenLane-V2スコア(OLS)で4位、OpenLane Topology Challenge 2023ではF1スコアで2位にランクインしている。
論文 参考訳(メタデータ) (2023-06-08T17:58:57Z) - Semantic Segmentation of Radar Detections using Convolutions on Point
Clouds [59.45414406974091]
本稿では,レーダ検出を点雲に展開する深層学習手法を提案する。
このアルゴリズムは、距離依存クラスタリングと入力点雲の事前処理により、レーダ固有の特性に適応する。
我々のネットワークは、レーダポイント雲のセマンティックセグメンテーションのタスクにおいて、PointNet++に基づく最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2023-05-22T07:09:35Z) - PaRK-Detect: Towards Efficient Multi-Task Satellite Imagery Road
Extraction via Patch-Wise Keypoints Detection [12.145321599949236]
我々は、マルチタスク衛星画像道路抽出のための新しい手法、パッチワイド道路キーポイント検出(PaRK-Detect)を提案する。
筆者らのフレームワークは,パッチワイド道路キーポイントの位置と,それら間の近接関係を予測し,道路グラフを単一パスで構築する。
我々は,DeepGlobe, Massachusetts Roads, RoadTracerの既存の最先端手法に対するアプローチを評価し,競争力やより良い結果を得る。
論文 参考訳(メタデータ) (2023-02-26T08:26:26Z) - Monocular BEV Perception of Road Scenes via Front-to-Top View Projection [57.19891435386843]
本稿では,鳥の目視で道路配置と車両占有率によって形成された局所地図を再構築する新しい枠組みを提案する。
我々のモデルは1つのGPU上で25FPSで動作し、リアルタイムパノラマHDマップの再構築に有効である。
論文 参考訳(メタデータ) (2022-11-15T13:52:41Z) - Laneformer: Object-aware Row-Column Transformers for Lane Detection [96.62919884511287]
Laneformerは、自動運転における車線検出に適したトランスフォーマーベースのアーキテクチャである。
様々な視覚タスクにおけるトランスフォーマーエンコーダ・デコーダアーキテクチャの最近の進歩に触発されて、我々は新しいエンドツーエンドのLaneformerアーキテクチャの設計を進める。
論文 参考訳(メタデータ) (2022-03-18T10:14:35Z) - Detecting Lane and Road Markings at A Distance with Perspective
Transformer Layers [5.033948921121557]
既存の手法では、検出精度は距離の増大とともに劣化することが多い。
これは、遠車線や道路標識が画像中の少数のピクセルを占有しているためである。
逆のパースペクティブマッピングは、パースペクティブの歪みを取り除くために使用できるが、本質的にはアーティファクトに繋がる可能性がある。
論文 参考訳(メタデータ) (2020-03-19T03:22:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。