論文の概要: TopoStreamer: Temporal Lane Segment Topology Reasoning in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2507.00709v1
- Date: Tue, 01 Jul 2025 12:10:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.624904
- Title: TopoStreamer: Temporal Lane Segment Topology Reasoning in Autonomous Driving
- Title(参考訳): TopoStreamer: 自動運転における時間線セグメントトポロジ推論
- Authors: Yiming Yang, Yueru Luo, Bingkun He, Hongbin Lin, Suzhong Fu, Chao Yan, Kun Tang, Xinrui Yan, Chao Zheng, Shuguang Cui, Zhen Li,
- Abstract要約: TopoStreamerは、レーンセグメントトポロジー推論のためのエンドツーエンドの時間知覚モデルである。
TopoStreamerは、ストリーミング属性制約、動的レーン境界位置エンコーディング、およびレーンセグメントのデノイングという3つの重要な改善点を紹介している。
Open-Lane-V2データセットでは、TopoStreamerが最先端のメソッドよりも大幅に改善されている。
- 参考スコア(独自算出の注目度): 53.75669280804328
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Lane segment topology reasoning constructs a comprehensive road network by capturing the topological relationships between lane segments and their semantic types. This enables end-to-end autonomous driving systems to perform road-dependent maneuvers such as turning and lane changing. However, the limitations in consistent positional embedding and temporal multiple attribute learning in existing methods hinder accurate roadnet reconstruction. To address these issues, we propose TopoStreamer, an end-to-end temporal perception model for lane segment topology reasoning. Specifically, TopoStreamer introduces three key improvements: streaming attribute constraints, dynamic lane boundary positional encoding, and lane segment denoising. The streaming attribute constraints enforce temporal consistency in both centerline and boundary coordinates, along with their classifications. Meanwhile, dynamic lane boundary positional encoding enhances the learning of up-to-date positional information within queries, while lane segment denoising helps capture diverse lane segment patterns, ultimately improving model performance. Additionally, we assess the accuracy of existing models using a lane boundary classification metric, which serves as a crucial measure for lane-changing scenarios in autonomous driving. On the OpenLane-V2 dataset, TopoStreamer demonstrates significant improvements over state-of-the-art methods, achieving substantial performance gains of +3.4% mAP in lane segment perception and +2.1% OLS in centerline perception tasks.
- Abstract(参考訳): レーンセグメントのトポロジ推論は、レーンセグメントとそれらの意味型の間のトポロジ的関係を捉え、包括的道路ネットワークを構築する。
これにより、エンド・ツー・エンドの自動運転システムは、回転や車線変更などの道路依存の操作を行うことができる。
しかし,既存手法における一貫した位置埋め込みと時間的多重属性学習の限界は,正確な道路網再建を妨げている。
これらの問題に対処するために,レーンセグメントトポロジ推論のための終端時間知覚モデルであるTopoStreamerを提案する。
具体的には,ストリーミング属性制約,ダイナミックレーン境界位置エンコーディング,レーンセグメントのデノイングという,3つの重要な改善点を紹介している。
ストリーミング属性の制約は、中心線と境界座標の時間的一貫性とそれらの分類を強制する。
一方、動的レーン境界位置エンコーディングは、クエリ内での最新の位置情報の学習を促進する一方、レーンセグメントの復調は様々なレーンセグメントパターンを捕捉し、最終的にはモデル性能を向上させる。
さらに,車線境界分類基準を用いて既存モデルの精度を評価する。
OpenLane-V2データセットでは、TopoStreamerは最先端の手法よりも大幅に改善され、レーンセグメントの知覚では+3.4% mAP、センターラインの知覚では+2.1% OLSの性能向上を達成した。
関連論文リスト
- LMT-Net: Lane Model Transformer Network for Automated HD Mapping from Sparse Vehicle Observations [11.395749549636868]
Lane Model Transformer Network (LMT-Net) は、エンコーダとデコーダのニューラルネットワークアーキテクチャであり、ポリリン符号化を実行し、レーンペアとその接続性を予測する。
我々は、複数の車両観測と、地上真実(GT)としての人間のアノテーションからなる内部データセット上でのLMT-Netの性能を評価する。
論文 参考訳(メタデータ) (2024-09-19T02:14:35Z) - Homography Guided Temporal Fusion for Road Line and Marking Segmentation [73.47092021519245]
道路線やマーキングは、移動車両、影、グレアの存在下でしばしば閉鎖される。
本稿では,映像フレームを補足的に利用するHomography Guided Fusion (HomoFusion) モジュールを提案する。
カメラ固有のデータと地上平面の仮定をクロスフレーム対応に利用することにより,高速・高精度性能が向上した軽量ネットワークの実現が期待できることを示す。
論文 参考訳(メタデータ) (2024-04-11T10:26:40Z) - LaneSegNet: Map Learning with Lane Segment Perception for Autonomous
Driving [60.55208681215818]
道路構造の完全な表現を得るために,レーンセグメントを生成する最初のエンドツーエンドマッピングネットワークであるLaneSegNetを紹介した。
提案アルゴリズムは2つの重要な修正点を特徴としている。1つは、長距離特徴空間内の重要な領域の詳細をキャプチャするレーンアテンションモジュールである。
OpenLane-V2データセットでは、LaneSegNetは3つのタスクにまたがって大幅に向上している。
論文 参考訳(メタデータ) (2023-12-26T16:22:10Z) - Graph-based Topology Reasoning for Driving Scenes [102.35885039110057]
TopoNetは、従来の知覚タスクを超えてトラフィック知識を抽象化できる最初のエンドツーエンドフレームワークである。
TopoNetを,難解なシーン理解ベンチマークOpenLane-V2で評価した。
論文 参考訳(メタデータ) (2023-04-11T15:23:29Z) - Lane Detection Model Based on Spatio-Temporal Network With Double
Convolutional Gated Recurrent Units [11.968518335236787]
レーン検出は今後しばらくは未解決の問題として残るだろう。
二重円錐 Gated Recurrent Units (ConvGRUs) を用いた時空間ネットワークは、困難なシーンにおける車線検出に対処することを提案した。
我々のモデルは最先端の車線検出モデルより優れている。
論文 参考訳(メタデータ) (2020-08-10T06:50:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。