論文の概要: RelTopo: Enhancing Relational Modeling for Driving Scene Topology Reasoning
- arxiv url: http://arxiv.org/abs/2506.13553v1
- Date: Mon, 16 Jun 2025 14:40:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:48.699674
- Title: RelTopo: Enhancing Relational Modeling for Driving Scene Topology Reasoning
- Title(参考訳): RelTopo: シーントポロジ推論のためのリレーショナルモデリングの強化
- Authors: Yueru Luo, Changqing Zhou, Yiming Yang, Erlong Li, Chao Zheng, Shuqi Mei, Shuguang Cui, Zhen Li,
- Abstract要約: 道路トポロジー推論は自動運転にとって重要であり、効率的なナビゲーションと交通規制の遵守を可能にする。
既存の手法は通常、レーン検出またはレーン・トゥ・レーン(L2L)のトポロジー推論(英語版)に重点を置いており、しばしばこれらのタスクを共同で最適化するためにレーン・トゥ・トラッフィック・エレメント(L2T)の関係をテキスト化している。
人間は自然に道路要素認識と接続性推論の文脈的関係を利用するので、リレーショナルモデリングは知覚と推論の両方に有益であると主張する。
- 参考スコア(独自算出の注目度): 55.21557415676928
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate road topology reasoning is critical for autonomous driving, enabling effective navigation and adherence to traffic regulations. Central to this task are lane perception and topology reasoning. However, existing methods typically focus on either lane detection or Lane-to-Lane (L2L) topology reasoning, often \textit{neglecting} Lane-to-Traffic-element (L2T) relationships or \textit{failing} to optimize these tasks jointly. Furthermore, most approaches either overlook relational modeling or apply it in a limited scope, despite the inherent spatial relationships among road elements. We argue that relational modeling is beneficial for both perception and reasoning, as humans naturally leverage contextual relationships for road element recognition and their connectivity inference. To this end, we introduce relational modeling into both perception and reasoning, \textit{jointly} enhancing structural understanding. Specifically, we propose: 1) a relation-aware lane detector, where our geometry-biased self-attention and \curve\ cross-attention refine lane representations by capturing relational dependencies; 2) relation-enhanced topology heads, including a geometry-enhanced L2L head and a cross-view L2T head, boosting reasoning with relational cues; and 3) a contrastive learning strategy with InfoNCE loss to regularize relationship embeddings. Extensive experiments on OpenLane-V2 demonstrate that our approach significantly improves both detection and topology reasoning metrics, achieving +3.1 in DET$_l$, +5.3 in TOP$_{ll}$, +4.9 in TOP$_{lt}$, and an overall +4.4 in OLS, setting a new state-of-the-art. Code will be released.
- Abstract(参考訳): 正確な道路トポロジ推論は自動運転にとって重要であり、効率的なナビゲーションと交通規制の遵守を可能にする。
このタスクの中心は、車線知覚とトポロジー推論である。
しかし、既存の手法は一般にレーン検出やレーン・トゥ・レーン(L2L)のトポロジ推論、しばしばレーン・トゥ・トラッフィック・エレメント(L2T)の関係、あるいはこれらのタスクを共同で最適化する \textit{failing} のいずれかに焦点を当てている。
さらに、ほとんどのアプローチは、道路要素間の固有の空間的関係にもかかわらず、リレーショナルモデリングを見落としるか、限られた範囲で適用するかのどちらかである。
人間は自然に道路要素認識と接続性推論の文脈的関係を利用するので、リレーショナルモデリングは知覚と推論の両方に有益であると主張する。
この目的のために, 認識と推論の両方にリレーショナルモデリングを導入し, 構造的理解の強化を図る。
具体的には、
1)関係性を考慮した車線検出装置であって,我々の幾何学的バイアスによる自己注意と<curve\ 相互注意線表現を関係性に依存して取得する。
2 幾何強化L2Lヘッド及び横視野L2Tヘッドを含む関係強化トポロジーヘッド。
3)関係埋め込みを正規化するためのInfoNCE損失を伴う対照的な学習戦略。
OpenLane-V2の大規模な実験により、我々のアプローチは検出とトポロジー推論のメトリクスを著しく改善し、DET$_l$, +5.3 in TOP$_{ll}$, +4.9 in TOP$_{lt}$, and a overall +4.4 in OLS, set a new-of-the-art。
コードはリリースされる。
関連論文リスト
- T2SG: Traffic Topology Scene Graph for Topology Reasoning in Autonomous Driving [26.038699227233227]
交通トポロジシーングラフ(Traffic Topology Scene Graph)は、路面を明示的にモデル化し、異なる路面信号で制御し、ガイドする統一されたシーングラフである。
T2SGの生成のために,新たに2つのレイヤが設計された新しいトポロジーシーングラフトランスフォーマーであるTopoFormerを提案する。
論文 参考訳(メタデータ) (2024-11-28T03:55:50Z) - TopoLogic: An Interpretable Pipeline for Lane Topology Reasoning on Driving Scenes [27.930213859199473]
レーン幾何距離とレーンクエリ類似度に基づくレーントポロジー推論の解釈可能な手法を提案する。
提案手法は,主要なベンチマークであるOpenLane-V2において,既存の最先端手法よりも大幅に優れています。
提案する幾何距離トポロジ推論法は, 再学習なしによく訓練されたモデルに組み込むことができる。
論文 参考訳(メタデータ) (2024-05-23T16:15:17Z) - TopoMLP: A Simple yet Strong Pipeline for Driving Topology Reasoning [51.29906807247014]
トポロジー推論は、道路シーンを理解し、自律運転における乾燥可能なルートを提示することを目的としている。
道路の中心線(車線)と交通要素を検出し、そのトポロジの関係、すなわち車線-車線トポロジと車線-交通トポロジを推論する必要がある。
トポロジー性能の上限を拡張するために,強力な3次元レーン検出器と改良された2次元交通要素検出器を導入する。
論文 参考訳(メタデータ) (2023-10-10T16:24:51Z) - Separated RoadTopoFormer [13.304343390479191]
分離されたRoadTopoFormerは、レーン中心線とトラフィック要素を推論関係で検出するエンドツーエンドフレームワークである。
最終提出は0.445 OLSで、これはサブタスクと組み合わせたスコアの両方で競い合っています。
論文 参考訳(メタデータ) (2023-07-04T08:21:39Z) - OpenLane-V2: A Topology Reasoning Benchmark for Unified 3D HD Mapping [84.65114565766596]
交通シーン構造を考慮したトポロジ推論のための最初のデータセットであるOpenLane-V2を提案する。
OpenLane-V2は2000のアノテートされた道路シーンで構成され、交通要素と車線との関係を記述している。
様々な最先端手法を評価し,OpenLane-V2の定量的,定性的な結果を示し,交通現場におけるトポロジ推論の今後の道筋を示す。
論文 参考訳(メタデータ) (2023-04-20T16:31:22Z) - Graph-based Topology Reasoning for Driving Scenes [102.35885039110057]
TopoNetは、従来の知覚タスクを超えてトラフィック知識を抽象化できる最初のエンドツーエンドフレームワークである。
TopoNetを,難解なシーン理解ベンチマークOpenLane-V2で評価した。
論文 参考訳(メタデータ) (2023-04-11T15:23:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。