論文の概要: Topology Reasoning for Driving Scenes
- arxiv url: http://arxiv.org/abs/2304.05277v1
- Date: Tue, 11 Apr 2023 15:23:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-12 14:25:03.611836
- Title: Topology Reasoning for Driving Scenes
- Title(参考訳): 運転シーンにおけるトポロジー推論
- Authors: Tianyu Li, Li Chen, Xiangwei Geng, Huijie Wang, Yang Li, Zhenbo Liu,
Shengyin Jiang, Yuting Wang, Hang Xu, Chunjing Xu, Feng Wen, Ping Luo, Junchi
Yan, Wei Zhang, Xiaogang Wang, Yu Qiao, Hongyang Li
- Abstract要約: TopoNetは、従来の知覚タスクを超えてトラフィック知識を抽象化できる最初のエンドツーエンドフレームワークである。
TopoNetを,難解なシーン理解ベンチマークOpenLane-V2で評価した。
- 参考スコア(独自算出の注目度): 120.99510635748342
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Understanding the road genome is essential to realize autonomous driving.
This highly intelligent problem contains two aspects - the connection
relationship of lanes, and the assignment relationship between lanes and
traffic elements, where a comprehensive topology reasoning method is vacant. On
one hand, previous map learning techniques struggle in deriving lane
connectivity with segmentation or laneline paradigms; or prior lane
topology-oriented approaches focus on centerline detection and neglect the
interaction modeling. On the other hand, the traffic element to lane assignment
problem is limited in the image domain, leaving how to construct the
correspondence from two views an unexplored challenge. To address these issues,
we present TopoNet, the first end-to-end framework capable of abstracting
traffic knowledge beyond conventional perception tasks. To capture the driving
scene topology, we introduce three key designs: (1) an embedding module to
incorporate semantic knowledge from 2D elements into a unified feature space;
(2) a curated scene graph neural network to model relationships and enable
feature interaction inside the network; (3) instead of transmitting messages
arbitrarily, a scene knowledge graph is devised to differentiate prior
knowledge from various types of the road genome. We evaluate TopoNet on the
challenging scene understanding benchmark, OpenLane-V2, where our approach
outperforms all previous works by a great margin on all perceptual and
topological metrics. The code would be released soon.
- Abstract(参考訳): 自律走行を実現するためには道路ゲノムを理解することが不可欠である。
この高度にインテリジェントな問題は、レーンの接続関係と、包括的なトポロジー推論手法が欠落しているレーンと交通要素の割り当て関係という2つの側面を含む。
一方、従来の地図学習手法は、セグメンテーションやレーンのパラダイムによる車線接続の導出に苦慮しており、あるいは、車線トポロジー指向のアプローチは、中心線の検出と相互作用モデリングの無視に重点を置いている。
一方、画像領域ではレーン割り当て問題に対するトラフィック要素が限定されており、2つのビューからの対応構築方法が未解決の課題となっている。
これらの課題に対処するために,従来の知覚タスク以上のトラフィック知識を抽象化可能な,最初のエンドツーエンドフレームワークであるTopoNetを提案する。
運転シーントポロジーを捉えるために,(1)2d要素からの意味的知識を統一的な特徴空間に組み込む組込みモジュール,(2)関係をモデル化し,ネットワーク内の特徴的相互作用を可能にするためのキュレートされたシーングラフニューラルネットワーク,(3)任意にメッセージを送信する代わりにシーンナレッジグラフを考案し,様々な種類の道路ゲノムと先行知識を区別する。
私たちはtoponetを、難易度の高いシーン理解ベンチマークであるopenlane-v2で評価しています。
コードはすぐにリリースされるだろう。
関連論文リスト
- Monocular Lane Detection Based on Deep Learning: A Survey [51.19079381823076]
車線検出は自律運転認識システムにおいて重要な役割を果たす。
ディープラーニングアルゴリズムが普及するにつれて、ディープラーニングに基づく単眼車線検出手法が優れた性能を示した。
本稿では, 成熟度の高い2次元車線検出手法と開発途上国の3次元車線検出技術の両方を網羅して, 既存手法の概要を概説する。
論文 参考訳(メタデータ) (2024-11-25T12:09:43Z) - LaneSegNet: Map Learning with Lane Segment Perception for Autonomous
Driving [60.55208681215818]
道路構造の完全な表現を得るために,レーンセグメントを生成する最初のエンドツーエンドマッピングネットワークであるLaneSegNetを紹介した。
提案アルゴリズムは2つの重要な修正点を特徴としている。1つは、長距離特徴空間内の重要な領域の詳細をキャプチャするレーンアテンションモジュールである。
OpenLane-V2データセットでは、LaneSegNetは3つのタスクにまたがって大幅に向上している。
論文 参考訳(メタデータ) (2023-12-26T16:22:10Z) - TopoMask: Instance-Mask-Based Formulation for the Road Topology Problem
via Transformer-Based Architecture [4.970364068620607]
道路トポロジにおける中心線予測のためのTopoMaskを紹介する。
TopoMaskはOpenLane-V2スコア(OLS)で4位、OpenLane Topology Challenge 2023ではF1スコアで2位にランクインしている。
論文 参考訳(メタデータ) (2023-06-08T17:58:57Z) - OpenLane-V2: A Topology Reasoning Benchmark for Unified 3D HD Mapping [84.65114565766596]
交通シーン構造を考慮したトポロジ推論のための最初のデータセットであるOpenLane-V2を提案する。
OpenLane-V2は2000のアノテートされた道路シーンで構成され、交通要素と車線との関係を記述している。
様々な最先端手法を評価し,OpenLane-V2の定量的,定性的な結果を示し,交通現場におけるトポロジ推論の今後の道筋を示す。
論文 参考訳(メタデータ) (2023-04-20T16:31:22Z) - JPerceiver: Joint Perception Network for Depth, Pose and Layout
Estimation in Driving Scenes [75.20435924081585]
JPerceiverは、モノクロビデオシーケンスからスケール認識深度とVOとBEVレイアウトを同時に推定することができる。
クロスビュー幾何変換(CGT)を利用して、絶対スケールを道路レイアウトから奥行きとVOに伝播させる。
Argoverse、Nuscenes、KITTIの実験は、上記の3つのタスクの全てにおいて、既存のメソッドよりもJPerceiverの方が優れていることを示している。
論文 参考訳(メタデータ) (2022-07-16T10:33:59Z) - DAGMapper: Learning to Map by Discovering Lane Topology [84.12949740822117]
我々は、分岐とマージによるトポロジー変化を含む多くのレーンを持つ複雑な高速道路のレーン境界を描くことに集中する。
グラフのノードがレーン境界の局所領域の幾何学的および位相的特性を符号化する有向非巡回グラフィカルモデル(DAG)における推論として問題を定式化する。
2つの異なる州における2つの幹線道路における我々のアプローチの有効性を示し、高い精度とリコールと89%の正しいトポロジーを示す。
論文 参考訳(メタデータ) (2020-12-22T21:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。