論文の概要: Perception Helps Planning: Facilitating Multi-Stage Lane-Level Integration via Double-Edge Structures
- arxiv url: http://arxiv.org/abs/2407.11644v2
- Date: Mon, 09 Dec 2024 13:09:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-10 14:48:02.356741
- Title: Perception Helps Planning: Facilitating Multi-Stage Lane-Level Integration via Double-Edge Structures
- Title(参考訳): パーセプションは計画を支援する: 二重エッジ構造によるマルチステージレーン・レベル統合の実現
- Authors: Guoliang You, Xiaomeng Chu, Yifan Duan, Wenyu Zhang, Xingchen Li, Sha Zhang, Yao Li, Jianmin Ji, Yanyong Zhang,
- Abstract要約: Perception Helps Planning (PHP) はレーンレベルのプランニングを知覚で調整する。
3つのCarlaベンチマークの実験では、既存のアルゴリズムよりも27.20%、33.47%、および15.54%のドライブスコアが大幅に改善された。
- 参考スコア(独自算出の注目度): 13.648498083189931
- License:
- Abstract: When planning for autonomous driving, it is crucial to consider essential traffic elements such as lanes, intersections, traffic regulations, and dynamic agents. However, they are often overlooked by the traditional end-to-end planning methods, likely leading to inefficiencies and non-compliance with traffic regulations. In this work, we endeavor to integrate the perception of these elements into the planning task. To this end, we propose Perception Helps Planning (PHP), a novel framework that reconciles lane-level planning with perception. This integration ensures that planning is inherently aligned with traffic constraints, thus facilitating safe and efficient driving. Specifically, PHP focuses on both edges of a lane for planning and perception purposes, taking into consideration the 3D positions of both lane edges and attributes for lane intersections, lane directions, lane occupancy, and planning. In the algorithmic design, the process begins with the transformer encoding multi-camera images to extract the above features and predicting lane-level perception results. Next, the hierarchical feature early fusion module refines the features for predicting planning attributes. Finally, the double-edge interpreter utilizes a late-fusion process specifically designed to integrate lane-level perception and planning information, culminating in the generation of vehicle control signals. Experiments on three Carla benchmarks show significant improvements in driving score of 27.20%, 33.47%, and 15.54% over existing algorithms, respectively, achieving the state-of-the-art performance, with the system operating up to 22.57 FPS.
- Abstract(参考訳): 自動運転の計画においては、車線、交差点、交通規制、ダイナミックエージェントといった重要な交通要素を検討することが不可欠である。
しかし、それらは従来のエンドツーエンドの計画手法によって見落とされ、おそらく非効率性や交通規制の遵守につながる。
本研究は,これらの要素の認識を計画課題に統合する試みである。
そこで我々は,車線レベルの計画と知覚を調和させる新しいフレームワークであるPerception Helps Planning (PHP)を提案する。
この統合により、計画が本質的にトラフィックの制約に一致していることが保証され、安全で効率的な運転が容易になる。
特に、PHPは、車線交差点、車線方向、車線占有率、計画について、車線エッジと属性の双方の3D位置を考慮して、計画と知覚のために車線の両端に焦点を当てている。
アルゴリズム設計では、マルチカメラ画像を符号化して上記の特徴を抽出し、レーンレベルの知覚結果を予測する。
次に、階層的な早期融合モジュールは、計画属性を予測する機能を洗練します。
最後に、両端インタプリタは、車線レベルの認識と計画情報を統合するために特別に設計されたレイトフュージョンプロセスを利用して、車両制御信号を生成する。
3つのCarlaベンチマークの実験では、既存のアルゴリズムよりも27.20%、33.47%、15.54%の駆動スコアが大幅に改善され、最新性能が22.57 FPSまで向上した。
関連論文リスト
- DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - SparseDrive: End-to-End Autonomous Driving via Sparse Scene Representation [11.011219709863875]
我々はSparseDriveという新しいエンドツーエンドの自動運転パラダイムを提案する。
SparseDriveは対称なスパース認識モジュールとパラレルモーションプランナーで構成されている。
動作予測と計画について,これら2つの課題の相似性を概観し,運動プランナの並列設計に繋がる。
論文 参考訳(メタデータ) (2024-05-30T02:13:56Z) - Graph-based Topology Reasoning for Driving Scenes [102.35885039110057]
TopoNetは、従来の知覚タスクを超えてトラフィック知識を抽象化できる最初のエンドツーエンドフレームワークである。
TopoNetを,難解なシーン理解ベンチマークOpenLane-V2で評価した。
論文 参考訳(メタデータ) (2023-04-11T15:23:29Z) - PlanT: Explainable Planning Transformers via Object-Level
Representations [64.93938686101309]
PlanTは、自動運転のコンテキストにおける計画のための新しいアプローチである。
PlanTは、コンパクトなオブジェクトレベルの入力表現を持つ模倣学習に基づいている。
この結果から,PlanTは幾何学的に距離をおいても,現場で最も関連性の高い物体に焦点を合わせることが可能であることが示唆された。
論文 参考訳(メタデータ) (2022-10-25T17:59:46Z) - ST-P3: End-to-end Vision-based Autonomous Driving via Spatial-Temporal
Feature Learning [132.20119288212376]
本稿では,認識,予測,計画タスクを同時に行うための,より代表的な特徴の集合に対する時空間的特徴学習手法を提案する。
私たちの知識を最大限に活用するために、私たちは、解釈可能なエンドツーエンドの自動運転システムの各部分を体系的に調査した最初の人です。
論文 参考訳(メタデータ) (2022-07-15T16:57:43Z) - Cooperative Behavioral Planning for Automated Driving using Graph Neural
Networks [0.5801044612920815]
本研究は,複数の車両を共同で計画することで,都市交差点における交通流の最適化に機械学習アルゴリズムを活用することを提案する。
学習に基づく行動計画にはいくつかの課題が伴い、適切な入力と出力の表現と大量の基幹データを要求する。
自動運転における意思決定のためのオープンソースのシミュレーション環境において,提案手法を訓練し,評価する。
論文 参考訳(メタデータ) (2022-02-23T09:36:15Z) - Deep Structured Reactive Planning [94.92994828905984]
自動運転のための新しいデータ駆動型リアクティブ計画目標を提案する。
本モデルは,非常に複雑な操作を成功させる上で,非反応性変種よりも優れることを示す。
論文 参考訳(メタデータ) (2021-01-18T01:43:36Z) - Extracting the fundamental diagram from aerial footage [6.780998887296333]
効率的な交通監視は,交通ネットワークにおける渋滞対策に不可欠な役割を担っている。
本稿では,ドローンプラットフォームから得られた空中映像から基本図を得るための革新的な手法を考案する。
提案手法は, 車両検出, 車両追跡, 交通状態推定の3段階からなる。
論文 参考訳(メタデータ) (2020-07-07T06:34:50Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。