論文の概要: SparseDriveV2: Scoring is All You Need for End-to-End Autonomous Driving
- arxiv url: http://arxiv.org/abs/2603.29163v1
- Date: Tue, 31 Mar 2026 02:20:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.043209
- Title: SparseDriveV2: Scoring is All You Need for End-to-End Autonomous Driving
- Title(参考訳): SparseDriveV2: エンド・ツー・エンドの自動運転に必要なのはスコーリングだけ
- Authors: Wenchao Sun, Xuewu Lin, Keyu Chen, Zixiang Pei, Xiang Li, Yining Shi, Sifa Zheng,
- Abstract要約: SparseDriveV2を開発した。
SparseDriveV2 は NAVSIM 上で 92.0 PDMS と 90.1 PDMS を達成する。
- 参考スコア(独自算出の注目度): 12.665877773318265
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end multi-modal planning has been widely adopted to model the uncertainty of driving behavior, typically by scoring candidate trajectories and selecting the optimal one. Existing approaches generally fall into two categories: scoring a large static trajectory vocabulary, or scoring a small set of dynamically generated proposals. While static vocabularies often suffer from coarse discretization of the action space, dynamic proposals provide finer-grained precision and have shown stronger empirical performance on existing benchmarks. However, it remains unclear whether dynamic generation is fundamentally necessary, or whether static vocabularies can already achieve comparable performance when they are sufficiently dense to cover the action space. In this work, we start with a systematic scaling study of Hydra-MDP, a representative scoring-based method, revealing that performance consistently improves as trajectory anchors become denser, without exhibiting saturation before computational constraints are reached. Motivated by this observation, we propose SparseDriveV2 to push the performance boundary of scoring-based planning through two complementary innovations: (1) a scalable vocabulary representation with a factorized structure that decomposes trajectories into geometric paths and velocity profiles, enabling combinatorial coverage of the action space, and (2) a scalable scoring strategy with coarse factorized scoring over paths and velocity profiles followed by fine-grained scoring on a small set of composed trajectories. By combining these two techniques, SparseDriveV2 achieves 92.0 PDMS and 90.1 EPDMS on NAVSIM, with 89.15 Driving Score and 70.00 Success Rate on Bench2Drive with a lightweight ResNet-34 as backbone. Code and model are released at https://github.com/swc-17/SparseDriveV2.
- Abstract(参考訳): エンド・ツー・エンドのマルチモーダル・プランニングは、運転行動の不確実性をモデル化するために広く採用されている。
既存のアプローチは一般に2つのカテゴリに分類される: 大きな静的軌跡ボキャブラリのスコア、あるいは動的に生成された提案の小さなセットのスコアである。
静的語彙はしばしばアクション空間の粗い離散化に悩まされるが、動的提案はよりきめ細かい精度を提供し、既存のベンチマークではより強い経験的性能を示している。
しかし、動的生成が根本的に必要かどうか、あるいは静的語彙が作用空間をカバーするのに十分な密度を持つ場合に既に同等の性能を達成できるかどうかは不明である。
本研究は, 代表的なスコアリング法であるHydra-MDPの系統的スケールスタディから始め, 計算制約に達する前に飽和を示さずに, 軌道アンカーの密度が高くなるにつれて, 連続的に性能が向上することを明らかにする。
本研究の目的は,(1) 軌跡を幾何学的経路と速度プロファイルに分解し,行動空間の組合せ的カバレッジを実現する因子構造を持つスケーラブルな語彙表現,(2) 経路と速度プロファイルに対する粗い因子化スコアを用いたスケーラブルなスコアリング戦略,および、構成された軌跡の小さな集合に対する微粒化スコアリングである。
これらの2つの技術を組み合わせることで、SparseDriveV2はNAVSIM上の92.0 PDMSと90.1 EPDMSを達成し、89.15 Driving Scoreと70.00 Success Rate on Bench2Driveと軽量のResNet-34をバックボーンとする。
コードとモデルはhttps://github.com/swc-17/SparseDriveV2.comで公開されている。
関連論文リスト
- A Unified Candidate Set with Scene-Adaptive Refinement via Diffusion for End-to-End Autonomous Driving [11.096777574777406]
固定軌跡語彙は、定期運転において安定したカバレッジを提供するが、しばしば複雑な相互作用において最適解を見逃す。
そこで我々は,CdDriveを提案する。このCdDriveは,元の語彙候補を保存し,語彙条件付き拡散復調によって生成されたシーン適応型候補を付加する。
どちらの候補も共有選択モジュールによって共同でスコア付けされ、ルーチンと高度にインタラクティブなシナリオで信頼性の高いパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-02-03T05:14:08Z) - Scaling Up Occupancy-centric Driving Scene Generation: Dataset and Method [54.461213497603154]
作業中心の手法は、最近、フレームとモダリティをまたいだ一貫した条件付けを提供することで、最先端の結果を得た。
Nuplan-Occは、広く使われているNuplanベンチマークから構築された、これまでで最大の占有率データセットである。
高品質な占有、多視点ビデオ、LiDAR点雲を共同で合成する統合フレームワークを開発した。
論文 参考訳(メタデータ) (2025-10-27T03:52:45Z) - Generalized Trajectory Scoring for End-to-end Multimodal Planning [42.38746285135693]
Generalized Trajectory Scoring (GTRS)は、エンドツーエンドのマルチモーダル計画のための統合フレームワークである。
GTRSは,(1)多種多様な微細な提案を生成する拡散型軌跡生成装置,(2)高密度軌跡集合のスコアラをドロップアウト正規化で訓練する語彙一般化技術,(3)ドメイン外一般化を強化するセンサ増強戦略の3つの相補的なイノベーションで構成されている。
ナブシムv2チャレンジの勝利解として、GTRSは準最適センサ入力においても優れた性能を示す。
論文 参考訳(メタデータ) (2025-06-07T05:06:05Z) - A Framework for Learning Scoring Rules in Autonomous Driving Planning Systems [2.4578723416255754]
FLoRAは、時間論理で表される解釈可能なスコアリングルールを学ぶフレームワークである。
本手法は,学習データに肯定的な例しか含まれていないにもかかわらず,運転行動の評価を効果的に学習する。
クローズドループ計画シミュレーションの評価は、学習したスコアリングルールが既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-02-17T02:06:57Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - Exploring Dynamic Transformer for Efficient Object Tracking [58.120191254379854]
効率的なトラッキングのための動的トランスフォーマーフレームワークであるDyTrackを提案する。
DyTrackは、様々な入力に対して適切な推論ルートを設定することを学習し、利用可能な計算予算をより活用する。
複数のベンチマークの実験では、DyTrackは単一のモデルで有望な速度精度のトレードオフを実現している。
論文 参考訳(メタデータ) (2024-03-26T12:31:58Z) - VAD: Vectorized Scene Representation for Efficient Autonomous Driving [44.070636456960045]
VADは、自動運転のためのエンドツーエンドのベクトル化パラダイムである。
VADはベクトル化されたエージェントの動きを利用し、要素を明示的なインスタンスレベルの計画制約としてマップする。
VADは従来のエンドツーエンドの計画手法よりもはるかに高速に動作します。
論文 参考訳(メタデータ) (2023-03-21T17:59:22Z) - Joint Feature Learning and Relation Modeling for Tracking: A One-Stream
Framework [76.70603443624012]
特徴学習と関係モデリングを統合した新しい一ストリーム追跡(OSTrack)フレームワークを提案する。
このようにして、相互誘導により識別的目標指向特徴を動的に抽出することができる。
OSTrackは、複数のベンチマークで最先端のパフォーマンスを実現しており、特に、ワンショットトラッキングベンチマークのGOT-10kでは印象的な結果を示している。
論文 参考訳(メタデータ) (2022-03-22T18:37:11Z) - LiDAR-based Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
LiDARベースのパノプティカルセグメンテーションは、オブジェクトとシーンを統一的に解析することを目的としている。
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,現在の最先端手法よりも優れた精度を実現する。
論文 参考訳(メタデータ) (2020-11-24T08:44:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。