論文の概要: PlanT 2.0: Exposing Biases and Structural Flaws in Closed-Loop Driving
- arxiv url: http://arxiv.org/abs/2511.07292v1
- Date: Mon, 10 Nov 2025 16:41:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:45.373485
- Title: PlanT 2.0: Exposing Biases and Structural Flaws in Closed-Loop Driving
- Title(参考訳): PlanT 2.0: クローズドループ運転時の自転車と構造欠陥の暴露
- Authors: Simon Gerstenecker, Andreas Geiger, Katrin Renz,
- Abstract要約: 我々は、CARLAにおける自律運転研究用に設計された軽量でオブジェクト中心の計画変換器PlanTを紹介する。
CARLA Leaderboard 2.0が新たに導入したシナリオに対処するため、PlanTに複数のアップグレードを導入しました。
私たちは、よりリッチで堅牢でバイアスの少ないデータセットに焦点を当てた、データ中心の開発へのシフトを主張します。
- 参考スコア(独自算出の注目度): 24.431701691830046
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most recent work in autonomous driving has prioritized benchmark performance and methodological innovation over in-depth analysis of model failures, biases, and shortcut learning. This has led to incremental improvements without a deep understanding of the current failures. While it is straightforward to look at situations where the model fails, it is hard to understand the underlying reason. This motivates us to conduct a systematic study, where inputs to the model are perturbed and the predictions observed. We introduce PlanT 2.0, a lightweight, object-centric planning transformer designed for autonomous driving research in CARLA. The object-level representation enables controlled analysis, as the input can be easily perturbed (e.g., by changing the location or adding or removing certain objects), in contrast to sensor-based models. To tackle the scenarios newly introduced by the challenging CARLA Leaderboard 2.0, we introduce multiple upgrades to PlanT, achieving state-of-the-art performance on Longest6 v2, Bench2Drive, and the CARLA validation routes. Our analysis exposes insightful failures, such as a lack of scene understanding caused by low obstacle diversity, rigid expert behaviors leading to exploitable shortcuts, and overfitting to a fixed set of expert trajectories. Based on these findings, we argue for a shift toward data-centric development, with a focus on richer, more robust, and less biased datasets. We open-source our code and model at https://github.com/autonomousvision/plant2.
- Abstract(参考訳): 自動運転に関する最近の研究は、モデル障害、バイアス、ショートカット学習の詳細な分析よりも、ベンチマークのパフォーマンスと方法論的な革新を優先している。
これにより、現在の失敗を深く理解することなく、漸進的な改善が行われた。
モデルが失敗する状況を見るのは簡単ですが、根底にある理由を理解するのは難しいのです。
このことは、モデルへの入力が摂動し、予測が観察される、体系的な研究を行うことを動機付けます。
我々は、CARLAにおける自律運転研究用に設計された軽量でオブジェクト中心の計画変換器PlanT 2.0を紹介する。
オブジェクトレベルの表現は、センサーベースのモデルとは対照的に、入力が容易に摂動できる(例えば、位置を変更したり、特定のオブジェクトを追加したり、削除したりすることで)ため、制御された解析を可能にする。
CARLA Leaderboard 2.0で新たに導入されたシナリオに対処するため、PlanTに複数のアップグレードを導入し、Longest6 v2、Bench2Drive、CARLAバリデーションルートで最先端のパフォーマンスを実現した。
我々の分析では、障害物の多様性の低さによるシーン理解の欠如、悪用可能なショートカットにつながる厳格な専門家行動、固定された専門家軌道への過度な適合など、洞察に富んだ失敗が露呈している。
これらの結果に基づいて、よりリッチで堅牢でバイアスの少ないデータセットに焦点を当てた、データ中心の開発へのシフトを議論する。
コードとモデルはhttps://github.com/autonomousvision/plant2.comで公開しています。
関連論文リスト
- ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - Real-Time Model Checking for Closed-Loop Robot Reactive Planning [0.0]
本稿では,実自律ロボットにおいて,リアルタイムなマルチステップ計画と障害物回避を実現するモデル検査の新たな応用を提案する。
我々は,生物エージェントに見られる「中核的」知識と注意に基づいて,その場で計画を生成する,小型で汎用的なモデル検査アルゴリズムを開発した。
当社のアプローチは, 局所環境の障害に対処するために発生する一時制御系をチェーン化することに基づいている。
論文 参考訳(メタデータ) (2025-08-26T16:49:30Z) - Real-Time Anomaly Detection and Reactive Planning with Large Language Models [18.57162998677491]
例えば、大規模な言語モデル(LLM)は、インターネットスケールのデータに基づいて訓練され、ゼロショット機能を持つ。
本稿では,潜在的な異常に関する判断を安全な制御フレームワークに組み込む2段階の推論フレームワークを提案する。
これにより、モニターは、四輪車や自動運転車のような動的ロボットシステムの信頼性を向上させることができる。
論文 参考訳(メタデータ) (2024-07-11T17:59:22Z) - DeTra: A Unified Model for Object Detection and Trajectory Forecasting [68.85128937305697]
提案手法は,2つのタスクの結合を軌道修正問題として定式化する。
この統合タスクに対処するために、オブジェクトの存在, ポーズ, マルチモーダルな将来の振る舞いを推測する精細化変換器を設計する。
実験では、我々のモデルはArgoverse 2 Sensor and Openデータセットの最先端性よりも優れています。
論文 参考訳(メタデータ) (2024-06-06T18:12:04Z) - A Reliable Framework for Human-in-the-Loop Anomaly Detection in Time Series [17.08674819906415]
HILADは、人間とAIの動的かつ双方向なコラボレーションを促進するために設計された、新しいフレームワークである。
ビジュアルインターフェースを通じて、HILADはドメインの専門家に、大規模な予期せぬモデルの振る舞いを検出し、解釈し、修正する権限を与えます。
論文 参考訳(メタデータ) (2024-05-06T07:44:07Z) - Is Ego Status All You Need for Open-Loop End-to-End Autonomous Driving? [84.17711168595311]
エンドツーエンドの自動運転は、フルスタックの観点から自律性を目標とする、有望な研究の方向性として浮上している。
比較的単純な駆動シナリオを特徴とするnuScenesデータセットは、エンド・ツー・エンド・モデルにおける知覚情報の未使用化につながる。
予測軌跡が道路に付着するかどうかを評価するための新しい指標を提案する。
論文 参考訳(メタデータ) (2023-12-05T11:32:31Z) - Rethinking the Open-Loop Evaluation of End-to-End Autonomous Driving in
nuScenes [38.43491956142818]
計画課題は、内部意図と外部環境の両方からの入力に基づいて、エゴ車両の軌道を予測することである。
既存の研究の多くは、予測された軌道と地上の真実との衝突率とL2誤差を用いて、nuScenesデータセット上での性能を評価する。
本稿では,これらの既存の評価指標を再評価し,異なる手法の優越性を正確に測定するかどうかを検討する。
我々の単純な手法は、nuScenesデータセットと他の知覚に基づく手法と同じようなエンド・ツー・エンドの計画性能を実現し、平均L2誤差を約20%削減する。
論文 参考訳(メタデータ) (2023-05-17T17:59:11Z) - DiffStack: A Differentiable and Modular Control Stack for Autonomous
Vehicles [75.43355868143209]
DiffStackは、予測、計画、制御のための、微分可能でモジュラーなスタックです。
nuScenesデータセットの結果から,DiffStackによるエンドツーエンドトレーニングは,オープンループおよびクローズループ計画の指標を大幅に改善することが示された。
論文 参考訳(メタデータ) (2022-12-13T09:05:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。