Fugu-MT 論文翻訳(概要): Fail2Drive: Benchmarking Closed-Loop Driving Generalization

論文の概要: Fail2Drive: Benchmarking Closed-Loop Driving Generalization

arxiv url: http://arxiv.org/abs/2604.08535v1
Date: Thu, 09 Apr 2026 17:59:18 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-10 18:34:06.072288
Title: Fail2Drive: Benchmarking Closed-Loop Driving Generalization
Title（参考訳）: Fail2Drive: クローズドループ駆動の一般化のベンチマーク
Authors: Simon Gerstenecker, Andreas Geiger, Katrin Renz,
Abstract要約: Fail2Driveは、CARLAで一般化された最初のペアルートベンチマークである。各シフトした経路は、分配されていない経路と一致し、シフトの効果を分離し、定性的障害を診断に変換する。我々の分析では、LiDARではっきりと見える物体を無視したり、自由空間と占有空間の基本的な概念を学べなかったり、予期せぬ失敗モードを明らかにした。
参考スコア（独自算出の注目度）: 24.431701691830046
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generalization under distribution shift remains a central bottleneck for closed-loop autonomous driving. Although simulators like CARLA enable safe and scalable testing, existing benchmarks rarely measure true generalization: they typically reuse training scenarios at test time. Success can therefore reflect memorization rather than robust driving behavior. We introduce Fail2Drive, the first paired-route benchmark for closed-loop generalization in CARLA, with 200 routes and 17 new scenario classes spanning appearance, layout, behavioral, and robustness shifts. Each shifted route is matched with an in-distribution counterpart, isolating the effect of the shift and turning qualitative failures into quantitative diagnostics. Evaluating multiple state-of-the-art models reveals consistent degradation, with an average success-rate drop of 22.8\%. Our analysis uncovers unexpected failure modes, such as ignoring objects clearly visible in the LiDAR and failing to learn the fundamental concepts of free and occupied space. To accelerate follow-up work, Fail2Drive includes an open-source toolbox for creating new scenarios and validating solvability via a privileged expert policy. Together, these components establish a reproducible foundation for benchmarking and improving closed-loop driving generalization. We open-source all code, data, and tools at https://github.com/autonomousvision/fail2drive .
Abstract（参考訳）: 流通シフト下の一般化は、クローズドループ自動運転における中心的なボトルネックである。 CARLAのようなシミュレーターは安全でスケーラブルなテストを可能にするが、既存のベンチマークが真の一般化を測定することは滅多にない。したがって、成功は堅牢な運転行動よりも記憶を反映することができる。我々は、CARLAでクローズドループの一般化のための最初のペアルートベンチマークであるFail2Driveを紹介し、外観、レイアウト、振る舞い、ロバストさのシフトにまたがる200のルートと17の新しいシナリオクラスを紹介した。各シフトした経路は、分配しない経路と一致し、シフトの効果を分離し、定性的故障を定量的診断に変換する。複数の最先端モデルを評価すると、平均成功率22.8\%の低下が一貫した劣化を示す。我々の分析では、LiDARではっきりと見える物体を無視したり、自由空間と占有空間の基本的な概念を学べなかったり、予期せぬ失敗モードを明らかにした。フォローアップ作業を加速するために、Fail2Driveには、新たなシナリオを作成し、特権付き専門家ポリシーを通じて解決可能性を検証するオープンソースツールボックスが含まれている。これらのコンポーネントは共に、クローズドループ駆動の一般化をベンチマークし改善するための再現可能な基盤を確立する。私たちは、すべてのコード、データ、ツールをhttps://github.com/autonomousvision/fail2driveでオープンソースにしています。

論文の概要: Fail2Drive: Benchmarking Closed-Loop Driving Generalization

関連論文リスト