論文の概要: Fail2Drive: Benchmarking Closed-Loop Driving Generalization
- arxiv url: http://arxiv.org/abs/2604.08535v1
- Date: Thu, 09 Apr 2026 17:59:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:06.072288
- Title: Fail2Drive: Benchmarking Closed-Loop Driving Generalization
- Title(参考訳): Fail2Drive: クローズドループ駆動の一般化のベンチマーク
- Authors: Simon Gerstenecker, Andreas Geiger, Katrin Renz,
- Abstract要約: Fail2Driveは、CARLAで一般化された最初のペアルートベンチマークである。
各シフトした経路は、分配されていない経路と一致し、シフトの効果を分離し、定性的障害を診断に変換する。
我々の分析では、LiDARではっきりと見える物体を無視したり、自由空間と占有空間の基本的な概念を学べなかったり、予期せぬ失敗モードを明らかにした。
- 参考スコア(独自算出の注目度): 24.431701691830046
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalization under distribution shift remains a central bottleneck for closed-loop autonomous driving. Although simulators like CARLA enable safe and scalable testing, existing benchmarks rarely measure true generalization: they typically reuse training scenarios at test time. Success can therefore reflect memorization rather than robust driving behavior. We introduce Fail2Drive, the first paired-route benchmark for closed-loop generalization in CARLA, with 200 routes and 17 new scenario classes spanning appearance, layout, behavioral, and robustness shifts. Each shifted route is matched with an in-distribution counterpart, isolating the effect of the shift and turning qualitative failures into quantitative diagnostics. Evaluating multiple state-of-the-art models reveals consistent degradation, with an average success-rate drop of 22.8\%. Our analysis uncovers unexpected failure modes, such as ignoring objects clearly visible in the LiDAR and failing to learn the fundamental concepts of free and occupied space. To accelerate follow-up work, Fail2Drive includes an open-source toolbox for creating new scenarios and validating solvability via a privileged expert policy. Together, these components establish a reproducible foundation for benchmarking and improving closed-loop driving generalization. We open-source all code, data, and tools at https://github.com/autonomousvision/fail2drive .
- Abstract(参考訳): 流通シフト下の一般化は、クローズドループ自動運転における中心的なボトルネックである。
CARLAのようなシミュレーターは安全でスケーラブルなテストを可能にするが、既存のベンチマークが真の一般化を測定することは滅多にない。
したがって、成功は堅牢な運転行動よりも記憶を反映することができる。
我々は、CARLAでクローズドループの一般化のための最初のペアルートベンチマークであるFail2Driveを紹介し、外観、レイアウト、振る舞い、ロバストさのシフトにまたがる200のルートと17の新しいシナリオクラスを紹介した。
各シフトした経路は、分配しない経路と一致し、シフトの効果を分離し、定性的故障を定量的診断に変換する。
複数の最先端モデルを評価すると、平均成功率22.8\%の低下が一貫した劣化を示す。
我々の分析では、LiDARではっきりと見える物体を無視したり、自由空間と占有空間の基本的な概念を学べなかったり、予期せぬ失敗モードを明らかにした。
フォローアップ作業を加速するために、Fail2Driveには、新たなシナリオを作成し、特権付き専門家ポリシーを通じて解決可能性を検証するオープンソースツールボックスが含まれている。
これらのコンポーネントは共に、クローズドループ駆動の一般化をベンチマークし改善するための再現可能な基盤を確立する。
私たちは、すべてのコード、データ、ツールをhttps://github.com/autonomousvision/fail2driveでオープンソースにしています。
関連論文リスト
- Bench2Drive-VL: Benchmarks for Closed-Loop Autonomous Driving with Vision-Language Models [50.22099309218635]
自律運転においては、閉ループ評価はオープンループ評価よりも信頼性の高い検証方法として広く認識されている。
本稿では,VLM駆動における閉ループ評価を実現するBench2Drive-VLについて述べる。
論文 参考訳(メタデータ) (2026-04-01T11:38:46Z) - Misbehavior Forecasting for Focused Autonomous Driving Systems Testing [2.7733556309376692]
既存のバグフィニング技術は信頼性が低いか高価なかのどちらかだ。
本稿では,誤動作予測器を用いて近距離ミスを識別する手法であるForeseeを提案する。
フォアシーは、これまで未知の障害に遭遇した候補者の近辺で、局所的なファジッシングを行う。
論文 参考訳(メタデータ) (2025-12-21T17:17:49Z) - Failure Prediction at Runtime for Generative Robot Policies [6.375597233389154]
実行中の早期の障害予測は、人間中心で安全クリティカルな環境でロボットをデプロイするために不可欠である。
本稿では,フェールデータを必要としない生成ロボットポリシーの故障予測フレームワークであるFIPERを提案する。
その結果、FIPERは実際の障害と良質なOOD状況とをよく区別し、既存の手法よりも正確に早期に障害を予測できることがわかった。
論文 参考訳(メタデータ) (2025-10-10T15:09:27Z) - CoReVLA: A Dual-Stage End-to-End Autonomous Driving Framework for Long-Tail Scenarios via Collect-and-Refine [73.74077186298523]
CoReVLAは、自動運転のための継続的学習フレームワークである。
データコレクションとビヘイビアリファインメントの2段階プロセスを通じて、ロングテールシナリオのパフォーマンスを改善する。
CoReVLAは72.18のドライビングスコア(DS)と50%の成功率(SR)を達成し、7.96DSの最先端手法と15%SRの長期的安全クリティカルシナリオで性能を向上する。
論文 参考訳(メタデータ) (2025-09-19T13:25:56Z) - Bench2Drive: Towards Multi-Ability Benchmarking of Closed-Loop End-To-End Autonomous Driving [59.705635382104454]
本稿では,E2E-ADシステムのマルチ能力をクローズドループで評価するための最初のベンチマークであるBench2Driveを紹介する。
我々は最先端のE2E-ADモデルを実装し、Bench2Driveで評価し、現状と今後の方向性について洞察を提供する。
論文 参考訳(メタデータ) (2024-06-06T09:12:30Z) - Are All Vision Models Created Equal? A Study of the Open-Loop to
Closed-Loop Causality Gap [109.46323960299146]
オープンループからクローズループ因果性ギャップに関する視覚アーキテクチャについて検討する。
適切なトレーニングガイドラインの下では、すべての視覚モデルが分散配置において不明瞭によく機能することを示す。
その結果,現代のネットワークアーキテクチャを用いたトレーニングガイドラインの提案により,因果関係のギャップを解消できることが示唆された。
論文 参考訳(メタデータ) (2022-10-09T16:56:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。