論文の概要: Beyond Imitation: Learning Safe End-to-End Autonomous Driving from Hard Negatives
- arxiv url: http://arxiv.org/abs/2605.19771v1
- Date: Tue, 19 May 2026 12:41:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.334417
- Title: Beyond Imitation: Learning Safe End-to-End Autonomous Driving from Hard Negatives
- Title(参考訳): 安全なエンド・ツー・エンドの自動運転をハードネガティクスから学ぶ
- Authors: Junli Wang, Zhihua Hua, Xueyi Liu, Zebin Xing, Haochen Tian, Kun Ma, Hangjun Ye, Guang Chen, Long Chen, Qichao Zhang,
- Abstract要約: 本研究では,運転動作の成功と失敗から共同で学習する,障害対応の模倣学習フレームワークであるBeyondDriveを提案する。
まず、フローマッチングに基づく負の軌道生成器を導入し、安全クリティカルだが専門家の軌道を合成する。
第2に、モード崩壊を緩和し、多様な障害モードのカバレッジを改善するダイバーシティ対応サンプリング戦略を開発する。
第3に,強い負の軌道から遠ざけながら,専門家によるデモンストレーションに向けての予測を同時に惹きつける「反発距離損失」を提案する。
- 参考スコア(独自算出の注目度): 18.838887346129916
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Existing imitation learning methods for end-to-end autonomous driving predominantly learn from successful demonstrations by minimizing geometric deviations from expert trajectories. This paradigm implicitly assumes that spatial proximity implies behavioral safety, leading to a critical objective mismatch: trajectories with nearly identical imitation losses may exhibit drastically different safety outcomes, where one remains recoverable while the other results in collision. To address this limitation, we propose BeyondDrive, a failure-aware imitation learning framework that jointly learns from successful and failed driving behaviors. First, we introduce a flow matching-based negative trajectory generator that synthesizes safety-critical yet expert-proximate trajectories, enabling explicit modeling of safety asymmetry. Second, we develop a diversity-aware sampling strategy that mitigates mode collapse and improves coverage of diverse failure modes during negative trajectory generation. Third, we propose a Repulsive Distance Loss that simultaneously attracts predictions toward expert demonstrations while repelling them from hard negative trajectories, thereby establishing discriminative safety boundaries in trajectory space. Applied to the uni-modal baseline Latent TransFuser, BeyondDrive achieves 89.7 PDMS on the NAVSIMv1 closed-loop benchmark, outperforming prior state-of-the-art methods. Moreover, BeyondDrive generalizes effectively across different autonomous driving architectures, including multi-modal planners, and further demonstrates strong zero-shot transferability on the HUGSIM benchmark.
- Abstract(参考訳): エンド・ツー・エンドの自動運転のための既存の模倣学習手法は、専門家の軌跡からの幾何学的偏差を最小限に抑えて、成功例から主に学習する。
このパラダイムは、空間的近接が行動の安全性を意味することを暗黙的に仮定し、決定的な客観的なミスマッチをもたらす。
この制限に対処するために、我々はBeyondDriveを提案する。BeyondDriveは、失敗を意識した模倣学習フレームワークで、成功と失敗の運転行動から共同で学習する。
まず、フローマッチングに基づく負の軌道生成器を導入し、安全クリティカルだが専門家の軌道を合成し、安全非対称性の明示的なモデリングを可能にする。
第2に、モード崩壊を緩和し、負の軌道生成時の様々な障害モードのカバレッジを改善する多様性を考慮したサンプリング戦略を開発する。
第三に,強陰性軌道から遠ざけながら,専門家による実証に向けての予測を同時に引き寄せ,軌道空間における識別的安全境界を確立することを提案する。
ユニモーダルベースラインのLatent TransFuserに適用されたBeyondDriveは、NAVSIMv1クローズドループベンチマークで89.7 PDMSを達成した。
さらに、BeyondDriveは、マルチモーダルプランナを含むさまざまな自律走行アーキテクチャを効果的に一般化し、HUGSIMベンチマークで強力なゼロショット転送性を示す。
関連論文リスト
- ADV-0: Closed-Loop Min-Max Adversarial Training for Long-Tail Robustness in Autonomous Driving [63.980630608984605]
本稿では、ゼロサムマルコフゲームとして、駆動ポリシー(ディフェンダー)と敵エージェント(アタックラー)の相互作用を扱うクローズドループのmin-max最適化フレームワークであるADV-0を提案する。
これを実現するため,我々は動的敵の進化を反復的な選好学習とし,この最適性を効率的に近似し,アルゴリズムに依存しない解をゲームに提供する。
実験により、多様な安全クリティカルな障害を効果的に露呈し、学習方針と運動プランナーの両方の一般化可能性を大幅に向上させることが示されている。
論文 参考訳(メタデータ) (2026-03-16T12:58:31Z) - ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。
我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。
本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文 参考訳(メタデータ) (2025-09-24T13:35:15Z) - EvaDrive: Evolutionary Adversarial Policy Optimization for End-to-End Autonomous Driving [17.57364638932072]
EvaDriveは、自動運転のための新しい強化学習フレームワークである。
ヒューマンライクな反復的意思決定のためのクローズドループ対向フレームワークを提供する。
NAVSIMとBench2Driveベンチマークの大規模な実験では、SOTAのパフォーマンスが示されている。
論文 参考訳(メタデータ) (2025-08-05T11:26:28Z) - Breaking Imitation Bottlenecks: Reinforced Diffusion Powers Diverse Trajectory Generation [20.106116218594266]
DIVERは、強化学習と拡散ベースの生成を統合するエンドツーエンドの自動運転フレームワークである。
また,DIVERは軌道の多様性を著しく改善し,模倣学習に固有のモード崩壊問題に効果的に対処することを示した。
論文 参考訳(メタデータ) (2025-07-05T14:19:19Z) - ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving [49.07731497951963]
ReCogDriveは、エンドツーエンドの自動運転のための新しい強化認知フレームワークである。
我々は、人間のドライバーのシーケンシャルな認知過程を模倣する階層的なデータパイプラインを導入する。
次に、VLMの学習した運転先を拡散プランナーに注入することで、言語行動ミスマッチに対処する。
論文 参考訳(メタデータ) (2025-06-09T03:14:04Z) - A Multi-Loss Strategy for Vehicle Trajectory Prediction: Combining Off-Road, Diversity, and Directional Consistency Losses [68.68514648185828]
軌道予測は、自動運転車における計画の安全性と効率に不可欠である。
現在のモデルでは、複雑な交通規則と潜在的な車両の動きを完全に捉えることができないことが多い。
本研究は, オフロード損失, 方向整合誤差, ダイバーシティ損失の3つの新しい損失関数を紹介する。
論文 参考訳(メタデータ) (2024-11-29T14:47:08Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。