論文の概要: World Engine: Towards the Era of Post-Training for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2606.19836v1
- Date: Thu, 18 Jun 2026 06:28:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.684013
- Title: World Engine: Towards the Era of Post-Training for Autonomous Driving
- Title(参考訳): World Engine: 自動運転のポストトライニングの時代に向けて
- Authors: Tianyu Li, Li Chen, Caojun Wang, Haochen Liu, Kashyap Chitta, Zhenjie Yang, Yuhang Lu, Naisheng Ye, Yihang Qiu, Yufei Wang, Luoxi Zou, Jiaxin Peng, Jin Pan, Zhaoyu Su, Andrei Bursuc, Shengbo Eben Li, Andreas Geiger, Peng Su, Hongyang Li,
- Abstract要約: 実世界のログから高忠実度インタラクティブ環境を再構築する生成フレームワークであるWorld Engineを紹介する。
World Engineは、稀な安全クリティカルなシナリオにおける障害を大幅に削減し、事前トレーニングデータのみをスケールするよりもはるかに大きな利益をもたらす。
プロダクションスケールの自動運転システムにデプロイすると、結果として、シミュレートされた衝突を減らすことができる。
- 参考スコア(独自算出の注目度): 63.61277741443647
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Autonomous vehicles must operate safely in the real world, where errors can have severe consequences. Although modern end-to-end driving policies excel in routine scenarios, their reliability is limited by the scarcity of safety-critical ``long-tail'' events in real driving datasets. These rare interactions define the practical safety boundary of the learned policy, yet they are difficult to collect at scale in the real world. Here we show that this fundamental limitation can be addressed by post-training pre-trained driving models on synthesized high-stakes interactions. We introduce World Engine, a generative framework that reconstructs high-fidelity interactive environments from real-world logs and systematically extrapolates them into realistic safety-critical variations. This paradigm enables reinforcement-based post-training to align policies with safety constraints, circumventing the physical risks inherent in real-world exploration. On a public benchmark built on nuPlan, World Engine substantially reduces failures in rare safety-critical scenarios and yields significantly larger gains than scaling pre-training data alone. Furthermore, when deployed on a production-scale autonomous driving system, the resulting policy reduces simulated collisions and demonstrates measurable improvements in on-road testing, showing that post-training on synthesized, safety-critical interactions offers a scalable and effective pathway to safer autonomous driving. The full codebase suite, including training, is released to the public.
- Abstract(参考訳): 自動運転車は、エラーが深刻な結果をもたらす現実世界で安全に運用する必要がある。
現代のエンドツーエンドの運転ポリシーは、日常的なシナリオでは優れているが、その信頼性は、実際の運転データセットにおける安全クリティカルな‘long-tail’イベントの不足によって制限されている。
これらの稀な相互作用は、学習されたポリシーの実践的な安全性境界を定義するが、現実の世界で大規模に収集することは困難である。
ここでは、この基本的制限は、合成されたハイテイク相互作用における事前学習駆動モデルにより対処可能であることを示す。
我々は、実世界のログから高忠実な対話環境を再構築し、それらを現実的な安全クリティカルなバリエーションに体系的に外挿する生成フレームワークであるWorld Engineを紹介した。
このパラダイムにより、強化ベースのポストトレーニングにより、政策を安全性の制約と整合させ、現実世界の探査に固有の物理的リスクを回避することができる。
nuPlan上に構築された公開ベンチマークでは、World Engineは、希少なセーフティクリティカルなシナリオにおける障害を大幅に削減し、事前トレーニングデータのみをスケールするよりもはるかに大きなゲインをもたらす。
さらに、プロダクションスケールの自律運転システムにデプロイすると、結果としてシミュレートされた衝突が減少し、オンロードテストにおける測定可能な改善が示され、合成された安全クリティカルな相互作用のポストトレーニングが、自律運転を安全にするためのスケーラブルで効果的な経路を提供することを示した。
トレーニングを含む完全なコードベーススイートが一般公開されている。
関連論文リスト
- Formal Safety Guarantees for Autonomous Vehicles using Barrier Certificates [0.1019561860229868]
この研究は、コネクテッド・アンド・オートマチック・ビークルズのための公式に認証された安全フレームワークを開発する。
Barrier(BC)と解釈可能なトラフィック競合メトリクス、特に時間対時間安全メトリクスを統合している。
このアプローチは、解釈可能な安全保証と証明可能な安全保証の両方を提供し、安全な自動運転のための実用的でスケーラブルな戦略を実証する。
論文 参考訳(メタデータ) (2026-01-08T19:44:13Z) - AD-R1: Closed-Loop Reinforcement Learning for End-to-End Autonomous Driving with Impartial World Models [75.214287449744]
我々は,Impartial World Modelを中心に構築されたポストトレーニング政策改善のためのフレームワークを紹介する。
私たちの主な貢献は、このモデルに危険について正直であることを教えることです。
大規模な実験を通じて、我々のモデルは失敗を予測する上で、ベースラインを著しく上回っていることを実証する。
論文 参考訳(メタデータ) (2025-11-25T13:57:24Z) - Ethics-Aware Safe Reinforcement Learning for Rare-Event Risk Control in Interactive Urban Driving [1.2891210250935148]
倫理に配慮したコスト信号で標準駆動目標を増強する階層型セーフ強化学習フレームワークを提案する。
衝突確率と有害度を組み合わせた複合的倫理的リスクコストを用いて安全なRLエージェントを訓練し、高レベルな運動目標を生成する。
動的でリスクに敏感な優先順位付けエクスペリエンスメカニズムは、まれだがクリティカルでリスクの高いイベントからの学習を増幅する。
論文 参考訳(メタデータ) (2025-08-19T14:24:02Z) - Enhancing Autonomous Driving Safety with Collision Scenario Integration [36.83682052117178]
衝突データから学習するためのトレーニングフレームワークであるSafeFusionを提案する。
SafeFusionは、模倣学習を過度に検討する代わりに、トレーニング中に安全指向のメトリクスを統合して、衝突回避学習を可能にする。
また、多様な高品質なシナリオを生成するスケーラブルなデータ生成パイプラインであるCollisionGenを提案する。
論文 参考訳(メタデータ) (2025-03-05T23:08:43Z) - ReGentS: Real-World Safety-Critical Driving Scenario Generation Made Stable [88.08120417169971]
機械学習に基づく自律運転システムは、現実世界のデータでは稀な安全クリティカルなシナリオで課題に直面していることが多い。
この研究は、軌道最適化によって複雑な現実世界の通常のシナリオを変更することによって、安全クリティカルな運転シナリオを生成することを検討する。
提案手法は、頑健なプランナーの訓練には役に立たない非現実的な発散軌道と避けられない衝突シナリオに対処する。
論文 参考訳(メタデータ) (2024-09-12T08:26:33Z) - RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。
提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文 参考訳(メタデータ) (2024-05-07T23:32:36Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Safety-aware Causal Representation for Trustworthy Offline Reinforcement
Learning in Autonomous Driving [33.672722472758636]
オフライン強化学習(RL)アプローチは、オフラインデータセットからのシーケンシャルな意思決定問題に対処する上で、顕著な効果を示す。
一般化可能なエンドツーエンド駆動ポリシの学習を容易にするために,saFety-aware strUctured Scenario representation (Fusion)を導入した。
様々な運転シナリオにおける実証的な証拠は、フュージョンが自律運転エージェントの安全性と一般化性を著しく向上させることを証明している。
論文 参考訳(メタデータ) (2023-10-31T18:21:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。