論文の概要: RAPiD: Real-time Deterministic Trajectory Planning via Diffusion Behavior Priors for Safe and Efficient Autonomous Driving
- arxiv url: http://arxiv.org/abs/2602.07339v1
- Date: Sat, 07 Feb 2026 03:44:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.574127
- Title: RAPiD: Real-time Deterministic Trajectory Planning via Diffusion Behavior Priors for Safe and Efficient Autonomous Driving
- Title(参考訳): RAPiD: 安全かつ効率的な自律運転に先立つ拡散行動によるリアルタイム決定論的軌道計画
- Authors: Ruturaj Reddy, Hrishav Bakul Barua, Junn Yong Loo, Thanh Thi Nguyen, Ganesh Krishnasamy,
- Abstract要約: RAPiDは、事前訓練された拡散型プランナーを効率的なポリシーに蒸留する決定論的政策抽出フレームワークである。
安全と乗客の快適性を促進するため、予測ドライバコントローラを模倣するように訓練された評論家を用いてポリシーを最適化する。
- 参考スコア(独自算出の注目度): 5.030754278104693
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion-based trajectory planners have demonstrated strong capability for modeling the multimodal nature of human driving behavior, but their reliance on iterative stochastic sampling poses critical challenges for real-time, safety-critical deployment. In this work, we present RAPiD, a deterministic policy extraction framework that distills a pretrained diffusion-based planner into an efficient policy while eliminating diffusion sampling. Using score-regularized policy optimization, we leverage the score function of a pre-trained diffusion planner as a behavior prior to regularize policy learning. To promote safety and passenger comfort, the policy is optimized using a critic trained to imitate a predictive driver controller, providing dense, safety-focused supervision beyond conventional imitation learning. Evaluations demonstrate that RAPiD achieves competitive performance on closed-loop nuPlan scenarios with an 8x speedup over diffusion baselines, while achieving state-of-the-art generalization among learning-based planners on the interPlan benchmark. The official website of this work is: https://github.com/ruturajreddy/RAPiD.
- Abstract(参考訳): 拡散に基づく軌道プランナーは、人間の運転行動のマルチモーダルな性質をモデル化する強力な能力を示したが、反復的確率的サンプリングへの依存は、リアルタイムで安全な配置にとって重要な課題となっている。
本研究では,拡散サンプリングを排除しつつ,事前学習した拡散プランナを効率的な政策に蒸留する決定論的政策抽出フレームワークであるRAPiDを提案する。
スコア規則化ポリシ最適化を用いて,事前学習した拡散プランナのスコア関数を,ポリシー学習の正規化に先立ち行動として活用する。
安全と乗客の快適性を促進するために、このポリシーは、予測ドライバコントローラを模倣するように訓練された批評家を用いて最適化され、従来の模倣学習以上の、密集した安全に焦点を当てた監視を提供する。
RAPiDは、InterPlanベンチマーク上での学習ベースプランナ間の最先端の一般化を実現しつつ、拡散ベースラインよりも8倍のスピードアップで閉ループのnuPlanシナリオ上での競合性能を実現する。
この研究の公式ウェブサイトは、https://github.com/ruturajreddy/RAPiDである。
関連論文リスト
- TD-JEPA: Latent-predictive Representations for Zero-Shot Reinforcement Learning [63.73629127832652]
本稿では,TDに基づく潜在予測表現を教師なしRLに活用するTD-JEPAを紹介する。
TD-JEPAは、明示的な状態とタスクエンコーダ、ポリシー条件付きマルチステップ予測器、パラメータ化されたポリシーのセットを潜時空間で直接訓練する。
実証的には、TD-JEPAは13のデータセットにわたる移動、ナビゲーション、操作のタスクにおいて、最先端のベースラインをマッチまたは上回る。
論文 参考訳(メタデータ) (2025-10-01T10:21:18Z) - DriveDPO: Policy Learning via Safety DPO For End-to-End Autonomous Driving [31.336758241051374]
DriveDPOは、安全指向最適化政策学習フレームワークである。
我々は、直接政策最適化のために、人間の模倣類似性とルールに基づく安全スコアから統一されたポリシー分布を蒸留する。
NAVSIMベンチマークの実験では、DriveDPOは90.0の最先端PDMSを達成した。
論文 参考訳(メタデータ) (2025-09-22T16:01:11Z) - Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling [74.41886258801209]
本稿では,行動学習から原理的アライメントを分離する2段階の軌道計画フレームワークを提案する。
Plan-R1は計画の安全性と実現可能性を大幅に改善し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2025-05-23T09:22:19Z) - Diffusion-Based Planning for Autonomous Driving with Flexible Guidance [19.204115959760788]
閉ループ計画のための新しい変圧器ベース拡散プランナを提案する。
本モデルは,予測タスクと計画タスクの協調モデリングを支援する。
様々な運転スタイルで頑健な伝達性を持つ最先端の閉ループ性能を実現する。
論文 参考訳(メタデータ) (2025-01-26T15:49:50Z) - Integration of Reinforcement Learning Based Behavior Planning With
Sampling Based Motion Planning for Automated Driving [0.5801044612920815]
本研究では,高度行動計画のための訓練された深層強化学習ポリシーを用いる方法を提案する。
私たちの知る限りでは、この研究は、この方法で深層強化学習を適用した最初のものである。
論文 参考訳(メタデータ) (2023-04-17T13:49:55Z) - Diffusion Policies as an Expressive Policy Class for Offline
Reinforcement Learning [70.20191211010847]
オフライン強化学習(RL)は、以前に収集した静的データセットを使って最適なポリシーを学ぶことを目的としている。
本稿では,条件付き拡散モデルを用いたディフュージョンQ-ラーニング(Diffusion-QL)を提案する。
本手法はD4RLベンチマークタスクの大部分において最先端の性能を実現することができることを示す。
論文 参考訳(メタデータ) (2022-08-12T09:54:11Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。