論文の概要: Map-World: Masked Action planning and Path-Integral World Model for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2511.20156v1
- Date: Tue, 25 Nov 2025 10:30:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.403502
- Title: Map-World: Masked Action planning and Path-Integral World Model for Autonomous Driving
- Title(参考訳): Map-World: 自律運転のための仮面行動計画と経路内世界モデル
- Authors: Bin Hu, Zijian Lu, Haicheng Liao, Chengran Yuan, Bin Rao, Yongkang Li, Guofa Li, Zhiyong Cui, Cheng-zhong Xu, Zhenning Li,
- Abstract要約: Masked Action Planning (MAP)モジュールは、将来のエゴ運動をマスクされたシーケンス完了として扱う。
軽量世界モデルは、各候補軌道に条件付き将来のBEVセマンティクスをロールアウトする。
NAVSIMでは,提案手法はアンカーベースアプローチと一致し,最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 35.521279875146526
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motion planning for autonomous driving must handle multiple plausible futures while remaining computationally efficient. Recent end-to-end systems and world-model-based planners predict rich multi-modal trajectories, but typically rely on handcrafted anchors or reinforcement learning to select a single best mode for training and control. This selection discards information about alternative futures and complicates optimization. We propose MAP-World, a prior-free multi-modal planning framework that couples masked action planning with a path-weighted world model. The Masked Action Planning (MAP) module treats future ego motion as masked sequence completion: past waypoints are encoded as visible tokens, future waypoints are represented as mask tokens, and a driving-intent path provides a coarse scaffold. A compact latent planning state is expanded into multiple trajectory queries with injected noise, yielding diverse, temporally consistent modes without anchor libraries or teacher policies. A lightweight world model then rolls out future BEV semantics conditioned on each candidate trajectory. During training, semantic losses are computed as an expectation over modes, using trajectory probabilities as discrete path weights, so the planner learns from the full distribution of plausible futures instead of a single selected path. On NAVSIM, our method matches anchor-based approaches and achieves state-of-the-art performance among world-model-based methods, while avoiding reinforcement learning and maintaining real-time inference latency.
- Abstract(参考訳): 自律走行のための運動プランニングは、計算効率を保ちながら、複数の有望な未来を扱う必要がある。
近年のエンド・ツー・エンドシステムとワールド・モデル・ベースのプランナーは、リッチなマルチモーダル・トラジェクトリを予測するが、通常は手作りのアンカーや強化学習に頼り、トレーニングと制御に最適な1つのモードを選択する。
この選択は代替先に関する情報を捨て、最適化を複雑にする。
我々は,経路重み付き世界モデルとマスクされた行動計画とを結合した,事前自由なマルチモーダル計画フレームワークMAP-Worldを提案する。
Masked Action Planning (MAP)モジュールは、将来のエゴ運動をマスク付きシーケンス完了として扱う: 過去ウェイポイントは可視トークンとしてエンコードされ、将来のウェイポイントはマスクトークンとして表現され、ドライブインテントパスは粗い足場を提供する。
コンパクトな潜在計画状態は、注入ノイズを伴う複数のトラジェクトリクエリに拡張され、アンカーライブラリや教師ポリシーなしで、多種多様な時間的に一貫したモードが得られる。
軽量世界モデルは、各候補軌道に条件付き将来のBEVセマンティクスをロールアウトする。
訓練中、意味的損失は、軌道確率を離散経路重みとして、モードに対する期待として計算されるので、プランナーは、選択された1つの経路ではなく、妥当な将来の完全な分布から学習する。
NAVSIMでは,提案手法はアンカーベース手法と一致し,実時間推論レイテンシの維持と強化学習の回避を図りながら,世界モデルベース手法の最先端性能を実現する。
関連論文リスト
- Autonomous Vehicle Path Planning by Searching With Differentiable Simulation [55.46735086899153]
計画では、エージェントが現実世界で実行する前に、アクションを安全に洗練することができる。
自動運転では、衝突を避け、複雑な密集した交通シナリオをナビゲートすることが不可欠である。
本稿では、微分可能シミュレータWaymaxを次の状態予測と批判の両方として活用するフレームワークである、微分可能探索シミュレーション(DSS)を提案する。
論文 参考訳(メタデータ) (2025-11-14T07:56:34Z) - Bootstrap Off-policy with World Model [59.129118672069644]
ブートストラップループを通じて計画と非政治学習を緊密に統合するフレームワークであるBOOMを提案する。
BOOMは、トレーニングの安定性と最終的なパフォーマンスの両方において、最先端の結果を達成する。
論文 参考訳(メタデータ) (2025-11-01T06:33:04Z) - From Forecasting to Planning: Policy World Model for Collaborative State-Action Prediction [57.56072009935036]
政策世界モデル(PWM)と呼ばれる新しい運転パラダイムを導入する。
PWMは、統一アーキテクチャ内での世界モデリングと軌道計画を統合する。
提案手法は,マルチビューおよびマルチモーダル入力に依存する最先端の手法に適合するか,あるいは超越する。
論文 参考訳(メタデータ) (2025-10-22T14:57:51Z) - Drive As You Like: Strategy-Level Motion Planning Based on A Multi-Head Diffusion Model [7.3078271605135114]
拡散型多頭部軌道プランナ(M拡散プランナ)を提案する。
初期の訓練段階では、すべての出力ヘッドは、高品質な軌道を生成するためにウェイトを共有する。
戦略選択のガイドとして,大規模言語モデル(LLM)を導入し,動的かつ命令対応の計画を可能にする。
論文 参考訳(メタデータ) (2025-08-23T08:33:11Z) - Predictive Planner for Autonomous Driving with Consistency Models [5.966385886363771]
軌道予測と計画は、自動運転車が動的環境下で安全かつ効率的に走行するために不可欠である。
近年の拡散型生成モデルはマルチエージェント軌道生成において有望であるが,その遅いサンプリングは高周波計画タスクには適さない。
我々は,エゴ車両の航法目標に基づいて,エゴと周辺エージェントの共同分布からサンプルを採取する予測プランナを構築するために,一貫性モデルを活用する。
論文 参考訳(メタデータ) (2025-02-12T00:26:01Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - SparseDrive: End-to-End Autonomous Driving via Sparse Scene Representation [11.011219709863875]
我々はSparseDriveという新しいエンドツーエンドの自動運転パラダイムを提案する。
SparseDriveは対称なスパース認識モジュールとパラレルモーションプランナーで構成されている。
動作予測と計画について,これら2つの課題の相似性を概観し,運動プランナの並列設計に繋がる。
論文 参考訳(メタデータ) (2024-05-30T02:13:56Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - Deep Interactive Motion Prediction and Planning: Playing Games with
Motion Prediction Models [162.21629604674388]
本研究は,新しい対話型マルチエージェントニューラルネットワークポリシを予測モデルの一部として使用するゲーム理論モデル予測制御器(MPC)を提案する。
本手法の成功の基礎は,周辺エージェントの状態と地図情報に基づいて車両を操縦できる,新しいマルチエージェントポリシーネットワークの設計である。
論文 参考訳(メタデータ) (2022-04-05T17:58:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。