論文の概要: From Forecasting to Planning: Policy World Model for Collaborative State-Action Prediction
- arxiv url: http://arxiv.org/abs/2510.19654v1
- Date: Wed, 22 Oct 2025 14:57:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.938032
- Title: From Forecasting to Planning: Policy World Model for Collaborative State-Action Prediction
- Title(参考訳): 予測から計画へ:協調行動予測のための政策世界モデル
- Authors: Zhida Zhao, Talas Fu, Yifan Wang, Lijun Wang, Huchuan Lu,
- Abstract要約: 政策世界モデル(PWM)と呼ばれる新しい運転パラダイムを導入する。
PWMは、統一アーキテクチャ内での世界モデリングと軌道計画を統合する。
提案手法は,マルチビューおよびマルチモーダル入力に依存する最先端の手法に適合するか,あるいは超越する。
- 参考スコア(独自算出の注目度): 57.56072009935036
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite remarkable progress in driving world models, their potential for autonomous systems remains largely untapped: the world models are mostly learned for world simulation and decoupled from trajectory planning. While recent efforts aim to unify world modeling and planning in a single framework, the synergistic facilitation mechanism of world modeling for planning still requires further exploration. In this work, we introduce a new driving paradigm named Policy World Model (PWM), which not only integrates world modeling and trajectory planning within a unified architecture, but is also able to benefit planning using the learned world knowledge through the proposed action-free future state forecasting scheme. Through collaborative state-action prediction, PWM can mimic the human-like anticipatory perception, yielding more reliable planning performance. To facilitate the efficiency of video forecasting, we further introduce a dynamically enhanced parallel token generation mechanism, equipped with a context-guided tokenizer and an adaptive dynamic focal loss. Despite utilizing only front camera input, our method matches or exceeds state-of-the-art approaches that rely on multi-view and multi-modal inputs. Code and model weights will be released at https://github.com/6550Zhao/Policy-World-Model.
- Abstract(参考訳): 世界モデルは世界シミュレーションのために学習され、軌道計画から切り離されている。
近年、一つの枠組みで世界モデリングと計画を統合する試みが試みられているが、計画のための世界モデリングの相乗的ファシリテーションメカニズムはいまだにさらなる探究を必要としている。
本研究では,PWMと呼ばれる新しい運転パラダイムを導入する。このパラダイムは,統合されたアーキテクチャ内での世界モデリングと軌道計画を統合するだけでなく,提案したアクションフリーな将来の状態予測スキームを通じて,学習した世界知識を用いた計画の恩恵を受けることができる。
協調的な状態-行動予測により、PWMは人間のような予測知覚を模倣し、より信頼性の高い計画性能が得られる。
さらに,映像予測の効率化を図るため,動的に拡張された並列トークン生成機構を導入する。
前面カメラの入力のみを活用するにもかかわらず,本手法はマルチビューおよびマルチモーダル入力に依存する最先端のアプローチと一致するか,あるいは超過する。
コードとモデルの重み付けはhttps://github.com/6550Zhao/Policy-World-Model.comで公開される。
関連論文リスト
- WorldPrediction: A Benchmark for High-level World Modeling and Long-horizon Procedural Planning [52.36434784963598]
我々は、異なるAIモデルのワールドモデリングと手続き計画能力を評価するためのビデオベースのベンチマークであるWorldPredictionを紹介する。
現在のフロンティアモデルでは,WorldPrediction-WMでは57%,WorldPrediction-PPでは38%の精度しか達成できないが,人間は両タスクを完璧に解くことができる。
論文 参考訳(メタデータ) (2025-06-04T18:22:40Z) - A Survey of World Models for Autonomous Driving [55.520179689933904]
自律運転の最近の進歩は、堅牢な世界モデリングの進歩によって推進されている。
世界モデルは、マルチセンサーデータ、セマンティックキュー、時間ダイナミクスを統合する駆動環境の高忠実度表現を提供する。
今後の研究は、自己指導型表現学習、マルチモーダル融合、高度なシミュレーションにおける重要な課題に対処する必要がある。
論文 参考訳(メタデータ) (2025-01-20T04:00:02Z) - DrivingGPT: Unifying Driving World Modeling and Planning with Multi-modal Autoregressive Transformers [61.92571851411509]
我々は、インターリーブ画像とアクショントークンに基づくマルチモーダル駆動言語を導入し、共同世界モデリングと計画を学ぶためのDrivingGPTを開発した。
我々のDrivingGPTは、アクション条件付きビデオ生成とエンドツーエンドプランニングの両方において強力なパフォーマンスを示し、大規模なnuPlanとNAVSIMベンチマークにおいて強力なベースラインを達成しています。
論文 参考訳(メタデータ) (2024-12-24T18:59:37Z) - World Models via Policy-Guided Trajectory Diffusion [21.89154719069519]
既存の世界モデルは、次の状態を予測するために、ポリシーから次のアクションをサンプリングする、自己回帰的である。
本稿では, 自己回帰的でない新しい世界モデリング手法を提案する。
論文 参考訳(メタデータ) (2023-12-13T21:46:09Z) - Evolutionary Planning in Latent Space [7.863826008567604]
プランニングは、いくつかの望ましい特性を持つ強化学習の強力なアプローチである。
我々は、ラテントスペースにおける進化的計画を可能にする世界モデルを学ぶ。
ランダムなポリシーからのロールアウトでブートストラップし、より正確な計画ポリシーからのロールアウトで反復的に修正することで、世界のモデルを構築する方法を示します。
論文 参考訳(メタデータ) (2020-11-23T09:21:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。