論文の概要: Kinematics-Aware Latent World Models for Data-Efficient Autonomous Driving
- arxiv url: http://arxiv.org/abs/2603.07264v1
- Date: Sat, 07 Mar 2026 15:47:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.185725
- Title: Kinematics-Aware Latent World Models for Data-Efficient Autonomous Driving
- Title(参考訳): データ効率の良い自律運転のためのキネマティクスを考慮した潜在世界モデル
- Authors: Jiazhuo Li, Linjiang Cao, Qi Liu, Xi Xiong,
- Abstract要約: 車両キネマティック情報は観測エンコーダに組み込まれ、物理的に意味のある運動力学における潜伏遷移を基底とする。
ジオメトリ・アウェアの監督は、RSSM潜時状態を規則化し、ピクセル再構成を超えてタスク関連空間構造をキャプチャする。
- 参考スコア(独自算出の注目度): 8.391716372682316
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data-efficient learning remains a central challenge in autonomous driving due to the high cost and safety risks of large-scale real-world interaction. Although world-model-based reinforcement learning enables policy optimization through latent imagination, existing approaches often lack explicit mechanisms to encode spatial and kinematic structure essential for driving tasks. In this work, we build upon the Recurrent State-Space Model (RSSM) and propose a kinematics-aware latent world model framework for autonomous driving. Vehicle kinematic information is incorporated into the observation encoder to ground latent transitions in physically meaningful motion dynamics, while geometry-aware supervision regularizes the RSSM latent state to capture task-relevant spatial structure beyond pixel reconstruction. The resulting structured latent dynamics improve long-horizon imagination fidelity and stabilize policy optimization. Experiments in a driving simulation benchmark demonstrate consistent gains over both model-free and pixel-based world-model baselines in terms of sample efficiency and driving performance. Ablation studies further verify that the proposed design enhances spatial representation quality within the latent space. These results suggest that integrating kinematic grounding into RSSM-based world models provides a scalable and physically grounded paradigm for autonomous driving policy learning.
- Abstract(参考訳): データ効率の学習は、大規模な現実世界の対話のコストと安全性のリスクのために、自動運転において依然として中心的な課題である。
世界モデルに基づく強化学習は、潜在想像力を通じてポリシーの最適化を可能にするが、既存のアプローチでは、タスクの駆動に不可欠な空間的および運動的構造を符号化する明確なメカニズムが欠如していることが多い。
本研究では、リカレントステートスペースモデル(RSSM)を構築し、自律運転のためのキネマティクス対応潜在世界モデルフレームワークを提案する。
車両キネマティック情報は観測エンコーダに組み込まれ、物理的に意味のある運動力学における潜時遷移を基底とし、幾何学的監視はRSSM潜時状態を正規化し、画素再構成を超えてタスク関連空間構造をキャプチャする。
得られた構造的潜在力学は、長い水平想像力を改善し、ポリシー最適化を安定化させる。
ドライビングシミュレーションベンチマークの実験では、サンプル効率と駆動性能の両面において、モデルフリーとピクセルベースの両方のワールドモデルベースラインに対して一貫した利得を示した。
アブレーション研究により,提案手法が潜在空間における空間表現の質を高めることが確認された。
これらの結果は、キネマティックグラウンドをRSSMベースの世界モデルに統合することで、自律運転政策学習のためのスケーラブルで物理的に基盤付けられたパラダイムが提供されることを示唆している。
関連論文リスト
- InstaDrive: Instance-Aware Driving World Models for Realistic and Consistent Video Generation [53.47253633654885]
InstaDriveは、2つの重要な進歩を通じてビデオリアリズムを促進する新しいフレームワークである。
これらのインスタンス認識機構を組み込むことで、InstaDriveは最先端のビデオ生成品質を実現する。
私たちのプロジェクトページはhttps://shanpoyang654.io/InstaDrive/page.htmlです。
論文 参考訳(メタデータ) (2026-02-03T08:22:13Z) - GeoDrive: 3D Geometry-Informed Driving World Model with Precise Action Control [50.67481583744243]
実世界モデルにロバストな3次元形状条件を明示的に統合したGeoDriveを紹介する。
車両の位置を編集することでレンダリングを強化するため,トレーニング中の動的編集モジュールを提案する。
動作精度と空間認識の両面で既存のモデルよりも優れていた。
論文 参考訳(メタデータ) (2025-05-28T14:46:51Z) - Neural Motion Simulator: Pushing the Limit of World Models in Reinforcement Learning [11.762260966376125]
モーションダイナミクスモデルは、効率的なスキル獲得と効果的なプランニングに不可欠である。
本稿では,脳神経運動シミュレータ (MoSim) を紹介する。
MoSimは物理状態予測において最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-04-09T17:59:32Z) - A Survey of World Models for Autonomous Driving [55.520179689933904]
自律運転の最近の進歩は、堅牢な世界モデリングの進歩によって推進されている。
世界モデルは、マルチセンサーデータ、セマンティックキュー、時間ダイナミクスを統合する駆動環境の高忠実度表現を提供する。
今後の研究は、自己指導型表現学習、マルチモーダル融合、高度なシミュレーションにおける重要な課題に対処する必要がある。
論文 参考訳(メタデータ) (2025-01-20T04:00:02Z) - Physical Informed Driving World Model [47.04423342994622]
DrivePhysicaは、本質的な物理原理に準拠したリアルなドライビングビデオを生成するために設計された革新的なモデルだ。
我々は,Nuscenesデータセット上での3.96 FIDと38.06 FVDの駆動ビデオ生成品質と下流認識タスクにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-12-11T14:29:35Z) - Generative AI-empowered Simulation for Autonomous Driving in Vehicular
Mixed Reality Metaverses [130.15554653948897]
車両混合現実(MR)メタバースでは、物理的実体と仮想実体の間の距離を克服することができる。
現実的なデータ収集と物理世界からの融合による大規模交通・運転シミュレーションは困難かつコストがかかる。
生成AIを利用して、無制限の条件付きトラフィックを合成し、シミュレーションでデータを駆動する自律運転アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-16T16:54:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。