論文の概要: DDP-WM: Disentangled Dynamics Prediction for Efficient World Models
- arxiv url: http://arxiv.org/abs/2602.01780v2
- Date: Tue, 03 Feb 2026 02:48:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 16:18:58.863127
- Title: DDP-WM: Disentangled Dynamics Prediction for Efficient World Models
- Title(参考訳): DDP-WM:効率的な世界モデルのための遠絡ダイナミクス予測
- Authors: Shicheng Yin, Kaixuan Yin, Weixing Chen, Yang Liu, Guanbin Li, Liang Lin,
- Abstract要約: 本稿では,DDP-WMについて紹介する。DDP-WMはDDP-WM(Distangled Dynamics Prediction)の原理に基づく新しい世界モデルである。
DDP-WMは、効率的な履歴処理と動的ローカライゼーションを統合したアーキテクチャにより、この分解を実現する。
実験により、DDP-WMは様々なタスクにおいて、大幅な効率と性能を達成することが示された。
- 参考スコア(独自算出の注目度): 79.53092337527382
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: World models are essential for autonomous robotic planning. However, the substantial computational overhead of existing dense Transformerbased models significantly hinders real-time deployment. To address this efficiency-performance bottleneck, we introduce DDP-WM, a novel world model centered on the principle of Disentangled Dynamics Prediction (DDP). We hypothesize that latent state evolution in observed scenes is heterogeneous and can be decomposed into sparse primary dynamics driven by physical interactions and secondary context-driven background updates. DDP-WM realizes this decomposition through an architecture that integrates efficient historical processing with dynamic localization to isolate primary dynamics. By employing a crossattention mechanism for background updates, the framework optimizes resource allocation and provides a smooth optimization landscape for planners. Extensive experiments demonstrate that DDP-WM achieves significant efficiency and performance across diverse tasks, including navigation, precise tabletop manipulation, and complex deformable or multi-body interactions. Specifically, on the challenging Push-T task, DDP-WM achieves an approximately 9 times inference speedup and improves the MPC success rate from 90% to98% compared to state-of-the-art dense models. The results establish a promising path for developing efficient, high-fidelity world models. Codes will be available at https://github.com/HCPLab-SYSU/DDP-WM.
- Abstract(参考訳): 世界モデルは自律的なロボット計画に不可欠である。
しかし、既存の高密度トランスフォーマーモデルによる計算オーバーヘッドは、リアルタイムのデプロイメントを著しく妨げている。
この効率・性能のボトルネックに対処するために,DDP-WM(Disentangled Dynamics Prediction, DDP)の原理に基づく新しい世界モデルを提案する。
観測シーンにおける潜伏状態の進化は不均一であり、物理的相互作用と二次文脈駆動の背景更新によって引き起こされるスパース一次力学に分解できるという仮説を立てる。
DDP-WMは、効率的な履歴処理と動的ローカライゼーションを統合して一次力学を分離するアーキテクチャにより、この分解を実現する。
バックグラウンド更新にクロスアテンションメカニズムを利用することで、このフレームワークはリソース割り当てを最適化し、プランナーにスムーズな最適化環境を提供する。
広範囲にわたる実験により、DDP-WMはナビゲーション、正確なテーブルトップ操作、複雑な変形可能または多体相互作用を含む様々なタスクにおいて、大幅な効率と性能を達成することが示された。
具体的には、Push-Tタスクにおいて、DDP-WMは約9倍の推論速度を達成し、最先端の高密度モデルと比較して、MPCの成功率を90%から98%改善する。
結果は、効率的で高忠実な世界モデルを開発するための有望な道を確立する。
コードはhttps://github.com/HCPLab-SYSU/DDP-WM.comで入手できる。
関連論文リスト
- Prismatic World Model: Learning Compositional Dynamics for Planning in Hybrid Systems [38.4555621948915]
Prismatic World Model (PRISM-WM) は複雑なハイブリッド力学を構成可能なプリミティブに分解するように設計されている。
PRISM-WMは系力学におけるシャープモード遷移を正確にモデル化することでロールアウトドリフトを著しく低減する。
論文 参考訳(メタデータ) (2025-12-09T09:40:34Z) - Model-Based Diffusion Sampling for Predictive Control in Offline Decision Making [48.998030470623384]
オフラインの意思決定は、さらなるインタラクションを伴わずに、固定データセットからの信頼性の高い振る舞いを必要とする。
i)タスク整列軌道を多様に生成するプランナー,(ii)システム力学との整合性を強制するダイナミクスモデル,(iii)タスク目標に整合した動作を選択するランサーモジュールからなる構成モデルに基づく拡散フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-09T06:26:02Z) - DyMoDreamer: World Modeling with Dynamic Modulation [52.27044216359359]
深層強化学習(DRL)における重要なボトルネックはサンプル非効率である。
動的変調機構を組み込んだ新しいアルゴリズムDyMoDreamerを導入し,動的特徴抽出の改善と時間情報の充実を図る。
実験によると、DyMoDreamer は Atari 100$k ベンチマークに新しい最先端のスコアをセットし、平均156.6$% の人間正規化スコアを設定できる。
論文 参考訳(メタデータ) (2025-09-29T13:54:42Z) - LaDi-WM: A Latent Diffusion-based World Model for Predictive Manipulation [45.02469804709771]
拡散モデルを用いて将来の状態の潜伏空間を予測する世界モデルLaDi-WMを提案する。
LIBERO-LONGベンチマークでは,LaDi-WMが27.9%,現実シナリオでは20%,政策性能が著しく向上することを示した。
論文 参考訳(メタデータ) (2025-05-13T04:42:14Z) - Optimization of geological carbon storage operations with multimodal latent dynamic model and deep reinforcement learning [1.8549313085249324]
本稿では,高速フロー予測とGCSの制御最適化のためのディープラーニングフレームワークであるMLDモデルを紹介する。
既存のモデルとは異なり、MDDは多様な入力モダリティをサポートし、包括的なデータインタラクションを可能にする。
この手法は従来の手法よりも優れており、計算資源を60%以上削減し、最も高いNPVを達成する。
論文 参考訳(メタデータ) (2024-06-07T01:30:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。