論文の概要: Prismatic World Model: Learning Compositional Dynamics for Planning in Hybrid Systems
- arxiv url: http://arxiv.org/abs/2512.08411v1
- Date: Tue, 09 Dec 2025 09:40:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.89991
- Title: Prismatic World Model: Learning Compositional Dynamics for Planning in Hybrid Systems
- Title(参考訳): Prismatic World Model:ハイブリッドシステムにおける構成ダイナミクスの学習
- Authors: Mingwei Li, Xiaoyuan Zhang, Chengwei Yang, Zilong Zheng, Yaodong Yang,
- Abstract要約: Prismatic World Model (PRISM-WM) は複雑なハイブリッド力学を構成可能なプリミティブに分解するように設計されている。
PRISM-WMは系力学におけるシャープモード遷移を正確にモデル化することでロールアウトドリフトを著しく低減する。
- 参考スコア(独自算出の注目度): 38.4555621948915
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Model-based planning in robotic domains is fundamentally challenged by the hybrid nature of physical dynamics, where continuous motion is punctuated by discrete events such as contacts and impacts. Conventional latent world models typically employ monolithic neural networks that enforce global continuity, inevitably over-smoothing the distinct dynamic modes (e.g., sticking vs. sliding, flight vs. stance). For a planner, this smoothing results in catastrophic compounding errors during long-horizon lookaheads, rendering the search process unreliable at physical boundaries. To address this, we introduce the Prismatic World Model (PRISM-WM), a structured architecture designed to decompose complex hybrid dynamics into composable primitives. PRISM-WM leverages a context-aware Mixture-of-Experts (MoE) framework where a gating mechanism implicitly identifies the current physical mode, and specialized experts predict the associated transition dynamics. We further introduce a latent orthogonalization objective to ensure expert diversity, effectively preventing mode collapse. By accurately modeling the sharp mode transitions in system dynamics, PRISM-WM significantly reduces rollout drift. Extensive experiments on challenging continuous control benchmarks, including high-dimensional humanoids and diverse multi-task settings, demonstrate that PRISM-WM provides a superior high-fidelity substrate for trajectory optimization algorithms (e.g., TD-MPC), proving its potential as a powerful foundational model for next-generation model-based agents.
- Abstract(参考訳): ロボット領域におけるモデルベースプランニングは、接触や影響といった離散的な出来事によって連続的な動きが句読される物理力学のハイブリッドな性質によって、基本的には困難である。
従来の潜在世界モデルは一般的に、グローバルな連続性を強制するモノリシックニューラルネットワークを使用し、必然的に異なる動的モード(例えば、スライディング対スライディング対フライト対スタンス)を過度にスムースする。
プランナーにとって、この平滑化は、長い水平ルックアヘッド中の破滅的な複合誤差をもたらし、物理境界での探索プロセスの信頼性を損なう。
そこで我々はPRISM-WM(Prismatic World Model)を導入し,複雑なハイブリッド力学を構成可能なプリミティブに分解する構造的アーキテクチャを提案する。
PRISM-WMはコンテキスト対応のMixture-of-Experts(MoE)フレームワークを活用し、ゲーティング機構が現在の物理モードを暗黙的に識別し、専門家が関連する遷移ダイナミクスを予測する。
さらに、専門家の多様性を確保するために、潜伏した直交化目標を導入し、モード崩壊を効果的に防止する。
システム力学におけるシャープモード遷移を正確にモデル化することにより、PRISM-WMはロールアウトドリフトを著しく低減する。
高次元ヒューマノイドや多様なマルチタスク設定を含む挑戦的連続制御ベンチマークに関する広範な実験は、PRISM-WMが軌道最適化アルゴリズム(例えばTD-MPC)の優れた高忠実性基板を提供し、次世代モデルベースエージェントの強力な基盤モデルとしての可能性を示している。
関連論文リスト
- Model-Based Diffusion Sampling for Predictive Control in Offline Decision Making [48.998030470623384]
オフラインの意思決定は、さらなるインタラクションを伴わずに、固定データセットからの信頼性の高い振る舞いを必要とする。
i)タスク整列軌道を多様に生成するプランナー,(ii)システム力学との整合性を強制するダイナミクスモデル,(iii)タスク目標に整合した動作を選択するランサーモジュールからなる構成モデルに基づく拡散フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-09T06:26:02Z) - MODE: Learning compositional representations of complex systems with Mixtures Of Dynamical Experts [5.250743580183822]
MODEはグラフィカルなモデリングフレームワークで、ニューラルネットワークのゲーティング機構は複雑なダイナミクスをスパースで解釈可能なコンポーネントに分解する。
我々は,MODEが細胞生物学における重要なサイクリングおよび分岐過程をシミュレートする,挑戦的な予測タスクにどのように成功したかを示す。
論文 参考訳(メタデータ) (2025-10-10T17:52:31Z) - Multi-modal Spatio-Temporal Transformer for High-resolution Land Subsidence Prediction [3.3295066998131637]
本研究では,動的変位データを静的な物理先行値と融合する新しいフレームワークを提案する。
公開EGMSデータセットでは、MM-STTが新しい最先端技術を確立し、長距離予測RMSEを桁違いに削減する。
論文 参考訳(メタデータ) (2025-09-29T18:49:04Z) - Kuramoto Orientation Diffusion Models [67.0711709825854]
指紋やテクスチャなどのオリエンテーションに富んだ画像は、しばしばコヒーレントな角模様を示す。
生体系における位相同期の役割を動機として,スコアベース生成モデルを提案する。
一般的な画像ベンチマークで競合する結果を実装し,指紋やテクスチャなどの指向性データセットの生成品質を大幅に向上する。
論文 参考訳(メタデータ) (2025-09-18T18:18:49Z) - Towards Efficient General Feature Prediction in Masked Skeleton Modeling [59.46799426434277]
マスクスケルトンモデリングのための新しい汎用特徴予測フレームワーク(GFP)を提案する。
我々の重要な革新は、局所的な動きパターンからグローバルな意味表現にまたがる、従来の低レベルな再構築を高レベルな特徴予測に置き換えることです。
論文 参考訳(メタデータ) (2025-09-03T18:05:02Z) - Simultaneous Multi-Robot Motion Planning with Projected Diffusion Models [57.45019514036948]
MRMP拡散(MRMP Diffusion, SMD)は, 制約付き最適化を拡散サンプリングプロセスに統合し, 衝突のない, キネマティックに実現可能な軌道を生成する新しい手法である。
本稿では, ロボット密度, 障害物の複雑度, 動作制約の異なるシナリオ間の軌道計画アルゴリズムを評価するための総合的MRMPベンチマークを提案する。
論文 参考訳(メタデータ) (2025-02-05T20:51:28Z) - Evolve Smoothly, Fit Consistently: Learning Smooth Latent Dynamics For
Advection-Dominated Systems [14.553972457854517]
複雑な物理系のサロゲートモデルを学ぶための,データ駆動・時空連続フレームワークを提案する。
ネットワークの表現力と特別に設計された整合性誘導正規化を利用して,低次元かつ滑らかな潜在軌道を得る。
論文 参考訳(メタデータ) (2023-01-25T03:06:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。